본문 바로가기
반응형

AI/NLP18

[LLM] 거대언어모델, LLM(Large Language Model) 이란? 거대언어모델, LLM 이란? 거대언어모델 (Large Language Model, LLM) 이란 쉽게 말해 대용량 언어 모델을 말한다. 대규모 데이터셋으로 학습되었으며 대규모 파라미터를 가진 언어 모델 기존의 PLM들을 대규모로 확장하면 성능이 늘어난다는 것을 확인하며, 구글과 페이스북 같은 IT 공룡들의 LLM 경쟁이 심화되었음. ‘거대’의 기준이 정해진 것은 아니나, 일부 전문가들은 GPT-3가 학습한 파라미터 개수인 1,750억 개를 들고 있음 GPT(Generative Pre-trained Transformer)와 BERT(Bidirectional Encoder Representations from Transformers)와 같은 다양한 모델이 있으며, 최근 가장 주목받는 대표적인 LLM으로 Ch.. 2023. 10. 6.
[ChatGPT] 영어 논문 빠르게 읽는 팁!! ChatPDF를 이용해 PDF 파일 요약 및 질문하기 현재 ChatGPT에서는 PDF 파일을 바로 업로드해서 질문을 할 수 없는데요, PDF에 있는 내용을 요약하거나, 질문하고 싶은 내용이 있을 때 사용하면 유용한 사이트가 있습니다. 저는 주로 영어 논문을 많이 보는데, 논문을 빠르게 요약해서 읽고 싶거나 논문에서 원하는 내용을 찾고 싶을때 ChatPDF 혹은 DeepL 번역기 앱을 이용하고 있습니다. ChatPDF 웹사이트를 이용하면 아주 간단하게 PDF 문서에 대해 ChatGPT 기능을 사용할 수 있습니다. https://www.chatpdf.com/ ChatPDF - Chat with any PDF! ChatPDF is the fast and easy way to chat with any PDF, free and without sign-in. Talk.. 2023. 9. 27.
[LLM] LLM 텍스트 요약 평가 관련 + 논문 리뷰 최근 LLM 모델을 활용한 요약이 BART나 T5 등 기존의 생성 요약 모델을 파인튜닝한 것보다, 심지어 사람이 요약한 것보다 더 좋다는 연구 결과가 나왔습니다. 그런데 이런 요약 모델의 성능 평가는 어떻게 해야 할까요? 기존에 텍스트 요약 과제에서, 모델 셀렉션이나 성능 평가 부분이 가장 어려웠는데요. 사실 요약이 잘되었다고 판단하는 부분이 지극히 주관적인 영역이라, 인간이 요약한 문장도 어떤 문장이 요약을 잘 한 것인지를 판단하기가 어렵기 때문입니다. 정통적으로 NLP나 summarization 부분에서 사용하는 ROUGE 같은 정량적인 스코어도 있지만 별 의미가 없어서... 결국 휴먼 피드백이나 보팅으로 해결하곤 했습니다. AI 모델이 요약한 문장은 어떻게 평가할 수 있을지, 평가방법에 대한 연구가.. 2023. 9. 26.
[검색] sentence embedding - KoSimCSE / SimCSE 논문리뷰 sentence embedding 기반의 semantic search 에 대해 찾아보다가, SBERT와 SimCSE로 semantic search를 많이 한기에 이 둘을 써보려고 한다. SimCSE 논문에서 SimCSE에 의해 검색된 문장들이 SBERT와 비교해 더 높은 퀄리티를 가진다는 내용을 보고 한국어 버전을 찾아보았다. KoSimCSE : Simple Contrastive Learning of Korean Sentence Embeddings Implementation SimCSE를 한국어 문장으로 파인튜닝 시킨 모델. SKT KoBART 모델에 카카오브레인의 KorNLU 데이터셋으로 Suvervised만 학습시켰다고 함. - github 링크: https://github.com/BM-K/KoSim.. 2023. 9. 25.
반응형