본문 바로가기

MT-Bench1

[한국어 LLM 벤치마크] Korean MT-bench score 계산하기 (2) [이전글] : [한국어 LLM 벤치마크] Korean MT-bench score 계산하기 (1) [한국어 LLM 벤치마크] Korean MT-bench score 계산하기 (1) 한국어 LLM 리더보드인 호랑이에 대해 리뷰를 진행해보고, 외부 오픈소스 모델 및 내부 사내 자체 개발 모델에 대해 평가를 진행해보기로 결정! 호랑이 한국어 LLM 리더보드에 대한 소개는 아래 didi-universe.tistory.com 이전 글에 이어서 직접 코드를 수정하고 평가해본 결과를 살펴보자. 전체 코드는 아래 깃헙 레포에 정리해 두었다. https://github.com/ai-yeongji/ko_llm_eval/tree/main?tab=readme-ov-file GitHub - ai-yeongji/ko_llm_eva.. 2024. 4. 15.

이전 1 다음

티스토리툴바