업스테이지·NIA 구축 한국어 거대언어모델 리더보드, 개시 2주 만에 등록 모델 100개 돌파
개인부터 기업까지 다양한 한국어 특화 모델 각축..한국어 오픈소스 LLM 구심점 역할 전망

업스테이지는 지난달 27일 개설한 한국어 거대언어모델(LLM) 리더보드 ‘Open Ko-LLM 리더보드’가 공개 2주 만에 등록 모델 100개를 돌파하는 성과를 거뒀다고 밝혔다. (사진=업스테이지)/그린포스트코리아
업스테이지는 지난달 27일 개설한 한국어 거대언어모델(LLM) 리더보드 ‘Open Ko-LLM 리더보드’가 공개 2주 만에 등록 모델 100개를 돌파하는 성과를 거뒀다고 밝혔다. (사진=업스테이지)/그린포스트코리아

업스테이지와 한국지능정보사회진흥원(이하 NIA)이 구축한 한국어 거대언어모델(LLM) 평가 리더보드에 등록된 모델이 2주 만에 100개를 넘어선 것으로 나타났다.

업스테이지는 지난달 27일 개설한 한국어 LLM 평가 리더보드 'Open Ko-LLM 리더보드'가 공개 2주 만에 등록 모델 100개를 돌파하는 성과를 거뒀다고 12일 밝혔다.

업스테이지가 NIA와 함께 구축한 Open Ko-LLM 리더보드는 누구나 자신이 개발한 한국어 LLM을 등록하고 다른 모델과 경쟁할 수 있는 공개 플랫폼이다. 특히 한국어의 특성과 문화를 반영한 고품질의 데이터를 자체 구축해 한국어 특화 리더보드로서의 강점을 갖는다. 

Open Ko-LLM 리더보드는 개시 2주 만에 100여 개의 모델이 등록, 추석 연휴에도 불구하고 가파른 확장세를 보였다. 개인 연구자부터 SK텔레콤, 마음AI, 포티투마루(42Maru), 한국전자통신연구원(ETRI), 고려대학교 등 다양한 기업과 학계 조직들이 각축을 벌여 일 단위로 순위 등락을 보였다.

특히 Open Ko-LLM 리더보드에는 'Ko-Alpaca', 고려대학교 '구름(KULLM)', 'Polyglot-Ko' 등 기존에 유명한 한국어 오픈소스 모델들이 총집결하는 양상으로, 업계 내에서 한국어 특화 LLM 성능 평가의 바로미터로 자리잡고 있다는 평가다. 실제 허깅페이스의 아태지역 총괄이 직접 사회관계망 서비스(SNS)에 업스테이지 리더보드를 언급하는 등 글로벌에서도 관심을 받은 바 있다.

업스테이지는 향후 월별 리더보드 순위를 결산해 상위권 모델을 조명하는 한편, 해당 모델을 개발한 연구자들을 초빙해 오픈 세미나를 개최하는 등 국내 LLM 생태계 활성화를 위한 다양한 활동들을 전개할 계획이다. 리더보드 참여에 관심 있는 연구자들은 허깅페이스의 Open Ko-LLM 리더보드 스페이스에서 자세한 정보를 확인하고 참여할 수 있다. 

또 업스테이지는 Open Ko-LLM 리더보드 운영을 통해 한국의 인공지능(AI) 경쟁력 강화를 위한 청사진을 제시한다는 구상이다. 영어 위주의 기존 평가체제에 더해 한국어 데이터를 기반으로 한 리더보드를 운영함으로써 한국어 LLM 생태계 확장을 위한 밑거름을 다진다는 방침이다. 

이에 따라 다양한 연구자들이 서로의 모델을 자유롭게 공유하고, 공동연구와 교류를 통해 기술을 더욱 고도화함으로써 국내 오픈소스 LLM 진영의 구심점 역할을 할 것으로 기대를 모으고 있다고 회사는 설명했다.

김성훈 업스테이지 대표는 "Open Ko-LLM 리더보드가 2주 만에 100개 모델 돌파라는 뜻깊은 이정표를 세우며 순항하게 되어 기쁘다"며 "앞으로 업스테이지는 한국어 특화 LLM 성능의 기준점을 제시함으로써 국내 AI 생태계의 성장 및 글로벌 경쟁력 강화에 힘쓸 것"이라고 밝혔다.

hkp@greenpost.kr

저작권자 © 그린포스트코리아 무단전재 및 재배포 금지