한국전자통신연구원(ETRI)이 28일 한국어 기반 소규모언어모델(SLM) ‘이글’을 개발해 공개했다고 발표했다.
생성형 인공지능(AI) 가운데 하나인 언어모델은 텍스트 데이터를 학습시켜 질의응답, 검색, 요약, 창작 등 다양한 작업을 할 수 있다. 수천억 개 파라미터를 학습시킨 대규모언어모델(LLM)과 수억~수십억 개 파라미터를 갖춘 SLM으로 구분된다. SLM은 LLM보다 성능이 떨어지는 대신 연산 속도가 빠르고 비용이 저렴하다.
ETRI가 만든 이글은 파라미터 규모가 30억 개다. 해외 기업이 만든 SLM보다 한국어 데이터 비중이 높아 국내 이용자에게 적합하다는 설명이다. 미세조정을 적용하지 않은 기초 모델을 공개해 다양한 용도로 활용할 수 있다.
ETRI는 내년에 파라미터 70억 개 수준의 모델도 공개할 예정이다.
초등학교 수학 교육을 지원하는 AI 교사 서비스도 개발 중이다.
이승우 기자 leeswoo@hankyung.com