LG, AI '엑사원 3.0' 오픈소스로 공개…"AI 생태계 발전 기여"

입력 2024-08-07 10:00
LG, AI '엑사원 3.0' 오픈소스로 공개…"AI 생태계 발전 기여"

LG AI연구원, 기술보고서 공개…성능 56%↑·비용 72%↓

하반기부터 엑사원 3.0 들어간 LG 제품·서비스 출시 예정

(서울=연합뉴스) 장하나 기자 = LG AI연구원이 7일 최신 인공지능(AI) 모델 '엑사원(EXAONE) 3.0'을 선보이고, 이를 기반으로 만든 생성형 AI 서비스인 '챗엑사원'(ChatEXONE) 베타 서비스를 시작했다.

엑사원 3.0은 이전 모델보다 성능은 56% 높이고 비용은 72% 절감한 것으로, LG AI연구원은 이중 경량 모델을 연구 목적으로 누구나 활용할 수 있도록 오픈소스로 공개했다.



LG AI연구원은 이날 엑사원 3.0의 모델 학습 방법, 성능 평가 결과 등을 담은 기술 보고서를 발표하고, 경량화 모델인 7.8B 언어모델을 오픈소스로 공개했다.

배경훈 LG AI연구원장은 "국내에서는 처음으로 자체 개발한 AI 모델을 오픈소스로 공개해 학계, 연구기관, 스타트업 등이 최신 생성형 AI 기술을 활용할 수 있게 함으로써 개방형 AI 연구 생태계 활성화와 더 나아가 국가 AI 경쟁력을 높이는 데 기여하고자 한다"고 밝혔다.

배 원장은 이어 "엑사원을 오픈 모델로 전환하는 것에 대해 기술적·사업적 이점을 포기하는 것이 아니냐는 우려도 있었지만, AI 기술이 빠르게 발전하는 상황에서 지금의 모델을 공개하는 것이 AI 생태계에 긍정적인 영향을 줄 수 있다고 판단했다"고 설명했다.

LG AI연구원은 2021년 12월 거대언어모델(LLM) 엑사원 1.0을 발표한 이후 2023년 7월 엑사원 2.0을 공개하는 등 3년간 생성형 AI를 실제 산업 현장에 적용하기 위한 연구개발에 집중해왔다.



이번에 선보이는 엑사원 3.0은 이전 모델인 엑사원 2.0 대비 추론 처리 시간은 56%, 메모리 사용량은 35% 줄이고 구동 비용은 72% 절감하는 등 성능과 경제성 모두 뛰어난 결과를 보였다. 엑사원 1.0 비용 대비 6% 수준이다.

LG AI연구원은 AI로 촉발된 소비 전력 문제를 해결하기 위해 경량화·최적화 기술 연구에 집중해 초기 거대 모델 대비 성능은 높이면서도 모델 크기는 100분의 3으로 줄이는 데 성공했다.

기술보고서에는 MT-벤치(Bench)를 비롯해 AI 모델의 대화 성능 등 실제 사용성을 종합적으로 평가하는 대표적인 벤치마크(성능 평가지표)와 함께 평가에 활용한 25개 벤치마크의 개별 점수와 영역별 평균 점수를 모두 공개해 보고서의 신뢰성을 높였다.

엑사원 3.0은 실제 사용성을 비롯해 코딩과 수학 영역 등 13개 벤치마크 점수 순위에서 1위를 차지해 메타의 라마(Llama) 3.1, 구글의 젬마(Gemma) 2 등 동일 크기의 글로벌 오픈소스 AI 모델과의 비교에서도 글로벌 경쟁력을 입증했다. 한국어 성능도 세계 최고를 기록했다.

엑사원 3.0은 특허와 소프트웨어 코드, 수학, 화학 등 국내외 전문 분야 데이터 6천만건 이상을 학습했다. 연말까지 법률, 바이오, 의료, 교육, 외국어 등 분야를 확장해 학습 데이터양을 1억건 이상으로 늘려 성능을 더 끌어올릴 계획이다.

LG AI연구원은 AI 모델에 의도적으로 공격을 시도해 기술과 서비스 취약점을 검증하는 레드티밍(Red-teaming)을 수행하는 등 엑사원 3.0의 안전성과 신뢰성을 높이기 위한 작업도 진행했다.



하반기부터는 엑사원 3.0이 들어간 LG 제품과 서비스를 출시할 예정이다.

LG 계열사들은 각 사가 보유한 데이터로 엑사원 3.0을 최적화하고, 사업과 제품, 서비스 특성에 맞게 이를 적용할 계획이다.

이를 위해 LG AI연구원은 온디바이스 AI에 들어갈 초경량 모델부터 범용 목적의 경량 모델, 특화 분야에 활용할 수 있는 고성능 모델까지 활용 용도에 따라 모델 크기를 다르게 설계했다.

글로벌 파트너십 논의도 활발하게 진행 중이다.

배경훈 원장은 "실제 산업 현장에서 활용할 수 있는 AI를 만드는 것이 중요한 만큼 특화된 성능과 경제성을 갖춘 엑사원으로 LG 계열사와 외부 기업·기관과의 파트너십을 강화해 나갈 계획"이라고 말했다.

<YNAPHOTO path='AKR20240807042000003_06_i.gif' id='AKR20240807042000003_0601' title='챗엑사원' caption='[LG AI연구원 제공. 재판매 및 DB 금지]'/>

LG는 이날부터 임직원을 대상으로 챗엑사원 베타 서비스를 시작한다. 정식 서비스와 모바일 앱은 계열사별 준비 상황에 맞춰 순차적으로 제공할 예정이다.

챗엑사원은 실시간 웹 검색 결과를 활용하는 '검색증강생성'(RAG) 기술을 적용해 지시문의 맥락을 파악한 뒤 최신 정보를 반영한 답변을 하는 것을 비롯해 문서·이미지 기반 질의응답, 코딩, 데이터베이스 관리 등 다양한 기능을 제공한다.

소프트웨어 개발자와 데이터 분석 전문가를 위한 기능도 제공한다.

LG AI연구원은 챗엑사원이 자연어 입력만으로 파이썬, 자바, C++ 등 22개 프로그래밍 언어와 데이터베이스 관리에 활용할 수 있는 SQL(구조화된 질의 언어) 쿼리까지 생성할 수 있어 임직원의 업무 효율성을 높일 수 있을 것으로 기대하고 있다.

구광모 LG그룹 회장은 미래 사업으로 AI를 점찍고 과감한 투자와 혁신을 강조하고 있다. LG는 2020년 12월 그룹 AI 연구의 싱크탱크인 LG AI연구원을 설립한 후 지난 4년간 AI 전환 가속화를 추진하며 생산 공정, 소재·제품 개발, 고객 서비스 개선 등 각 계열사 사업 현장에 AI 기술 적용 사례를 늘려가고 있다.

hanajjang@yna.co.kr

(끝)

<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>