"AI 모델에 연구원이 보유한 여러 논문, 연구보고서, 과학기술정보를 추가로 학습했다. 스스로 연구하는 에이전트를 개발해서 과학기술의 난제를 해결하고 과학기술 주도권을 확보해 과학적 발견을 도모하는 데까지 나아가려고 한다."
메타 인공지능(AI) 모델 '라마'를 기반으로 한 AI 혁신이 가속화하고 있다. 10일 메타에 따르면 라마 모델은 그간 총 4억회 이상 다운로드됐다. 지난해보다 10배 증가한 수준이다. 라마에서 파생된 신규 AI 모델은 6만5000개가 넘는다. 메타가 진출하지 않은 교육, 헬스케어 분야에서도 라마가 활용되고 있다. KISTI, '라마' 활용해 과학기술 특화 LLM 구축한국과학기술정보연구원(KISTI)은 라마를 활용해 과학기술정보 특화 거대언어모델(LLM) '고니(KONI)'를 구축했다. LLM을 자체 개발하려면 막대한 비용과 자원이 필요한 데다 상용 LLM의 API를 활용할 경우 내부 데이터가 외부 기업으로 흘러들어갈 수 있다. 이에 과학기술정보를 학습시켰을 때 성능이 뛰어나고 안전성을 갖춘 라마를 선택했다는 것.
KISTI는 국내 논문과 연구보고서 등을 고니로 쉽게 검색하고 요약된 결과물을 받아볼 수 있는 '사이언스온'을 개발했다. 이 웹사이트는 이달 중 여러 과학 문헌을 분석하고 질의할 수 있는 시스템을 적용해 선보일 예정이다. 내년 1월을 기점으로 6년간 AI가 스스로 과학기술 난제를 해결하고 과학적 발견을 도모하는 에이전트 모델 개발도 추진한다. 여기에도 라마가 활용된다.
라마 활용 분야는 끊임없이 확장되고 있다. 메타는 최근 라마 3.2 모델을 배포했다. AI 성능을 꾸준히 끌어올리고 있는 것이다.
장광선 KISTI 선임연구원은 10일 서울 강남구 메타코리아 사무실에서 진행된 AI 미디어 브리핑 행사를 통해 "라마가 질의응답을 잘 못하는 부분이 있었는데 라마 3.2가 나오면서 그 부분이 해결됐다"고 말했다. 유상윤 에임인텔리전스 최고경영자(CEO)도 같은 자리에서 "안전성 측면에서 테스트를 했는데 (다른 모델보다) 뛰어나다"고 평가했다.
마노하 팔루리 메타 생성형 AI 부사장은 "메타의 장기적 목표는 범용 인공지능(AGI)을 구축하고 이를 책임감 있게 오픈소스로 공개해 모든 사람이 AI의 혜택을 누릴 수 있도록 하는 것"이라며 "AI 기술은 단순히 기업의 성장을 넘어 사회와 경제에 큰 가치를 제공할 수 있다"고 했다. 한국어 성능·문화적 맥락 이해력 제고 노력 지속한국어 성능과 문화적 맥락에 대한 이해력을 높일 수 있도록 계속해서 노력하겠다는 방침도 밝혔다.
팔루리 부사장은 "라마의 한국어 실력이 개선되고 있는데 메타가 다국어 모델을 지향하기 때문"이라며 "언어에 관련된 부분과 문화적 부분의 이해도를 높이도록 노력하겠다"고 말했다.
생성형 AI의 대표적 문제로 지목되는 할루시네이션(환각) 현상에 관해선 검색증강생성(RAG)을 활용해 대처하고 있다는 설명이다.
'범용 인공지능' 목표로 총력…일상 서비스도 집중메타는 차세대 라마 개발에 박차를 가하고 있다. 팔루리 부사장은 "라마의 AGI 달성 목표라 한다면 모든 기업들, 크리에이터들, 유저들이 훨씬 더 매끄럽게 연결하고 소통하고 효율성을 증대하고 이전에 없던 사례를 가능하게 한다는 것"이라며 "메타 모든 사용자들, 40억명의 사용자들과 전 세계 모든 개발자들을 지원한다면 아마 AGI에서 큰 성과를 이룬 것이 아닌가 생각한다"고 했다.
그러면서 "이 모든 것은 이제 시작일 뿐"이라며 "메타 AI는 저희 모든 앱과 웹 전체를 포괄하는 어시스턴트라고 생각하면 된다"며 "이 모든 앱에서 매일매일 40억명의 사람들을 지원하는 엔진이 라마이고 라마가 개선되면 라마를 기반으로 제공되는 AI 경험도 계속 개선될 수 있다"고 강조했다.
메타 FAIR 연구팀이 개방적이고 책임감 있는 연구의 길잡이 역할을 맡아 왔다는 점도 강조했다. 니킬라 라비 메타 FAIR 연구팀 리서치 엔지니어링 매니저는 연구팀이 현재까지 1000개 이상의 오픈소스 라이브러리, 모델·데이터세트 등을 공개 배포했다고 밝혔다.
또 연구팀이 실생활 속 문제해결을 지원할 수 있는 기술 개발에 집중해 왔다면서 대표적인 기술로 SAM2(Segment Anything 2) 모델을 공유했다. SAM2는 이미지와 영상 속에서 실시간으로 물체를 인식하는 모델이다. 기존에 이미지만 인식했던 SAM을 개선한 것이다. 기존 모델보다 3배 더 적은 시간으로 더 높은 인식률을 보인다.
'제로샷 일반화' 기능을 갖춰 생소한 물체도 쉽게 인식할 수 있다. 이를 통해 정밀한 물체 인식이 필수적인 해양 과학, 의료 분야에 혁신적으로 활용될 수 있는 셈이다. "책임감 있는 AI, 오픈소스 방식으로 혜택 확대"후안 피노 메타 FAIR 연구팀 연구원은 심리스 M4T, 오디오박스를 소개했다. 심리스 M4T는 음성과 텍스트를 넘나들면서 즉각적인 번역을 제공해 언어의 제약 없이 소통하도록 지원한다. 최대 100개 언어에 대한 음성-텍스트, 음성-음성, 텍스트-음성, 텍스트-텍스트 번역을 수행할 수 있다.
오디오박스는 오디오 생성 모델로 음성·텍스트 명령을 통해 특정 용도에 맞춤화된 음량 효과나 자연스러운 목소리를 제작하는 기능을 갖췄다.
팔루리 부사장은 "메타는 오픈 소스 분야에서 오랜 역사를 보유하고 있는 것은 물론 계속해서 개방형 생태계를 넓혀가기 위해 다양한 이해관계자들과 협업하고 있다"며 "앞으로도 메타는 책임감 있는 AI 연구와 오픈소스 접근 방식을 통해 전 세계 모두가 최첨단 기술의 혜택을 누릴 수 있도록 적극 노력하겠다"고 했다.
김대영 한경닷컴 기자 kdy@hankyung.com