[위클리 스마트] 오픈소스 AI, 반격은 시작됐다

입력 2023-09-30 10:00
[위클리 스마트] 오픈소스 AI, 반격은 시작됐다



(서울=연합뉴스) 오규진 기자 = 페이스북 모회사 메타플랫폼(메타)이 거대언어모델(LLM) '라마-2'를 무상으로 공개하면서 생성 인공지능(AI) 시장 판도가 흔들리고 있다.

구글, 오픈AI 등 시장 선도기업들이 생태계를 구축하며 각자도생에 나선 가운데, 오픈소스 진영에서도 유사한 성능의 거대언어모델(LLM)을 내놓으면서 인공지능 주도권 경쟁이 불붙는 양상이다.

30일 정보기술(IT) 업계에 따르면 오픈소스 머신러닝 커뮤니티 '허깅페이스'에 등록된 전체 인공지능 모델 수는 34만여 개에 달한다.

특히 메타가 라마-2를 선보인 7월 18일을 기점으로 언어모델을 내놓는 기업이 폭발적으로 증가하기 시작했다.

인공지능 스타트업 업스테이지는 자체 개발을 시작한 지 2∼3개월 만에 허깅페이스 리더보드 벤치마크 점수로 GPT-3.5를 넘긴 거대언어모델 '솔라'을 제작했다.

솔라는 매개변수(패러미터) 700억 개인 라마-2를 파인튜닝(미세조정)했는데, 8월 1일 공개 당시 오픈 거대언어모델 리더보드에서 72.3점으로 1위를 차지했다.

토익 학습 애플리케이션 '산타'로 유명한 뤼이드가 최근 라마-2를 미세조정한 모델은 같은 리더보드에서 73.69점을 기록하기도 했다.

후발주자로 평가받는 메타가 업계 내 영향력을 키워나간 데는 라마-2를 누구나 무료로, 상업적인 목적으로 사용할 수 있다는 점이 주효했다.

자체 시스템을 개발하거나 데이터 세트를 대량으로 학습하지 않고도 새로운 모델을 만들 수 있어 스타트업 입장에서는 시간과 비용을 절약할 수 있기 때문이다.

한 스타트업 관계자는 "거대언어모델을 만들기 위해 비용과 시간, 기술력이 장벽으로 작용한다"면서 "속도감 있게 제품을 개발할 수 있는 활로가 열렸다"고 평가했다.

메타는 GPT-4 수준의 성능을 가진 거대언어모델도 오픈소스로 개발하고 있는 것으로 알려졌으며, 중국의 알리바바 등 다른 해외 빅테크(거대 정보기술기업)들도 자체 파운데이션 모델을 무상으로 공개하고 있다.

다만 오픈소스 생태계에서 GPT를 선보였지만 지난해 말부터 '기술 레시피' 공개를 지양하고 있는 오픈AI 사례를 따라갈 수 있다는 예측도 나온다.

인공지능 업계 관계자는 "메타가 지금은 오픈소스 깃발을 들고 가고 있지만, 선두 주자를 빠르게 따라잡기 위한 수단이라고 보고 있다"면서 "누구나 헤게모니를 잡으면 오픈소스로 가지 않는다"고 바라봤다.

다른 관계자도 "활용할 수 있는 선택지가 많아 좋기는 하지만, 자체 개발한 서비스가 남용·악용될 수 있어 불안하기도 하다"면서 "산업이 태동기라 규제도 애매하다 보니 책임을 지우는 데 한계가 있다"고 지적했다.

전문가들은 오픈소스 진영에도 추격의 여지가 있다고 전망한다.

김주호 한국과학기술원(KAIST) 전산학부 교수는 "거대언어모델이 워낙 다양한 태스크(작업의 실행 단위)에 적용되다 보니 영역에 따라 오픈소스가 강점을 보이는 곳이 있다"면서 "앞으로 인공지능 생태계에서 두 가지 형태 모델이 공존하면서도, 긴장 관계는 유지될 것"이라고 바라봤다.

acdc@yna.co.kr

(끝)

<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>