한국어 능력 높인 GPT-4…네이버·카카오 '긴장'

입력 2023-03-16 07:33
수정 2023-03-16 08:30


오픈AI가챗GPT에적용된GPT-3.5의업그레이드버전인GPT-4를공개했다.

한때GPT-4는GPT-3의매개변수(파라미터)규모인1천750억개를아득히뛰어넘은1조개이상의매개변수를갖출것이라는추정이나왔지만,오픈AI는GPT-4매개변수규모를공개하지않았다.

다만업계에서는확실히'더똑똑한모델'이라는평가가나온다.이미지를보고이해할수있게됐고,언어구사능력과기억력이높아진것은물론영어이외의외국어실력도전반적으로향상됐다는점에서다.

오픈AI에따르면GPT-4는기존GPT-3.5와달리텍스트뿐아니라이미지까지여러데이터형태를인식하는멀티모달(복합정보처리)모델이다.

문자로만대화할수있었던데서사진과문자를결합한질문도이해하고답변할수있게발전한것이다.계란과밀가루,버터,우유사진을올리고"이걸로요리할수있는게뭐지?"라고물으면"팬케이크나와플,프렌치토스트등등"이라고답하는식이다.

언어능력자체도향상됐다.처리할수있는단어량은2만5천단어로챗GPT보다약8배늘어났다.GPT-4는미국모의변호사시험에서90번째,대학입학자격시험인SAT읽기·수학시험에서는각각93번째와89번째의백분위수를기록했는데이는상위10%수준이라고오픈AI는설명했다.

대화내용을기억할수있는능력도대폭늘어났다.미국정보기술(IT)전문매체테크크런치는"GPT3.5는책4∼5페이지에해당하는4천96토큰(메모리단위)을보유했는데,GPT-4는최대책50페이지수준인3만2천768토큰을보유했다"면서"희곡이나단편하나를통째로외울수있다는의미"라고소개했다.

특히GPT-3.5의고질적문제였던'할루시네이션(환각)현상'도크게줄었다고오픈AI는설명했다.이는AI가틀린정보나무의미한내용을마치환각을보는듯이그럴듯하게제시하는현상이다.

오픈AI는"GPT-4는내부사실성평가에서최신GPT-3.5보다40%높은점수를받았다"고했다.

한국어를비롯한비영어언어성능이높아진점도주목된다.오픈AI가시험한26개언어가운데GPT-4는한국어와일본어,프랑스어등24개언어에서GPT-3.5가영어를하는수준보다더높은성능을보였다.

이는국내에서생성형AI를개발하는네이버와카카오등을가장긴장하게하는지점이다.두회사는GPT-4가어떤반향을부를지주목하면서한국어특화대규모언어모델개발에더집중하겠다는입장을밝혔다.