GPT의존 AI서비스 봇물 괜찮을까…"기술·데이터 종속 우려"
오픈AI, GPT 기술 차별적 허용 가능성…"국산 원천기술 개발 절실"
파운데이션 모델 자체 개발 드물어…"반도체처럼 기간산업 육성해야"
(서울=연합뉴스) 조성미 기자 = '21세기판 증기기관' 발명에 비견되는 초거대 생성형 인공지능(AI) GPT 시리즈의 등장 이후 국내 정보통신기술(ICT) 업계에서도 AI 서비스가 우후죽순처럼 출현하고 있다.
카카오톡에서 GPT-3.5 또는 GPT-4와 채팅할 수 있는 '아숙업'(AskUp)은 채널 친구 50만 명을 돌파했고, 건강·세무 등 다양한 영역에서 GPT 기반 챗봇 서비스가 봇물 터지듯 쏟아지는 중이다.
이런 가운데 이미 세상에 나온 GPT를 기반으로 챗봇, 문서 작성, 요약 등의 비슷비슷한 서비스를 양산하기보다 국산 GPT, 즉 파운데이션 모델 개발에 힘써야 한다는 목소리가 나온다. 파운데이션 모델이란 텍스트, 이미지, 음성 등 입력 내용을 학습하고 새로운 데이터를 생성할 때 근간이 되는 AI를 말한다.
◇ GPT 기댄 AI서비스 우후죽순…오픈AI가 '폐쇄 전략' 돌변하면?
3일 업계에 따르면 국내 기술로 개발한 파운데이션 모델은 아직 매우 드문 형편이다. 세계적으로도 자체 파운데이션 모델 개발에 성공한 스타트업은 오픈AI, 코히어(Cohere), 어뎁트(Adept) AI 등 손가락에 꼽힐 정도다.
이런 상황에서 오픈AI의 챗GPT가 처음 등장했을 때 국내 AI 업계와 당국은 '한국어 실력은 아직 한국산 AI 모델이 더 낫다'고 안도하는 분위기였다.
하지만 3개월 뒤 GPT-4가 등장하고 분위기가 바뀌었다. GPT-4 한국어 실력이 챗GPT 영어 실력을 능가한다는 사실을 접하고 AI 모델에서 더 이상 언어를 구분 짓는 것이 의미가 없다는 각성이 들었기 때문이다. 이때부터 국내 파운데이션 모델 부족에 대한 위기감이 커졌다고 한다.
네이버·카카오[035720] 등 우리나라 대표 테크 기업 내부에서 소위 '멘붕' 상태에 빠졌다는 말도 나온다.
네이버·카카오뿐 아니라 GPT 기술을 워드, 엑셀 등에 탑재하며 사무용 소프트웨어의 '괴물'로 떠오른 마이크로소프트 코파일럿 등장에 한글과컴퓨터[030520] 등 국내 사무용 소프트웨어 기업들도 위기감을 느끼는 것으로 전해진다.
우리 기업이 초격차를 가진 원천 기술력으로서 파운데이션 모델을 갖지 못하면 해외 AI 기술력에 종속될 수 있다는 우려도 커지고 있다.
지금은 기술을 개방한 것처럼 보이는 오픈AI가 GPT 기술을 나라·기업마다 차별적으로 쓰도록 정책을 변경할 경우를 가정해야 한다는 이야기다. 해외 AI에 의존하다 보면 국내 이용자가 생산하는 데이터가 해외 AI 원천기술 기업에 가버리는 문제도 있다.
업계 내부 사정을 잘 아는 한 관계자는 "초거대 AI의 핵심은 초연결 클라우드와 이용자가 제공하는 정형화된 실시간 데이터로, 이를 매개하는 플랫폼 기업의 역할이 정말 중요하다"며 "지금 GPT를 활용한 비슷비슷한 서비스를 내놓을 것이 아니라 자체 파운데이션 모델 개발을 비롯한 응용 서비스 쪽에서 변화를 추구해야 할 때"라고 지적했다.
AI 업계 다른 관계자는 "GPT-4를 탑재한 마이크로소프트 빙에서 국내 기관이나 기업에 영업을 목적으로 직접 연락하고 있다고 들었다"며 "국내 AI 업계가 낄 자리가 없을 수도 있다는 위기감이 드는 것이 사실"이라고 털어놨다.
그는 "하지만 현재 상황은 위기이자 기회일 수도 있다"며 "외국 기업의 클라우드에 데이터를 맡기기 부담스러워하는 고객도 많아 국내 AI 업계가 대안적인 서비스를 제공할 수 있는 여지는 있다"고 했다.
류석영 카이스트 전산학부장은 "지금까지 국내 AI 학계와 업계가 잘 해왔는데 시대가 너무 빨리 변하고 있어 이러한 격변기에 어떻게 해야 할지 고민인 부분"이라며 "개인정보 문제 등으로 쉽지 않겠지만 데이터에 대한 규제를 정부가 좀 더 완화해주고 연구자들이 자유롭게 연구할 수 있는 환경을 조성해야 한다"고 제언했다.
◇ 자체 파운데이션 모델 개발 늦지 않았다…국가 차원 전략 필요성
국내에도 자체 개발한 파운데이션 모델이 아예 없는 것은 아니다. 대표적으로 설립 3년 차 AI 스타트업 트웰브랩스의 영상 AI 기술이 꼽힌다.
오픈 AI가 인터넷상의 어마어마한 텍스트와 이미지를 학습해 재창조하는 GPT를 개발했다면, 트웰브랩스는 거대한 양의 영상에서 유의미한 부분을 추출하는 기술을 보유하고 있다.
'영상계의 오픈AI'로도 비유되는데, '딥러닝의 대모'라 불리는 페이페이 리 미국 스탠퍼드대 교수, '트랜스포머' 기술 공동 개발자 에이단 고메즈 등 AI 분야에서 내로라하는 석학이나 기업가가 이 회사에 엔젤 투자자 등으로 참여하고 있다.
GPT가 긴 글을 짧은 시간 안에 요약하고 마치 사람처럼 글을 쓰는 것처럼 트웰브랩스 AI 모델은 영상 속 특정 장면이나 소리, 등장인물, 문자 등 각종 시청각 정보를 이해하고 분류·요약·추천 등 작업을 수행한다. AI 모델을 발전시키면 궁극적으로 영상 생성도 가능할 것으로 보고 상용화를 추진 중이다.
GPT가 다루는 텍스트·이미지보다 영상은 훨씬 더 복잡하고 역동적인 데이터로 꼽힌다. 나아가 다가오는 로봇 일상화 시대에서 로봇의 눈 역할을 영상 AI 기술이 수행하게 될 것으로 기대되고 있다.
AI 업계 관계자는 트웰브랩스의 예를 들며 "파운데이션 모델 산업은 반도체와 같은 기간 산업으로 초기부터 대규모 투자가 필수적이다. 국가 차원의 전략적 투자를 통해 '차세대 삼성'을 육성해야 할 때"라고 했다.
그는 "우리는 이미 AI 경쟁에서 늦었으니 해외 원천 기술을 쓴 서비스에 집중해야 한다는 것은 틀린 이야기"라며 "오픈AI 등과 격차가 벌어진 것은 맞지만 돌이킬 수 없는 것은 아니다. 거대 언어모델(LLM) 스타트업에 수천억 원을 투자하는 일이 실리콘밸리에서는 아직 흔한데 이미 늦어 가망이 없다면 있을 수 없는 이야기"라고 했다.
이상윤 카이스트 문술미래전략대학원 교수는 "응용 기술의 개발은 여러 기술 요소의 조합을 바탕으로 시행착오를 거치며 실험하고 개선하는 긴 시간을 거쳐야 하므로 대규모의 투자가 전략적이고 일관되게 이루어져야 한다"고 강조했다.
그러면서 "개별 기업 입장에서 쉽게 감내하기 어려운 투자 위험을 정부가 국가연구개발 예산 및 출연연구기관 조직을 지원함으로써 상당 부분 완화할 수 있다"며 "국가 차원의 연구·개발 전략 수립과 함께 대규모의 일관된 투자가 산학연 연계를 중심으로 이루어져야 한다"고 했다.
csm@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
뉴스