[AI G3 어떻게 ②] 70년 영상을 빅테크에?…국산 VLM 개발 착수
"수백억에 영상 다 달라" 제안 거부…당국과 영상언어모델 만든다
저작권 문제없는 배경화면부터 AI 활용…정부, 성공 경험 영역 확장 시도
(서울=연합뉴스) 조성미 조현영 기자 = 우리나라의 독자적인 인공지능(AI) 모델 진화가 더딘 틈을 타 해외 빅테크가 활용도가 무궁무진한 국내 데이터를 선점하려고 발 빠르게 움직이고 있다.
데이터의 가치를 정확히 산정하기 어려운 상태에서 자칫 헐값에 팔아버릴 수 있고 한번 데이터를 넘기면 향후 AI·데이터 주권을 잃을 수 있다는 우려가 나오는 상황에서 방송업계와 정부 당국이 빅테크의 손짓을 마다하고 자체 AI 모델 구축에 합심해 나서기로 했다.
◇ 수사반장·조선왕조 오백년 속 배경 만화·게임으로 재창조
방송업계와 정보통신(IT) 당국에 따르면 지난해 생성형 AI 붐이 거세진 이후 복수의 해외 빅테크가 국내 방송사들이 보유한 영상 데이터를 사들이겠다는 의사를 타진한 것으로 알려졌다.
구매 대가는 방송사마다 다르지만 수백억원대를 제시한 것으로 전해진다. 빅테크들은 이른바 '볼리우드'로 통칭하는 인도 영화업계와 벌인 협상안을 토대로 영상 데이터의 가치 산정 명세를 제시했다는 후문이다.
빅테크들이 국내 방송사의 영상 데이터를 사려는 이유는 글로 된 뉴스 콘텐츠는 글로벌 언론사와 이미 다수 계약을 맺어 확보가 이뤄지고 있고 향후 더 주목받을 것으로 예상되는 멀티모달(영상 등 복합정보처리) 콘텐츠가 필요하기 때문이다. 또, 자신들이 보유한 북미·유럽권 영상 데이터 외에 아시아권 영상 확보로 다양성과 정확성을 높이려는 의도도 있다.
제안받은 방송사들은 수백억 원대라는 금액이 해방 이후 1956년 대한방송 시절부터 70년 가까이 축적된 흑백과 컬러, 최근의 UHD에 이르는 방대한 영상 데이터를 내주는 대가로 적정한지에 대한 의구심과 한번 데이터를 넘기면 추후 활용과 통제가 어려워질 수 있다는 우려에 따른 고민 끝에 제안을 받아들이지 않았다고 한다.
넷플릭스가 콘텐츠 미디어 강자로 등극하면서 국내 방송사들이 제작물을 온라인 동영상 서비스(OTT)에 공급하는 '하청 기지' 비슷하게 전락한 경험에 비추어 AI 경쟁 국면에서 같은 상황이 반복될 수 있다는 위기의식도 작용한 것으로 알려진다.
방송사들은 대신 IT 당국과 방송 영상 데이터를 AI에 학습시켜 새로운 영상 제작물을 생성하도록 하는 영상언어모델(VLM) 구축을 함께하기로 결정했다고 한다.
과학기술정보통신부, 정보통신산업진흥원, 한국전파진흥협회가 방송사, OTT 플랫폼사, IT 기업의 컨소시엄을 주선해 방송 콘텐츠 워크플로별로 AI를 접목하는 사업에 함께 하기로 한 건데, AI 기반 시각효과(VFX)·자막·더빙, 디지털 휴먼 생성 및 방송 콘텐츠 검색 등 콘텐츠 기획·제작·후처리 전반에 걸친 AI 설루션 개발이 목표다.
노동 집약적이었던 방송 산업을 기술 집약적으로 탈바꿈시켜 제작비 절감 등 어려움에 빠진 방송사 경영을 개선하고 양질의 콘텐츠 생산을 앞당기는 것이 목표다.
다만, 배우 얼굴·목소리, 방송에 등장하는 각종 상표권, 배경음악, 작가의 글 등 저작권 문제가 불거질 수 있는 분야는 우선 제외하기로 했다. 저작권 시비가 없는 배경 영상만 떼 데이터베이스화하고 AI 학습과 추론에 사용하기로 했다.
가령 서울역 주변이나 종로 거리의 1970∼1980년대 영상을 AI로 생성해 시대극 배경으로 활용하거나 만화, 게임 등 다른 장르의 콘텐츠 배경으로도 사용하는 방식이다. 이를 통해 회당 수억원씩 소요되는 VFX(시각효과) 비용 등을 크게 줄일 수 있을 것으로 예상한다.
◇ 콘텐츠 넘어 제조·바이오 등 축적된 데이터 AI로 탈바꿈
MBC가 지난 7월 31일 LG AI 연구원, 광주광역시와 업무협약을 맺어 미디어 콘텐츠 분야와 AI, 확장 현실(XR) 분야에서 협력하기로 한 것도 이런 사업의 일환이다.
MBC는 60년 동안 축적한 방대한 콘텐츠를 AI 학습에 제공하고 LG와 광주시는 AI 인프라와 기술로 AI를 활용한 방송 콘텐츠 기획·제작·유통 등 과정을 뒷받침한다는 계획이다.
다른 지상파 방송사들도 AI 기업과 컨소시엄을 맺는 방안을 검토 중으로 알려졌다. 과기정통부는 종편, 유료 방송, OTT 등 콘텐츠 사업자들과 협업 확대도 준비 중이다.
한 방송사 관계자는 "해외 빅테크들은 데이터 학습에만 몇조원씩 쏟아붓는다고 하는 등 AI 산업이 글로벌에 종속되지 않기 위한 마지막 퍼즐은 자본력이라고 본다"며 "우리나라 반도체 산업이 민간 기업이 미처 손대지 못하던 연구개발 등에서 정부 지원을 받아 세계적 수준으로 성장한 전례처럼 정부와 민간의 합심이 절실하다"고 강조했다.
정부는 방송·콘텐츠 분야뿐 아니라 제조, 바이오, 미용 산업 등에서 우리나라가 축적해온 데이터를 생성형 AI를 통해 고부가가치화하는 구상을 갖고 있다.
안철수 국민의힘 의원도 최근 콘퍼런스 등에서 조선시대 승정원일기 내용 중 멸문 가문 여식과 여종의 복수극을 예로 들며 역사 기록을 데이터베이스화해 AI로 학습시키면 드라마, 만화, 영화 등 K 콘텐츠의 자양분으로 삼을 수 있다는 아이디어를 냈는데 장르가 확대될 뿐 이와 일맥상통하는 구상이다.
문제는 방대한 데이터베이스를 AI가 학습해 새로운 결과물로 생성할 수 있도록 분류, 최적화한 뒤 그래픽처리장치(GPU), 클라우드 설비를 통해 학습시키는 데 드는 막대한 비용이다.
정부의 긴축 재정 기조 속 각 분야 예산에서 허리띠를 졸라매는 상황에서 전폭적인 지원을 기대하기 어려워 시기를 놓치는 것 아니냐는 우려도 있다.
일례로 과기정통부와 방송업계의 인공지능·디지털 기반 미디어 활성화 사업 예산은 올해 28억원으로 정부와 업계가 그리는 '원대한 구상'을 실현하기에 턱없이 부족한 실정이다.
csm@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>