인공지능(AI) 학습을 위한 데이터 시장이 커지면서 데이터 판매 플랫폼과 거래 시스템이 주목받고 있다.
AI 데이터 기업 크라우드웍스는 ‘A1 데이터 거래소’ 베타 서비스를 시작한다고 12일 밝혔다. AI 학습용 데이터를 사면 블록체인을 기반으로 한 거래 명세 인증서를 제공한다. 데이터 거래의 투명성을 강화한 게 특징이다.
최근 AI 데이터 저작권 분쟁이 빠르게 늘고 있다. 오픈AI는 이미 여러 언론사와의 소송에 휘말려 있다. 국내에서도 일부 AI 스타트업이 창작자의 허락 없이 AI 학습에 창작물을 가져다 쓰면서 논란이 일고 있다. 온라인에 공개된 데이터를 AI 학습에 쓰는 게 공정한지에 대한 논쟁도 심화하고 있다. 데이터 활용 기준이 빠르게 정리되지 않으면 AI 기술의 발전 속도도 곧 한계에 부딪힐 것이란 우려도 나온다.
이 때문에 주요 AI 기업은 과거와 달리 개별 언론사, 출판사 등과 라이선스 계약을 체결해 데이터를 수집해 나가는 추세다. 새로운 데이터 거래 방식도 시도되고 있다. AI 스타트업 업스테이지는 ‘1T 클럽’을 발족했다. 책, 기사, 보고서 등 1억 단어 이상의 한국어 데이터를 제공하는 파트너사들의 연합체를 구성했다. 제공한 데이터의 토큰 수와 수익, 서비스 운영 비용 등을 감안해 보상 구조를 짰다.
블록체인 스타트업 PIP랩스는 최근 미국에서 3조원의 기업가치를 인정받기도 했다. 지식재산권(IP)에 대한 소유권과 라이선스를 메타데이터 형태로 삽입해 복잡한 법적 절차 없이도 창작자들이 수익을 분배받을 수 있는 플랫폼을 구축했다. 소유권자는 활용 범위, 사용 한도, 원하는 배분 수익 등을 명시하고, AI 기업은 정당한 비용을 내고 IP를 활용하면 된다. AI업계 관계자는 “이젠 질적으로 훌륭하고 저작권에도 문제가 없는 데이터를 확보하는 게 관건”이라고 말했다.
고은이 기자 koko@hankyung.com