인공지능(AI)의 학습에 활용되는 데이터의 저작권을 두고 세계경제포럼(WEF·다보스포럼)에서 기성 콘텐츠 생산업체와 AI 기술기업 간 논쟁이 펼쳐졌다.
주간지 ‘타임’을 소유하고 있는 마크 베니오프 세일즈포스 최고경영자(CEO·사진)는 “AI 기업들이 기술 구축을 위해 지식재산권(IP)을 훔쳤다”고 꼬집었고 챗 GPT 개발사 오픈AI의 샘 알트먼 CEO는 “AI 학습 과정에서 언론사의 방대한 데이터가 필요하지 않다”고 반박했다.
베니오프 CEO는 16일(현지시간) 스위스 다보스포럼 중 블룸버그 통신과의 인터뷰에서 “모든 훈련 데이터는 도난당한 것”이라며 “타임, 뉴욕타임스(NYT) 등 언론 매체의 콘텐츠가 AI 기업의 연구 결과에 포함돼있다”고 주장했다.
그는 “이러한 데이터에 대한 공정한 가격이 얼마인지는 아무도 정확히 알지 못한다”면서도 “AI 기업은 콘텐츠 제작자를 공정하게 대우하기 위해 지불 방식을 표준화해야 한다”고 덧붙였다.
NYT는 작년 12월 “AI 훈련에 우리 기사가 무단으로 사용됐다”며 오픈AI와 마이크로소프트(MS)를 상대로 저작권 소송을 제기했다. 블룸버그에 따르면 오픈AI는 CNN, 폭스, 타임 등과 뉴스 콘텐츠 라이선스 협상을 진행 중이다.
같은 날 샘 알트먼 오픈AI CEO는 블룸버그와의 인터뷰에서 “우리의 많은 연구는 소량의 고품질 데이터에서 어떻게 하면 더 많은 것을 배울 수 있을지에 관한 것”이라고 밝혔다. NYT가 제기한 소송에 대해서도 “자신의 데이터가 모두 가치가 있다고 믿는 사람들이 있다”며 “(우리는) NYT 데이터로 훈련하고 싶지 않다”고 말했다.
한경제 기자 hankyung@hankyung.com