공개 데이터로 훈련하는 AI 제동 걸리나…사상 첫 소송 제기
美 유명 프로그래머, MS·깃허브 등 프로그래밍 AI 제작사에 소송
(서울=연합뉴스) 임화섭 기자 = 인공지능(AI)이 대량의 공개 데이터를 퍼가면서 스스로 학습하는 'AI 훈련' 기법에 대해 "사람이 힘겹게 만든 창작물을 무단도용하는 저작권 침해"라고 주장하는 첫 소송이 미국에서 제기됐다.
AI는 음성·이미지 인식, 자율주행 등 산업뿐 아니라 미술, 음악과 같은 예술까지 다양한 분야에 쓰이면서 인간의 일자리를 위협하고 있으나 이 학습 방법이 합법인지 모호한 경우가 대부분이어서 IT 업계는 소송 결과에 촉각을 곤두세우고 있다.
23일(현지시간) 미 일간 뉴욕타임스(NYT)에 따르면 저명한 컴퓨터 글꼴 전문가이자 프로그래머, 변호사인 매슈 버터릭(52)은 이달 초 캘리포니아 북부 연방지방법원에 '코파일럿'(Copilot)이라는 AI 프로그래밍 도구를 만들거나 운영에 관여한 대형 AI 회사들을 상대로 집단소송을 제기했다.
피고 중에는 오픈소스 소프트웨어 커뮤니티로 유명한 '깃허브'(Github)와 이를 2018년 인수한 '마이크로소프트'(MS), 그리고 MS의 투자를 받은 AI 회사 '오픈AI'(OpenAI)가 포함돼 있다.
프로그래머가 코파일럿을 띄워 놓고 코드 일부를 짜면 이 AI가 그다음에 어떤 코드가 들어갈지 판단해서 그 내용을 자동완성 방식으로 띄워 준다. 제시되는 내용이 인간이 짠 기존 공개 코드와 완전히 똑같은 경우도 흔하다.
작년 6월 말 출시된 코파일럿은 올해 6월부터는 월 10달러(1만3천400원)의 요금이 부과되는 유료 서비스로 제공되고 있다.
버터릭 등 원고들은 코파일럿이 소프트웨어 도용을 통해 만들어졌다고 주장했다.
코파일럿이 지금의 기능을 갖추게 된 것은 수백만명의 프로그래머들이 공들여 짜 깃허브의 공개 저장소에 올려 둔 수십억 줄의 기존 오픈소스 코드를 피고들이 무단으로 도용해 학습시킨 결과라는 것이다.
AI 개발사들은 오픈소스 라이선스 조건을 위반했을 뿐만 아니라 깃허브의 서비스 약관과 개인정보보호 정책, 미국 디지털 밀레니엄 저작권법(DMCA), 캘리포니아주의 소비자보호법 등을 어겼다고 원고 측은 주장했다.
버터릭 등은 이번 집단소송의 경과를 알리고 원고인단을 모집하기 위해 홈페이지(https://githubcopilotlitigation.com/)와 트위터 계정(https://twitter.com/copilotcase)을 개설했다.
이번 소송의 결과는 다른 AI 도구에도 적잖은 영향을 미칠 전망이다.
NYT는 기업들이 AI 훈련 방식으로 프로그래밍 도구뿐 아니라 AI 아트 생성기, '시리'나 '알렉사' 등 음성인식 시스템, 자율주행 시스템 등을 만들고 있다고 설명했다.
버터릭은 지난 9일 미국의 테크 전문 매체 '더버지'와의 인터뷰에서 "AI 시스템은 법 적용이 면제되는 마법의 블랙박스가 아니다"라며 "우리가 책임성 있는 AI를 가질 수 있는 유일한 방법은 AI가 모든 이들에게 공정하고 윤리적으로 대하도록 하는 것이며, 이 시스템 소유주들 역시 책임을 지게 해야 한다"고 강조했다.
그는 이번 소송에서 AI 회사들이 패소하면 AI 분야의 혁신이 가로막힐 것이라는 일각의 주장에 대해서는 "오히려 그 반대일 것"이라며 2000년대 초에 냅스터가 저작권을 무시하는 불법적 서비스로 등장했으나 이해관계자들의 협의를 거쳐 스포티파이와 아이튠스 등 합법적 음원 서비스가 나온 점을 거론했다.
NYT는 "예술가와 작가, 작곡가 등 창작가 사이에서는 기업과 연구자들이 동의를 구하지 않고 적절한 보상도 해주지 않으면서 자신들의 창작물을 이용하고 있다는 걱정이 점차 커지고 있다"고 전했다.
limhwasop@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
뉴스