"AI 기업의 학습데이터 공개 의무화해야"

입력 2025-10-15 17:31
수정 2025-10-16 00:53
한국신문협회가 내년 시행 예정인 정부의 ‘인공지능(AI) 기본법’(인공지능 발전과 신뢰 기반 조성 등에 관한 기본법)과 관련해 “AI 기업의 학습 데이터 공개를 법으로 의무화해야 한다”는 입장을 밝혔다. 협회는 15일 국회 과학기술정보방송통신위원회(과방위)와 과학기술정보통신부, 문화체육관광부에 이런 내용을 담은 의견서를 각각 전달하고 AI산업 발전과 콘텐츠·데이터 저작권자 권리 보호 간 균형을 도모할 것을 촉구했다.

협회는 의견서를 통해 구체적으로 ‘AI 기본법’에 학습데이터 공개 의무 조항을 추가하고 세부 사항을 시행령에 포함해야 한다고 주장했다. 협회 측은 “정부가 AI 기본법 시행을 앞두고 하위법령을 마련 중이지만 AI 학습데이터 공개 의무에 대한 명확한 규정을 담고 있지 않아 저작권 보호 및 투명성 확보 측면에서 한계가 있다”고 지적하며 “법적 미비점을 보완하기 위해 법 시행 및 시행령 제정에 앞서 법률 개정이 필요하다”고 했다.

협회의 요구는 최근 AI·미디어산업에서 AI의 학습 데이터 도용 논란이 불거진 데 따른 것이다. 협회는 지난 4월 네이버가 자사의 생성형 AI ‘하이퍼클로바’와 ‘하이퍼클로바X’의 개발 및 운영 과정에서 핵심 기술인 대규모언어모델(LLM) 학습을 위해 뉴스 콘텐츠 등 언론사 자산을 무단 사용하는 등 저작권과 공익을 침해했다며 공정거래위원회에 신고하기도 했다. 국회에도 박수현(더불어민주당), 김기현(국민의힘) 등 과방위 소속 의원들이 AI 사업자가 학습용 데이터에 관한 정보를 공개하도록 노력할 것을 골자로 하는 AI 기본법 개정안을 발의해 놓은 상태다.

협회는 “지난 8월 시행된 유럽연합(EU)의 인공지능법(AI Act)은 생성 AI 모델을 개발하는 사업자가 학습에 사용된 데이터 출처를 요약해 공개하도록 하고 있다”며 “우리도 저작권 보호, AI 기술의 투명성 확보, 국제 기준 부합 등의 측면에서 학습 데이터 공개 조항을 규정해야 한다”고 강조했다.

유승목 기자 mok@hankyung.com