
인공지능(AI) 학습용 데이터 공개 범위를 두고 갈등이 이어져왔던 과학기술정보통신부와 문화체육관광부가 마침내 합의점을 찾았다. 양 부처는 28일 열린 제 4차 과학기술관계장관회의에서 '공공저작물 자유이용 허락표시 기준(공공누리)'를 개정하고 '공공저작물 인공지능(AI) 학습 활용 확대 방안'을 발표했다.
이번에 개정된 공공누리에는 '제 0유형'이 도입됐다. 상업적 이용과 변경, 출처 표기 의무 없이 자유롭게 활용할 수 있는 공공저작물을 의미한다. 이로써 국내 기업들은 대량 정보 처리가 필요한 AI 학습 환경에서 공공저작물을 제약 없이 활용할 수 있게 됐다.
주목할만한 개정안 내용은 'AI유형'의 신규 도입이다. 기존 공공누리 유형인 1~4유형의 이용조건은 유지하되, AI 학습 목적으로는 공공저작물을 자유롭게 활용할 수 있도록 규정을 신설했다.
기존에 상업적 이용이나 변경 이용이 허용되지 않는 공공저작물이라도 'AI유형' 표기가 붙을 경우 AI 학습에 자유롭게 활용할 수 있다. AI업계에선 "제 0유형의 신설보다 AI유형의 도입이 공공저작물 활용 범위 확대에 더욱 긍정적인 영향을 미칠 것으로 보고 있다"는 반응이 나온다.
저작권법 개정도 추진한다. 공공저작물의 공공누리 표시를 의무화해 더욱 많은 공공저작물이 AI 산업 등 다양한 분야에 개방될 수 있도록 제도를 개선하겠다는 계획이다. 한국문화정보원과는 공공저작물을 AI 학습에 즉시 활용할 수 있는 데이터로 가공한 후 이를 개방하는 사업도 추진한다.
공공저작물은 방대한 규모와 높은 신뢰성을 바탕으로 AI 학습용 데이터의 중요한 원천으로 주목받았다. 하지만 산업 현장에서는 '무용지물'이라는 목소리가 지배적이었다. 개별 저작물마다 출처를 명시해야 하는 등 사용을 위한 기준이 높아 정작 활용할 수 없다는 것이다.
과기정통부는 산업계의 의견을 수렴해 문체부에 지속적인 '저작권 개방' 요청을 해 온 것으로 알려졌다. 지난해 9월에는 협상 끝에 AI 독자 파운데이션 모델 정예팀에게만 제 1~3유형 저작물 1100만건을 학습할 수 있도록 허가했다. 과기정통부는 이후 문체부에 데이터 추가 개방을 요구해왔지만 부처 간 간극을 메울 수 없었다. 이번 과기장관회의를 계기로 양 부처가 합의점을 찾았다는 게 관계자의 설명이다.

과기정통부는 2017년부터 'AI 허브'를 통해 903종의 AI 학습용 데이터를 구축·개방해왔지만, 창작자 단체와 문체부가 저작권 보호에 강경하게 반응하자 추가 개방에 어려움을 겪어왔다. 이번 협의를 계기로 과기정통부는 AI 허브를 'AI 학습용 데이터 통합제공체계'로 고도화할 계획도 내놨다. 공공·민간 보유 데이터 중 가치와 활용도가 높은 데이터를 AI 학습용으로 전환해 개방하겠다는 것이다.
문체부와 과기정통부는 공공저작물 개방 노력을 공공기관 평가에 반영하는 인센티브도 검토할 계획이다. 최휘영 문체부 장관은 "공공저작물은 AI 산업을 이끌 수 있는 핵심 자원"이라며 "앞으로도 문체부는 AI 선도기관으로서 AI을 비롯한 신기술 분야에서 공공저작물이 활발히 활용될 수 있도록 관련 제도를 지속적으로 정비하고 지원해 나가겠다"고 말했다.
배경훈 과기정통부 부총리는 "국민 세금이 투입된 데이터는 최대한 개방한다는 원칙하에 관계 부처와 협력해 데이터가 막힘없이 흐르고 활용되는 생태계를 조성해 나가겠다"며 "새로운 공공누리 유형을 민간에서 수요가 많은 공공저작물부터 우선 적용하는 등 국민이 제도개선 효과를 체감할 수 있도록 노력하겠다"고 밝혔다.
최지희 기자 mymasaki@hankyung.com