"네이버 약관, 학습 데이터 크롤링 금지…외부와 공유해야"

입력 2024-10-28 09:11
"네이버 약관, 학습 데이터 크롤링 금지…외부와 공유해야"

박민규 의원 "AI 생태계 위해 플랫폼의 크롤링 공유 가이드라인 필요"



(서울=연합뉴스) 노재현 기자 = 네이버가 이용자들의 콘텐츠를 다른 사업자의 학습 데이터를 위해 합리적 수준에서 외부와 공유해야 한다는 지적이 나왔다.

28일 국회 과학기술정보방송통신위원회의 소속 더불어민주당 박민규 의원에 따르면 네이버는 약관으로 다른 사업자의 크롤링(웹 페이지의 데이터를 추출하는 행위)을 명시적으로 허용하지 않는 것으로 확인됐다.

네이버 약관은 "네이버 서비스를 이용하여 구축되는 데이터베이스에 대하여 robots.txt(로봇 텍스트) 파일 등의 소정의 보호 장치로써 이를 보호하고 있다"며 "robots.txt로 보호되는 데이터베이스를 네이버의 로봇이 아닌 타 검색 로봇이 수집하는 것을 불허한다"고 규정했다.

또 네이버 블로그 등에는 크롤링을 차단하는 소스 코드가 삽입돼 있다고 박 의원이 밝혔다.

하정우 네이버클라우드 AI이노베이션 센터장은 지난 8일 국회 과학기술정보방송통신위원회 국정감사에서 네이버가 서비스에 부하를 주지 않는 선에서 다른 사업자의 크롤링도 허용하는 것으로 알고 있다고 답변했다.

그러나 이는 크롤링을 금지한 네이버 이용약관에 반하는 발언이라고 박 의원이 강조했다.

해외의 경우 미국 빅테크 구글은 검색 결과를 제외하고는 크롤링 제한을 두지 않는 상황이다.

이런 점에서 네이버가 자사 플랫폼을 이용한다는 이유로 가입자 콘텐츠를 사실상 독점적으로 활용하는 것은 타당하지 않고 산업 생태계 측면에서도 아쉬움이 크다는 목소리가 나온다.

박 의원은 "네이버 플랫폼의 방대한 데이터를 다른 사업자도 활용할 수 있게 한다면 오픈소스 기반의 국내 혁신 AI(인공지능) 스타트업들이 한국 상황에 적합한 AI 서비스를 개발하는 데 큰 도움이 될 것"이라고 말했다.

그러면서 "우리나라 AI 생태계 발전을 위해 플랫폼의 합리적인 크롤링 공유 가이드라인을 만들 필요가 있다"고 덧붙였다.

네이버 창업자인 이해진 글로벌투자책임자(GIO)는 지난 5월 'AI 서울 정상회의'에서 보다 안전한 AI를 위해 각 지역의 문화, 가치를 존중하는 다양한 AI 모델들이 필요하다며 한국어 기반 AI 모델 구축의 중요성을 강조한 바 있다.



nojae@yna.co.kr

(끝)

<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>