연인들 카톡 유출한 '이루다'…개발사 "데이터베이스 폐기"

입력 2021-01-15 13:27


성희롱, 혐오 발언과 개인정보 유출 등의 논란을 빚었던 인공지능(AI) 챗봇이 사실상 이용자들과의 작별을 선언했다.

이루다의 개발사 스캐터랩은 이루다의 데이터베이스(DB)와 딥러닝 모델을 폐기하기로 했다고 15일 밝혔다. 스캐터랩은 보도자료를 내고 "개인정보보호위원회·한국인터넷진흥원(KISA) 합동 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델을 폐기하겠다"고 전했다.

스캐터랩에 따르면 이루다의 DB는 비식별화, 즉 익명화 절차를 거쳐 개별적·독립적인 문장으로 이뤄져있다. 또 딥러닝 대화 모델은 대화 패턴만 학습하기 때문에 개인정보 유출 위험은 전혀 없다는 게 회사의 입장이다. 하지만 스캐터랩은 "이용자들의 불안감을 고려해 폐기를 결정했다"고 설명했다.

업계에서는 딥러닝 모델을 폐기하는 것은 스캐터랩이 이루다 프로젝트를 사실상 백지화하겠다는 조처와 다름 없는 것으로 보고 있다.

스캐터랩 측은 "'이루다'라는 캐릭터를 없앨지 다른 캐릭터로 새로운 챗봇을 만들지 등은 결정된 바 없다"면서 "DB와 딥러닝 모델은 완전히 새로 개발하겠다는 것이다"는 입장을 밝혔다.



스캐터랩은 이루다를 만드는 과정에서 연애분석 앱 '연애의 과학' 이용자들의 카카오톡 데이터를 가져다 쓰면서 개인정보보호법을 위반했다는 의혹을 받고 있다. 연애의 과학 이용자와 그 연인에게 개인정보 이용·활용 동의를 제대로 받지 않았고, 데이터를 사용하는 과정에서 익명화를 제대로 하지 않은 것이 쟁점이다.

이 대화 데이터를 사내 메신저에 공유한 직원이 있었다는 의혹도 받고 있다. 앞서 제대로 익명화하지 않은 데이터를 오픈소스 공유 플랫폼 '깃허브'에 공유했다는 사실이 밝혀지기도 했다.

연애의 과학 이용자들은 "이루다 DB가 아니라 카톡 데이터 전량을 파기해야 한다"고 요구하고 있다. 스캐터랩은 연애의 과학으로 모은 카톡 데이터 약 100억건에서 1억건을 추려서 이루다 DB로 쓴 것으로 알려졌다.

스캐터랩 측은 "기존 '연애의 과학'과 '텍스트앳'에서 이용자 동의를 받고 수집했던 데이터는 데이터 활용을 원치 않는 이용자들이 신청할 경우 모두 삭제하겠다"며 "(해당 데이터는) 향후 딥러닝 대화 모델에도 이용되지 않을 것"이라는 주장이다.

이루다는 지난해 12월 23일 페이스북 메신저를 기반으로 출시한 AI 챗봇이다. 자연스러운 대화로 10~20대 사이에서 크게 주목을 받아 3주 만에 약 80만명의 이용자를 모았다. 다만 일부 커뮤니티를 중심으로 '이루다 성노예 만드는 법' 등이 공유됐다. 또 특정인을 대상으로 혐오나 차별 발언을 쏟아내면서 사회적으로 논란이 됐다.