인공지능(AI) 챗봇(채팅로봇) ‘이루다’ 개발사 스캐터랩이 이루다 데이터베이스(DB)와 딥러닝 모델을 폐기하겠다고 발표했다. 그러나 문제가 된 ‘연애의 과학’ 데이터의 전량 폐기가 아니라 이용자들의 반발은 계속될 것으로 예상된다.
15일 스캐터랩은 보도자료를 통해 “이루다 DB와 이루다 학습에 사용된 딥러닝 대화 모델을 폐기하기로 결정했다”고 밝혔다. 스캐터랩은 개인정보보호위원회·한국인터넷진흥원(KISA) 합동 조사가 종료되는 즉시 이루다 DB와 딥러닝 대화 모델을 폐기하기로 했다.
스캐터랩 측은 “이루다 DB는 비식별화(익명화) 절차를 거쳐 개별적·독립적인 문장으로 이뤄져 있고, 딥러닝 대화 모델은 대화 패턴만 학습하기 때문에 개인정보 유출 위험은 전혀 없다”면서도 “이용자들 불안감을 고려해 폐기를 결정했다”고 설명했다.
다만 이들이 그동안 수집한 데이터의 전량 폐기는 밝히지 않았다. 회사 측은 “기존 ‘연애의 과학’과 ‘텍스트앳’에서 이용자 동의를 받고 수집했던 데이터는 데이터 활용을 원하지 않는 이용자들이 신청할 경우 모두 삭제할 것”이라며 “이는 향후 딥러닝 대화 모델에도 이용되지 않는다”고 전했다.
이어 스캐터랩은 “향후 신규 가입 및 서비스 이용 시 개인정보 수집·이용 등의 절차도 강화하겠다”고 덧붙였다.
스캐터랩은 이루다를 만드는 과정에 연애 분석 서비스 ‘연애의 과학’ 이용자들의 카카오톡 데이터를 가져다 쓰면서 개인정보보호법을 위반했다는 의혹을 받고 있다. 해당 서비스 이용자와 이용자의 대화 상대방에게 개인정보 이용·활용 동의를 제대로 받지 않은 점, 데이터를 이루다 재료로 쓰는 과정에 익명화(비식별화)를 제대로 하지 않은 점 등이 핵심이다.
연애의 과학 이용자들은 “이루다 DB가 아니라 카톡 데이터 전량을 파기해야 한다”고 요구하고 있다. 스캐터랩은 연애의 과학으로 모은 카톡 데이터 약 100억건에서 1억건을 추려서 이루다 DB로 썼다고 밝힌 바 있다.
김남영 기자 nykim@hankyung.com