'파파고' 총괄 "AI 번역, 7년 뒤 일반인 수준 넘는다"
네이버 김준석 리더 "3분기 웹페이지 번역 도입"
(서울=연합뉴스) 김태균 기자 = 네이버의 인공지능(AI) 번역 서비스 '파파고'를 총괄하는 김준석 리더는 19일 파파고 정식 출시와 관련해 "사용자와 함께 더 똑똑한 앵무새를 키워간다는 마음으로 번역 품질을 꾸준히 개선하겠다"고 밝혔다.
파파고는 에스페란토어로 '앵무새'란 뜻이다. 네이버는 작년 8월부터 지금껏 시범 운영됐던 파파고를 이날부터 정식 서비스로 전환해 200자였던 1회 최대 번역 분량을 5천자로 대폭 넓혔다.
1회 5천자는 주요 경쟁 서비스인 구글 번역과 같은 분량이다. 종전 파파고는 신경망번역(NMT)이란 AI 기술을 적용해 번역 결과가 좋았지만 구글 번역과 달리 기사 등 긴 글을 옮길 수 없었다는 것이 단점이었다.
파파고는 국내 포털로는 처음 선보이는 AI 번역 서비스다. 이번 조처에 따라 구글과 네이버라는 양대 검색 포털 사이에 AI 번역 경쟁이 본격화하고 고급 기계 번역의 대중화가 더 빨라질 것으로 보인다.
유명 AI 연구자 출신인 김 리더는 이날 연합뉴스와의 인터뷰에서 "파파고의 현재 번역 정확도는 100점 만점에 65점으로 번역 전문가가 아닌 일반인(80점)보다는 다소 떨어지는 수준"이라며 "기술 발전 속도를 볼 때 약 7년 뒤면 AI 번역이 일반인 수준을 넘어설 것으로 보인다"고 내다봤다.
그는 이어 "올해 3분기에는 웹페이지 전체를 번역해주는 '웹번역' 기능을 추가할 계획"이라며 "AI가 웹툰이나 예능 프로그램 자막도 학습해 젊은층의 유행어·신조어에 강한 것이 차별점"이라고 설명했다.
다음은 김 리더와의 일문일답
-- 애초 200자 분량 제한을 건 이유는
▲ 서버 과부하 우려가 있었다. 신경망번역(NMT)은 전산 장비 자체가 고가다. 기존의 통계 기반 번역(SMT)과 비교해 장비 비용이 약 10배다. 일단은 짧은 일상 회화를 외국어로 옮기는 데 집중했고 장비 문제가 해결되면 더 긴 글을 커버하겠다는 생각이었다. 이제 서버가 증강되고 학습 데이터가 많이 보강돼 제대로 서비스할 여건이 됐다는 판단이 섰다.
-- 파파고의 번역 정확도를 자평하자면
▲ 이상적인 번역을 100점 만점으로 하면 전문 번역가가 90점, 일반인은 80점가량이다. 이 척도에서 SMT는 30점에 불과한데 NMT 기반의 파파고는 65점 정도다.
-- 정식 서비스 이후에는 어떤 개선 작업을 할 계획인가
▲ 올해 3분기(7∼9월) 이내에 웹번역 기능을 선보일 계획이다. HTML(웹사이트 구축 언어)로 짜인 웹페이지 전체를 자연스럽게 번역해준다. 구글 크롬에 탑재된 웹번역과 같은 기능이다. 네이버 자체 웹브라우저인 '웨일'에 탑재할 수 있고 네이버 메일에도 적용할 수 있을 것으로 보인다.
-- 다른 번역기와 비교해 파파고의 차별점은
▲ 일상적 표현에 강점이 있다. 예컨대 젊은 층이 많이 쓰는 신조어나 유행어 같은 것에 강하다. 네이버의 글로벌 예능 동영상 서비스인 '브이 라이브'의 번역 자막이나 네이버 웹툰 국외판도 AI의 교육 데이터로 쓰기 때문에 트랜디한 표현을 많이 익혔다. 국내 사용자들이 써보면 그 차이를 실감할 것이다.
-- 네이버 자회사인 NBP가 최근 파파고의 API(Application Programming Interface) 상품을 내놨다. 타사 서비스에서 파파고를 탑재할 수 있는 상품인데, 어떤 서비스에 파파고가 들어가면 효과가 좋겠나
▲ 메신저나 사회관계망서비스(SNS)에 좋은 번역 서비스가 들어가면 효과가 좋을 것이다. 전자상거래는 고객 구매평 등의 댓글을 번역하는 수요가 매우 크다. 이런 글을 잘 번역하면 매출 신장에도 도움이 된다.
-- AI 번역 서비스의 상징으로 왜 앵무새를 택했나
▲ 애초 '번역을 앵무새 정도라도 하자' '친근하게 접근하자'란 생각으로 그렇게 이름을 붙였다. 어린이들부터 친구로 여기는 서비스가 됐으면 좋을 거 같았다.
사실 '정권의 앵무새'란 표현처럼 앵무새에 부정적 이미지가 있는 건 맞다.(웃음) 다만 우리는 사용자들과 함께 '더 똑똑한 앵무새'로서 파파고의 번역 품질을 꾸준히 개선하고 싶다. 올해 3분기 내로 파파고 PC 서비스에 사용자가 틀린 번역을 바로 잡는 '피드백' 기능을 넣을 예정인데, 여기에 우리 모두의 참여로 앵무새를 더 똑똑하게 키우자는 메시지를 녹여 넣을 생각이다.
애초 네이버랩스(네이버의 연구개발 자회사)가 개발하는 소프트웨어에는 동물 이름을 붙이기로 했다. 예컨대 웹브라우저는 웨일(고래)이고 번역 서비스는 파파고(앵무새) 식으로 '동물 시리즈'를 한 것이다.
-- 앞으로 3년 이내에 꼭 이뤘으면 하는 것은
▲ 네이버의 일본 자회사 라인을 위해 일본어·영어 번역 개발에 공을 들이고 있다. 일본은 시장 규모도 크고 번역에 대한 사회적 관심이 매우 높다.
일본에서도 영어 번역 수요가 가장 크다. 일·영 번역 서비스를 잘 만들면 라인 메신저나 라인이 개발한 AI 스피커 '웨이브' 등에 탑재할 수 있고, 글로벌한 수준의 임팩트를 줄 수 있을 것으로 본다.
-- AI 번역이 급격하게 발전해 2024년에는 인간의 번역 실력을 앞지를 것이라는 연구 결과가 영국에서 나왔다. 동의하는지
▲ 2024년이면 지금부터 7년 뒤다. 번역의 정확도를 100점 만점으로 했을 때 일반인이 80점 정도다. 7년 뒤면 AI 번역이 현재 65점에서 일반인 수준(80점)은 따라잡을 것으로 본다. AI가 일반인보다 잘한다는 얘기라면 합리적인 추정이다. 전산 장비의 발전 속도나 학습 데이터의 증가, AI 방법론의 진보 등을 고려하면 80점 수준까지는 충분히 올라갈 수 있다.
-- 음성 동시통역은 기술적으로 언제쯤 가능할까
▲ 파파고 등 현재 AI 번역 서비스는 음성에 대해서는 순차 통역을 한다. 음성을 문자로 변환해 인식하고, 다시 텍스트 번역 결과를 음성으로 바꿔주는 식이다.
음성 자체를 인식하려면 텍스트가 아닌 음성에 관한 학습 데이터가 필요하다. 현재 AI에 번역을 가르치려면 500만∼1천만개의 문장이 필요하다. 그런 규모의 음성 데이터를 확보하려면 비용이 엄청날 것이다. 현재 학계에서나 일부 기업에서 연구는 하고 있지만 당장 상용화하기에는 아직 이른 단계다.
-- AI번역이 통번역 작업이나 언어 교육에 대해 미칠 영향은
▲ 번역기는 도구다. 간단한 의사소통을 도와주고 사전 역할을 한다. AI 번역도 참고 자료일 뿐이며 최소한 번역가가 이를 감수하고 확인하는 작업이 필요하다. 또 현재 AI 번역은 정확도가 100점 만점에 65점 수준이니 외국어는 사람이 여전히 배워야 한다.
AI 번역기는 인간 번역자의 생산성을 높여주는 역할을 하게 될 것으로 본다. 예전보다 '포스트 에디팅'(사후 감수)의 중요도가 높아지는 변화는 있을 수 있다. 번역가의 핵심 업무로 포스트 에디팅이 부각돼야 한다는 등의 논의가 현재 이뤄지는 것으로 안다.
-- AI가 인간 번역자처럼 말의 깊은 맥락이나 배경 지식을 학습할 수 있을까
▲ 현재 AI 학습은 문장 단위로 한다. 그런데 맥락이나 배경 지식까지 배우려면 더 큰 단락 단위의 학습을 해야 한다. 즉 단락 단위의 학습 데이터가 필요한데, 그런 데이터가 지금 거의 없다.
또 문장으로 학습한 레벨이 65점에 불과해 문장 단위에서 더 풀어나가야 할 과제가 많다. 즉 아직 단락 단위의 학습을 본격화할 단계라고 보긴 어렵다.
tae@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
뉴스