'쩐다→awesome'…유행어까지 번역하는 AI

입력 2016-12-15 20:25
인공지능으로 향상된 구글번역·네이버 파파고

기존엔 단어·어구 단위 번역
기계처럼 딱딱하고 오역 많아

AI, 문장맥락 찾아 의역해줘
유행어·트렌드 반영도 빨라
"전문 통역사의 60% 수준"


[ 이호기 기자 ] 구글 네이버 등 국내외 주요 정보기술(IT) 기업이 잇따라 기계번역 서비스에 인공신경망 기술을 도입하고 있다. 문장 전체를 읽어들여 맥락에 따른 번역이 가능해지면서 최신 유행어까지 의역해주는 수준으로 진화했다는 평가를 받고 있다. 이들 서비스는 데이터가 쌓이면 알고리즘의 정확도를 높일 수 있기 때문에 번역 품질도 꾸준히 개선될 것으로 기대를 모으고 있다.


◆유행어 번역도 가능

네이버는 15일 인공신경망 번역 앱(응용프로그램)인 ‘파파고’에 한국어·중국어 서비스를 추가했다고 발표했다. 이에 따라 파파고가 지원하는 언어 쌍은 한국어 영어 중국어(간체) 일본어 등 4개 국어로 늘었다. 글로벌 통·번역 전문기업인 시스트란인터내셔널도 이날 인공신경망 번역 시스템인 ‘pNMT’에 한·영 번역을 추가로 지원한다고 밝혔다. 시스트란인터내셔널은 지난달 초 pNMT를 적용해 세계에서 최초로 30개 이상 언어의 기계번역 서비스를 선보였다. 구글도 11월부터 한국어 영어 프랑스어 독일어 스페인어 포르투갈어 중국어 일본어 터키어 등 8개 언어 조합에 대해 인공신경망 번역을 제공하고 있다.

인공신경망 번역의 가장 큰 특징은 직역이 아니라 의역이 가능하다는 점이다. 기존 규칙기반번역(RBMT)이나 통계기반번역(SMT)에서는 단어나 어구 단위로 쪼개 상대 언어에서 가장 적합한 뜻을 찾은 뒤 이를 문장으로 단순 조합하는 방식을 사용했다. 그러나 인공신경망 번역에서는 문장을 형태소(뜻을 지닌 가장 작은 말의 단위)로 쪼개 각 형태소 간 조합 전체가 가장 적합한 의미를 갖는 번역 결과가 나올 수 있도록 했다. 쉽게 말해 문장 전체를 읽어들여 번역의 정확도를 높일 수 있게 한 셈이다.

◆격해지는 글로벌 경쟁

구글 번역에서 ‘쩐다’라는 속어를 입력하자 ‘awesome(멋진)’이라는 번역 결과가 나온다. ‘별천지네’에 대해서도 ‘It’s a great deal(굉장하다)’로 번역했다. 네이버 파파고도 ‘ㅋㅋㅋ’에 ‘LoL(Laugh out loud·크게 웃음)’, ‘난 초콜릿이라면 사족을 못써’에 ‘I have a weakness for chocolate.(난 초콜릿에 약해)’이란 번역 결과를 내놨다. 단어 하나하나가 아니라 문장 전체의 뜻을 짐작해 가장 가까운 상대 언어의 표현으로 의역해주는 것이다.

또 이들 기업이 인터넷과 소셜미디어 등에서 쌓이는 빅데이터를 활용하고 있어 유행어 등 최신 트렌드를 반영하는 속도도 빠른 편이다. 실제 네이버는 지난해 말 선보인 글로벌 개인방송 서비스인 브이(V)의 자막 데이터 등을 활용해 파파고의 번역 품질을 개선하고 있다. 그러나 문장 단위를 넘어서지는 못한 것으로 분석된다. 예를 들어 구글 번역은 대한민국 헌법에서 ‘전문’과 ‘총강’을 각각 ‘specialty(전문성)’와 ‘total steel(모든 철)’로 번역했다.

김준석 네이버랩스 파파고 셀 리더는 “전문 통역사의 번역 수준을 85~90점으로 본다면 현재 인공신경망 번역은 60점 수준”이라며 “2018년까지는 70점 수준으로 진화할 수 있을 것”이라고 예상했다.

이호기 기자 hglee@hankyung.com

ⓒ 한국경제 & hankyung.com, 무단전재 및 재배포 금지