코스피

2,469.07

  • 52.21
  • 2.16%
코스닥

689.55

  • 4.13
  • 0.60%
1/3

<위클리 스마트> '비선실세 국정농단' 정확히 통역하는 앱은

페이스북 노출 0

핀(구독)!


글자 크기 설정

번역-

G언어 선택

  • 한국어
  • 영어
  • 일본어
  • 중국어(간체)
  • 중국어(번체)
  • 베트남어
<위클리 스마트> '비선실세 국정농단' 정확히 통역하는 앱은

신경망 방식 파파고, 들리는 대로 알파벳 나열…"개선 여지 많아"

'통계+문법' 기반의 지니톡, 상대적으로 정확



(서울=연합뉴스) 한지훈 기자 = 변호사 김모(35)씨는 외국인 클라이언트와 만난 자리에서 최순실씨 사건이 화제로 떠오르자 스마트폰을 꺼내들고 얼마 전 TV 광고에서 본 스마트폰 통역 애플리케이션을 띄웠다.

이 사건의 핵심은 '비선실세 국정농단'이라는 말로 요약된다고 설명하고 싶어서 통역 앱에 대고 "비선실세 국정농단"이라고 또박또박 발음한 김씨는 황당한 결과를 얻었다.

앱에서 "Biseon silse gukjjeong nongdan"이라는 말이 여성 목소리의 영어식 발음으로 흘러나왔기 때문이다. 우리말을 들리는 대로 받아적은 영문 알파벳을 나열하고 그냥 읽은 것이다.

스마트폰 화면을 들여다보던 외국인 클라이언트가 어리둥절한 표정을 지었다.

파파고가 김씨의 음성을 정확히 인식하고도 전혀 통역하지 못한 것은 이 앱이 인공 신경망 번역(Neural Machine Translation·NMT) 알고리즘을 사용하기 때문이다.

파파고가 자랑하는 NMT 방식은 사람들이 자주 사용하는 단어를 수동으로 입력하는 통계기반 번역(Statistical Machine Translation·SMT)과 달리 특정 데이터를 자동으로 학습한다.

예를 들어 한국어와 영어로 된 백과사전이나 제품 설명서, 영한·한영사전 등 이미 전문가에 의해 정확히 번역된 데이터를 학습하며 자체 통·번역 수준을 높이는 방식이다.

구체적으로 어떤 데이터를 사용하는지는 회사마다 대외비로 공개하지 않는다.

만일 파파고가 학습한 데이터 가운데 '비선실세'나 '국정농단'이라는 말뭉치의 등장 빈도가 임계치를 넘지 못했다면, '알려지지 않은'이라는 뜻의 'UNK'(Unknown)로 분류돼 실제 통·번역에는 활용되지 않는다.

아울러 SMT가 지난 10년 동안 데이터를 누적한 것과 달리 NMT는 학습 경험이 1∼2년에 불과하다.

NMT는 전체 문맥을 고려해 문장을 통째로 번역하므로 결과가 SMT보다 자연스러운 경우가 많다는 평가를 받지만, 알고리즘이 아직 충분히 고도화됐다고 보기 어려운 측면이 있다.

파파고를 운영하는 네이버 관계자는 "NMT가 기술적으로 완벽한 수준은 아니지만, 개선 여지가 많다"며 "파파고도 그런 측면에서 오픈 베타 서비스로 운영하고 있다"고 설명했다.

구글 등 NMT를 적용한 다른 앱도 대부분 '비선실세 국정농단'을 번역하지 못했다.

다만 SMT와 규칙기반 번역(Rule Based Machine Translation·RBMT)을 함께 사용하는 한컴인터프리의 '지니톡'은 이를 'The real force national administration monopoly'로 어느 정도는 뜻이 통하게 통·번역해냈다.

지니톡은 기존의 SMT에 외국어 문법 규칙을 기반으로 한 RBMT를 추가해 '하이브리드' 알고리즘을 사용한다.

한컴인터프리 관계자는 "SMT와 RBMT를 얹은 하이브리드만으로도 탁월하지만, 올해 1분기 중 NMT까지 가동할 것"이라며 "긴 호흡으로 꾸준히 데이터를 업데이트하고 관리해 품질을 개선할 계획"이라고 말했다.


hanjh@yna.co.kr

(끝)




<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
- 염색되는 샴푸, 대나무수 화장품 뜬다

실시간 관련뉴스