코스피

2,564.63

  • 1.12
  • 0.04%
코스닥

733.52

  • 9.79
  • 1.32%
1/3

소강춘 국립국어원장 "인공지능에 활용할 말뭉치 구축에 내년 200억원 투입"

페이스북 노출 0

핀(구독)!


글자 크기 설정

번역-

G언어 선택

  • 한국어
  • 영어
  • 일본어
  • 중국어(간체)
  • 중국어(번체)
  • 베트남어

“200억원의 예산을 투입해 현재 2억 어절인 말뭉치를 내년 10억 어절까지 늘려가겠습니다.”

소강춘 국립국어원장은 6일 서울 광화문 한 식당에서 기자간담회를 갖고 인공지능(AI) 관련 서비스 개발의 기반이 되는 말뭉치 구축 계획을 설명했다. 1989년부터 전주대 국어교육과 교수로 재직해온 소 원장은 지난 8월 국립국어원장으로 취임했다.

말뭉치란 텍스트를 컴퓨터가 읽을 수 있는 형태로 수집하고 분류해 놓은 언어 자료를 말한다. 말뭉치 구축을 위해서는 텍스트의 저작권 계약을 비롯해 각 단어가 쓰인 맥락을 파악하고 형태소별로 구별해 컴퓨터에 인식될 수 있도록 태그 작업을 해야 한다.

정부는 1998년 ‘21세기 세종계획’으로 말뭉치 구축에 나섰다. 2007년까지 2억 어절을 확보했지만 이후 10년 간 예산 지원이 끊기면서 중단됐다. 하지만 알파고 같은 AI의 학습 기능이 부각되고 아마존이 음성인식 스피커 ‘알렉사’를 내놓으면서 말뭉치의 중요성이 다시 주목받기 시작했다. 연간 예산이 140억원 남짓인 국립국어원에 내년 말뭉치 관련 예산만 별도로 204억원이 확정된 이유다. 소 원장은 “학습된 말뭉치의 양이 많을수록 기계는 똑똑해진다”며 “10억 어절을 확보해도 미국(3000억 어절)뿐 아니라 중국(300억~800억 어절)이나 일본(150억 어절)에 미치려면 갈 길이 멀다”고 말했다. 국립국어원은 향후 10년 간 150억 어절의 말뭉치를 구축한다는 중장기 계획을 세워뒀다. 소 원장은 “언어는 계속 변화하고 새로 생긴다”며 “일회성이 아니라 꾸준히 작업을 지속해가야 한다”고 말했다.

소 원장은 말뭉치 구축뿐 아니라 국어대사전을 보완하고 어려운 공공기관의 용어들을 다듬는 작업도 해 나갈 방침이다. 겨레말큰사전 편찬을 지원하고 내년 10월엔 2009년 이후 중단됐던 남북 공동 국제학술회의도 여는 등 남북 언어 통합을 위한 작업들도 추진할 예정이다. 소 원장은 “언어 통합은 중요한 문제지만 남북 교류 상황을 고려하고 관게 부처와의 협의도 필요하다”며 “미세한 부분부터 조정해갈 것이 많다”고 말했다.

윤정현 기자 hit@hankyung.com



- 염색되는 샴푸, 대나무수 화장품 뜬다

실시간 관련뉴스