업스테이지 논문 2편, 자연어 처리 방법론 학회에 채택

입력 2023-10-23 08:51
업스테이지 논문 2편, 자연어 처리 방법론 학회에 채택



(서울=연합뉴스) 홍국기 기자 = 인공지능(AI) 스타트업 업스테이지는 자사가 작성한 논문 2편이 세계 3대 자연어 처리 학회인 '자연어 처리방법론 학회'(EMNLP)에 채택됐다고 23일 밝혔다.

논문은 한국어 관련 자연어 처리(NLP) 연구 성과로, 업스테이지의 박찬준 기술팀장(테크 리드) 주도로 고려대 임희석 교수 연구팀과 협업을 통해 진행됐다고 업스테이지는 소개했다.

이 중 한국어 음성 인식 후처리기와 관련한 새 벤치마크 데이터 세트를 구축한 논문(KEBAP: Korean Error Explainable Benchmark Dataset for ASR and Post-processing)은 음성 인식 모델의 약점을 평가·식별하기 위한 새 평가 방법론을 제안한다.

한국어의 특성을 살린 새 데이터 증강 기법을 제안한 다른 논문(CHEF in the Language Kitchen: A Generative Data Augmentation Leveraging Korean Morpheme Ingredients)은 한국어의 특성에 기반한 새 데이터 증강 방법론(CHEF)을 통해 같은 재료로도 자연스러운 문장을 생성하고 생성형 언어 모델이 한국어 형태소 조합을 다양하게 변형해 데이터를 증강하는 방법론을 제안한다고 회사는 설명했다.



redflag@yna.co.kr

(끝)

<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>