배링랩 기계번역 올림픽에서 1위…어떤 점 다른가 살펴보니

베링랩 로고

[비즈리포트] 김용후 기자 =베링랩(Bering Lab) 주식회사가 2020년 제5회 기계번역대회(WMT20)에서 참여한 2개 부문에서 각각 1위와 2위를 차지했다. 베링랩은 품질 예측(Quality Estimation) 부문 중 단어 단위 사후 교정(Word-Level Post-editing Effort)과 문장 단위 사후 교정(Sentence-Level Post-editing Effort)에 참여하여, 단어 단위 사후 교정에서는 1위, 문장 단위 사후 교정에서는 2위를 기록하였다.

국제음성언어번역워크숍(IWSLT)와 함께 글로벌 양대 기계번역 대회로 꼽히며 인공지능(AI)기계번역의 올림픽이라고도 알려진 WMT에는 전세계 인공지능 기계번역 연구자들이 참석하여 인공지능 기계번역 기술의 최신 트렌드를 경험함과 동시에 자신의 실력을 뽐내 왔다. 올해로 15년째를 맞은 WMT20에는 전세계 IT회사, 연구기관 및 대학을 포함한 50개 이상의 팀이 참여하였다.

2020년 인공지능 기계번역 기술과 관련하여 주목해야 할 주요 트렌드 중 하나로 꼽히는 품질 예측 기술은 인간의 도움 없이 기계번역 결과물의 각 단어 또는 문장 별로 해당 단어 또는 문장이 잘 번역되었는지 여부에 대한 측정치를 제시하는 기술로서, 이러한 기술의 발전은 필연적으로 발생할 수 밖에 없는 기계번역의 오류를 빠르고 안정적으로 식별해 낼 수 있다는 게 베링랩 측 설명이다.


베링랩은 단어 단위 사후 교정 부문에서는 0.597점을 기록하여 0.583점을 기록한 화웨이의 Translation
Service Center(TSC)를 제치고 1위를 차지하였고, 문장 단위 사후 교정 부문에서는 0.723점을
기록하여 0.758점을 기록한 화웨이에게 아깝게 1위를 내주고 말았다. 두 부문에서 3위를 기록한
NiuTrans는 각각 0.500, 0.649점을 기록했다.


특히, 이번 입상은 NiuTrans, 일본 NICT(국립 정보통신연구기구), Unbabel과 같은 세계 굴지의 AI번역
업체와 연구소 외에도 화웨이와 같은 세계적인 대기업의 연구팀을 상대로 베링랩 이동준 CTO(Chief
Technical Officer) 혼자 이뤄낸 것이라는 점에서 더욱 의미를 가진다.


이번 입상의 의미에 대해 이동준 CTO는 “이번 대회에 대비해서 다국어 언어 모델(cross-lingual
language model)인 XLM-R을 기반으로 품질 예측에 최적화된 인공신경망 모델을 설계하였고, 이
모델의 학습을 위해 주어진 데이터셋 외에도 추가적으로 대량의 품질 예측 데이터셋을 인공적으로
생성하여 투입한 것이 주효하였던 것 같습니다. 이번에 개발한 품질 예측 기술을 통하여 단순
기계번역을 넘어서, 사람이 쉽게 기계번역문을 검수하고 최종 결과물을 얻을 수 있는 end-to-end 번역
툴 개발에 기여할 수 있기를 기대한다”고 말했다.

bizreport

Read Previous

도시청년,목포서 창업 날개짓…서울시’넥스트로컬’

Read Next

스캐터랩, 대량의 한국어 데이터를 이용한 오픈 도메인 대화생성 모델개발 과정 공개

Leave a Reply

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다