에너지경제 포토

류세나 기자

cream53@ekn.kr

류세나 기자기자 기사모음




'번역 후발주자' 카카오, 차별화 승부수…존댓말 번역기 내놓는다

에너지경제신문   | 입력 2018.02.21 15:37
[카카오_이미지자료] AI 미디어스터디_번역엔진_배재경파트장

▲배재경 카카오 AI부문 컨텍스트파트장. (사진=카카오)


[에너지경제신문 류세나 기자] 카카오가 AI 플랫폼 ‘카카오 아이(I)’ 기반의 번역 서비스를 본격적으로 고도화해 나간다.

이달 말 지원 언어 확장과 번역 챗봇 론칭에 이어 상반기 중에 국내 번역기 중 처음으로 예사말과 존댓말을 구분하는 문체 인식 기능도 선보일 계획이다.


◇ ‘예사말vs존댓말’ 기능 국내 첫 도전

배재경 카카오 AI부문 컨텍스트파트장은 21일 서울 용산구 카카오 한남오피스에서 열린 AI 미디어 스터디에서 카카오I의 번역엔진 기술을 설명하며 향후 계획도 함께 밝혔다.

현재 카카오가 제공하고 있는 번역 서비스는 일반적으로 접할 수 있는 번역기 수준으로, 그간 카카오는 경쟁서비스인 네이버나 구글에 비해 출발이 다소 늦다는 평가 받아왔다.

이에 카카오는 ‘좋은’ 번역 서비스를 제공하기 위해 빠른 속도로 기술력 강화에 매진해 온 것으로 전해진다.

같은 양의 학습 데이터를 확보했더라도 그 데이터를 얼마나 기계 번역이 쉬운 문장 단위로 정렬(가공)할 수 있는 지가 관건인데, 카카오는 딥러닝 기반으로 학습 데이터를 문장 단위로 정렬해주는 툴의 일종인 ‘블루 얼라인(BLEU align)’을 직접 개선한 ‘에이블루 얼라인(ABLEU align)’ 번역 서비스에 활용했다.

이를 통해 기존 블루 얼라인이 다른 뜻으로 집계하는 ‘이쁘다’, ‘예쁘다’ 등의 유사어들도 같은 내용으로 이해, 글과 문장을 활용할 수 있게 하는 등 번역의 정확도와 품질을 끌어올렸다는 게 배 파트장의 설명이다.

그는 "카카오는 양질의 학습 데이터 확보와 함께 가장 우수하다고 알려진 신경망 모델을 기반으로 최적화 작업을 거친 모델을 사용하고 있다"며 "이를 통해 카카오 번역은 다의어 및 장문 번역에서 높은 정확도를 가지게 됐다"고 말했다.

이어 "이달 말 카카오 플러스친구 형태로 카카오I 번역 챗봇을 출시할 계획"이라며 "앞으로 카톡에서 대화하듯 번역 서비스를 이용할 수 있다"고 덧붙였다.

다만 초기엔 플러스친구 형태로 서비스가 지원된다는 점에서 카카오톡에 등록된 친구와의 실시간 외국어 대화는 아직까지 어렵다.


◇ 챗봇·전용앱 출시…API도 외부에 공개

카카오는 지난해 9월부터 카카오I의 번역 엔진을 적용한 온라인·모바일 기계 번역 서비스를 제공해왔다. 현재는 영어만 지원되고 있지만 챗봇이 출시되는 시점 즈음부터는 일본어와 중국어도 지원언어로 추가할 예정이다.

상반기 내 도입을 목표로 하고 있는 예사말, 높임말 구분 번역 기능은 국내 번역기 중 처음으로 시도하는 시스템이다. 카카오 측은 앞으로 이용자들은 다양한 상황에 맞는 번역 결과를 확인할 수 있게 될 것으로 기대하고 있다.

또 연내 ‘구글 번역’ 앱이나 네이버의 ‘파파고’처럼 전용 번역 앱도 내놓는다. 텍스트를 통한 번역은 물론 목소리, 사진을 활용한 번역 기능도 제공될 예정이다.

특히 카카오는 카카오I 플랫폼 자체를 외부 서비스 및 제품과도 연동할 수 있는 오픈형 플랫폼으로 성장시키는 것을 목표로 하고 있는 만큼 번역엔진 API도 개인 및 기업들에게 개방하겠다는 구상이다.

이에 앞서 카카오톡, 카카오미니, 카카오TV 등에 번역엔진을 적용, 활용방안들을 제시해 나갈 예정이다. 유명 미국드라마 등 양질의 해외 콘텐츠에 자막 기능을 제공하거나, 반대로 국내 연예 콘텐츠에 외국어 번역을 입혀 한류 문화 확산을 돕겠다는 구상도 하고 있다.

배 파트장은 "자체 테스트 결과 중한-한중 번역은 국내 번역기 중 가장 높은 성능을 보였고, 일한-한일 번역은 가장 잘하는 경쟁사와 비슷한 수준으로 나왔다"고 말했다.

이어 "AI에서는 번역 기술이 원천 기술에 해당되는데 이러한 번역엔진은 단순히 번역의 영역에 그치는 것이 아니라 뉴스기사 요약, 대화 모델 등 자연어를 다루는 수많은 분야에 적용할 수 있다"며 "다수의 업체들이 번역 기술 연구에 집중하고 있는 것도 이러한 확장 모델을 염두에 둔 행보"라고 덧붙였다.

끝으로 그는 "앞으로도 더 넓은 문맥정보를 활용, 정확한 번역 결과값을 내놓기 위한 연구를 이어갈 것"이라고 강조했다.

배너