UPDATED. 2024-04-23 15:17 (화)
[제114호]인공지능이 허무는‘언어의 장벽’
상태바
[제114호]인공지능이 허무는‘언어의 장벽’
  • 음소형 기자
  • 승인 2017.04.07 13:34
  • 댓글 0
이 기사를 공유합니다

자동번역기 활용한 능력검정시험에서 부터 증강현실 적용한 인공지능 번역 등

[소비라이프 / 음소형 기자]해외여행을 떠나기 전 많은 사람들이 가장 두려워하는 것이 바로 ‘언어’ 문제일 것이다. 현지인과의 대화뿐 아니라 각종 안내문과 표시판, 길거리의 간판들…. 낯선 나라에서는 잘 알고 있던 영어 단어조차 제대로 읽히지 않을 때도 있다. 하지만 인공지능과 스마트폰, 증강현실(AR; Augmented Reality)의 발전으로 언어를 번역해주고 간판의 글자를 읽어주며 대화를 나눌 수 있도록 돕는 세상이 머지않아 도래할 것으로 기대되고 있다.

 

아직 인공지능 번역은 전문 번역가의 번역에 비해 완성도가 떨어지지만, 빅데이터 수집과 딥러닝 방식으로 점차 품질을 개선해나간다면 지구촌 시대에서 더 이상 ‘언어 장벽’은 없을지도 모른다.

문맥 파악하고 번역하는 ‘NMT’

기존 번역 서비스의 방식은 통계기반 기계번역인 ‘SMT(Statistical Machine Translation)’ 위주였다. SMT는 단어가 가진 여러 가지의 의미를 번역 엔진에 저장해놓고 문장을 단어 단위로 나눈 다음 통계적 확률에 기반을 두고 가장 유력한 뜻으로 번역하는 방식이다. 하지만 이는 문장의 연결이 어색하다는 단점이 있었다. 이러한 SMT의 단점을 극복하기 위해 ‘단어’ 대신 ‘문맥’을 파악해 번역하는 방식이 번역 기술에 도입됐다.

인공지능 기술을 기반으로 하는 자동통역 앱 ‘파파고(Papago)’를 출시한 ‘네이버’는 지난해 10월 인공신경망 번역방식인 ‘NMT(Neural Machine Translation)’을 한국어-영어 번역방식에 도입한 데 이어 한국어-중국 번역 지원을 지난해 12월부터 시작했다. NMT는 인공지능이 스스로 학습하는 딥러닝 방식으로 데이터 학습을 통해 언어를 번역하는 기술로써, 단어나 구 단위의 번역기술인 SMT와 달리 전체 문장의 맥락을 파악한 후 번역하기 때문에 더욱 자연스러운 번역이 가능하다. 예를 들어 ‘나는 배 위에서 배가 아팠다’라는 말을 번역하고자 할 때 ‘배’가 선박을 뜻하는 ‘ship’인지 복부를 뜻하는 ‘stomach’인지를 문맥의 흐름을 파악해 번역한다.

NMT 방식을 번역에 도입한 업계는 네이버 외에 미국의 ‘구글’과 중국의 ‘바이두’, 그리고 국내의 ‘한글과컴퓨터’ 등이 있다. 이세돌 9단과의 바둑 시합에서 승리를 거둔 알파고를 개발하며 앞선 AI 기술을 전 세계에 알린 바 있는 구글은 현재 번역 서비스를 제공 중인 103개 언어에 NMT 방식을 모두 도입하는 것을 목표로 하고 있다. 국내 IT기업인 ‘한글과컴퓨터’는 인공지능기반 통번역 서비스 ‘한컴 말랑말랑 지니톡’에 NMT 방식에 문법기반번역(RBMT)기술을 하이브리드로 적용했다. ‘지니톡’은 2018 평창동계올림픽 공식 번역 소프트웨어로 선정돼 선수들과 기자단의 통번역 서비스를 담당한다.

자동번역기 활용한 능력검정시험

 

대화의 번역과 달리 문학작품 번역의 경우 또 하나의 ‘창작’에 가깝기 때문에 아직 인공지능을 활용한 자동번역이 전문 번역사만큼 정확하게 번역하려면 상당한 시간이 걸릴 것으로 보인다. 하지만 자동번역은 번역 속도가 매우 빠르다는 강점이 있다. 전문가들은 먼 미래에는 자동번역기가 모든 것을 번역할지 모르지만, 가까운 미래에는 자동번역기와 사람이 힘을 합쳐 번역하는 시대가 될 것으로 예측하고 있다.

ITT통번역 시험을 주관하고 있는 국제통번역협회는 하반기 ITT시험부터 자동번역기를 활용한 번역시험 시행을 기획하고 있다고 밝혔다. 자동번역기를 활용해 초벌 번역을 진행한 후 문맥이 맞지 않거나 가독성이 떨어지는 부분을 사람이 재번역해 최종 번역문을 작성하는 방식으로 진행될 예정이다.

증강현실과 만난 인공지능 번역

다국어 자동 통번역 지원 업체인 ‘시스트란 인터내셔널’(이하 시스트란)과 국내 집단지성 번역 플랫폼 ‘플리토’은 지난해 12월, 기술 협약을 체결했다. 플리토는 이번 협약을 통해 시스트란의 인공지능 언어처리 플랫폼 ‘SYSTRAN.io API’를 활용해 증간현실(AR) 번역 서비스에 활용할 계획이다. 증강현실 번역서비스 표지판이나 안내판, 메뉴판 등의 이미지를 스마트폰 카메라로 비추면 바로 번역해 결과물을 보여준다. 이러한 증강현실을 이용한 번역은 관광지나 지방자치단체 등에 도입될 예정이다.

방대한 내용의 고전문헌 번역에도 도입

조상들의 남겨진 문헌들도 인공지능을 활용해 번역이 이뤄질 것으로 보인다. 미래창조과학부와 한국정보화진흥원은 지난

2월 27일, 서울 대한상공회의소에서 ‘2017년도 ICT기반 공공서비스 촉진사업 설명회’를 개최하고 올해 211억 원을 지원하겠다고 밝혔다. 그중 한국고전번역원의 딥러닝 기반의 ‘인공지능 기반 고전문헌 자동번역시스템 구축’ 사업을 지원한다. 고전 번역의 첫 대상은 세계 최대의 역사기록물이자 우리나라 국보 제303호인 《승정원일기》가 선정됐다. 조선 시대 왕명의 출납을 관장하던 승정원의 기록이 담긴 《승정원일기》는 총 3,243권, 2억 4,250만 자짜리 책으로, 지난 1994년부터 번역을 시작해 2062년에 완료될 것으로 예상했으나, 이번 사업을 통해 27년을 단축하고 2035년에 번역이 완료될 것으로 기대되고 있다. 한국고전번역원은 《승정원일기》로 학습된 인공지능을 통해 《일성록》 등 우리나라 고전 문헌의 인공지능 번역을 확대할 계획이다.

인공지능 번역을 활용해 현시대의 언어와 글자를 번역하는 일은 기존에도 계속됐으나 고전문헌을 번역하는 것은 이번이 세계 최초이다. 우리나라는 그동안 전문 고전 번역자 수에 비해 고전 자료가 너무나 방대하기 때문에 번역하는 데 어려움이 많았다. 인공지능 번역이 고전문헌 번역에도 도입이 된다면 조상들이 남긴 유산을 이해하고 더욱더 활용할 수 있을 것으로 보인다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.