구약성서의 창세기에는 바벨탑과 관련해 일화가 실려 있다. 인간들이 높고 거대한 탑을 쌓아 하늘에 닿으려 하니 신이 분노한 나머지 원래는 하나였던 언어를 여럿으로 분리하는 저주를 내렸다고 한다. 그래서 그런지 우리가 살아가는 지구에는 겨우 226개의 국가와 지역이 있는 반면, 사용되는 언어의 수는 약 7000개에 이른다.

이 영상은 영화 <클릭>의 한 장면으로 리모컨에 자신이 원하는 언어를 입력하고 시작 버튼을 누르면 내가 설정했던 언어로 상대방이 하는 말을 바꿔준다. 아마 누구나 갖고 싶은 리모컨이겠지만 특히 여행을 좋아하거나 언어의 장벽으로 인해 좌절을 겪은 경험이 있는 사람이라면 더욱 꿈에 그리던 리모컨일 것이다.

바벨탑의 저주를 조금이나마 빨리 없애줄, 영화 속에만 나올 것 같은 기계가 현실에도 존재한다. 바로 아이플라이텍(科大讯飞)의 인공지능 번역기 샤오이(晓译)이다. 2018년 기지과인 방송 당시 샤오이는 인공신경망과 빅데이터를 이용해 학습한 어휘 대구가 2억 5천 개 정도 되며 중국어를 포함한 34개국 언어의 동시통역이 가능했다. 그리고 개발자 후위(胡郁)의 말에 의하면 통번역의 정확도가 80~85%에 달한다고 했다. 하지만 약 1년 4개월이 지난 현재, 샤오이는 약 58종류의 언어 번역 및 의료, IT, 무역 등 8개의 전문분야 언어 지원도 가능하다고 한다.

역사삼난(译事三难)

하지만 샤오이를 보는 패널들의 눈빛은 그렇게 곱지 않았다. 번역기는 오류가 많을 것이고 기본적으로 사람들의 말을 잘 이해하지 못할 것이라 생각했기 때문이다. 패널 싸베이닝(撒贝宁)은 중국어는 특히 언어유희가 많아 인공지능 번역기가 이를 캐치하기 어려울 것이라고 했다. 이에 본격 대결에 앞서 실력 확인하기 위해 샤오이를 향해 다음과 같이 장난스럽게 “别别别”을 세 번씩이나 쓰며 말했다.

“校长一再强调,胸前除了校徽别别别的。“

이 문장의 뜻은 “교장 선생님은 가슴 앞에 달린 학교 배지를 제외한 다른 것은 필요 없다고 여러 번 강조하셨다.”이다. 아래 사진은 샤오이가 번역한 것으로 문장 의미를 정확히 파악했고 심지어 싸베이닝이 말한 언어유희를 일반적인 중국어로 변환했다.

이번 샤오이 편은 대결이라기 보단 샤오이의 번역 수준을 검증하는 식으로 이루어진다. 검증은 총 두 단계로 이루어지는데 첫 번째는 다양한 외국어를 중국어로 번역하는 것이고, 두 번째는 영화 영어 대사를 중국어로 번역하는 것이다. 물론, 샤오이는 실시간 번역을 지원하기 때문에 외국어를 듣는 순간 바로 번역을 완성해낸다.

심사위원으로는 4개 국어(중국어, 스웨덴어, 러시아어, 영어)를 구사할 수 있는 영화배우 자오리신(赵立新)이 나왔다. 그는 번역 평가 기준에서 다음 세 가지를 꼽았다.

신(信) – 완벽하고 정확한 원문의 정보 전달
달(达) – 물 흐르듯 매끄럽고 논리적인 번역
아(雅) – 문맥, 격식에 맞는 우아한 번역

먼저, 첫 번째 검증에서는 각기 다른 외국어를 구사하는 CCTV 앵커 8명이 나와서 단편의 글을 각자의 언어로 읽는다. 8개 언어는 태국어, 독일어, 터키어, 아랍어, 일본어, 포르투칼어, 힌디어, 프랑스어로 독일어를 제외한 나머지 언어를 구사하는 사람들은 모두 원어민들이다.

샤오이가 이들의 말을 듣고 번역한 결과를 실제 정답과 비교했을 때, 독일어, 터키어, 일본어, 프랑스어, 포르투칼어, 힌디어에 대해선 평균 98점의 정확도를 보였다. 하지만 아랍어는 80점, 태국어는 75점으로 비교적 낮은 정확도를 보이면서 단어의 의미를 수학적 계산으로만 파악할 수밖에 없는 번역기의 한계가 드러났다. 하지만 패널들 모두 글의 전반적인 의미를 파악했기 때문에 평가 기준 “信”에 적합하다고 볼 수 있다.

두 번째 검증에는 2010년 중영 옥스퍼드 사전 편찬을 담당했던 외국인 앵커 진샤오위(金小鱼)가 검증 상대로 나온다. 그녀는 미국과 프랑스 혼혈로 샤오이와 함께 영화 <니모를 찾아서>의 대사 일부분을 번역하는 대결을 펼친다. 패널 한쉐(韩雪)와 심사위원 자오리신이 성우로서 영어 대사를 읽으면 샤오이와 진샤오위가 실시간으로 중국어로 번역을 하는 것이다. 청중들은 완성된 번역본을 보고 원문 대사와 더 어울린다고 판단되는 것에 투표를 한다.

예상했겠지만 샤오이는 두 성우가 대사를 끝마친 동시에 번역을 완성했고 진샤오위는 조금 시간이 걸렸다. 하지만 샤오이는 42표, 진샤오위는 58표를 기록하면서 ‘기계는 사람만 못하다(技不如人)’로 끝이 났다.

다음은 실제 영어 대사에 대한 진샤오위와 샤오이의 번역 결과이다. 다음 중 어느 것이 더 정확하다고 판단되는가?

영어 대사의 의미는 흐름상 “너 그만 좀 하지?”인데 이와 가까운 의미는 오른쪽의 번역이다. 오른쪽이 진샤오위가 번역한 것이고 왼쪽이 샤오이가 번역한 것으로, 샤오이는 대화 문맥, 상황에 따라 달라지는 의미 파악 면에서 아직 부족한 것으로 드러났다. 영어 대사를 상황에 맞게 다듬지 않고 그대로 직역하자면 “너 그만 둘 거니?”로 샤오이가 번역한 것이 이 의미와 가깝기 때문이다. 샤오이의 번역은 결국 평가 기준 “雅”에는 아직 적합하다 볼 수 없는 것이다.

각양각색(各样各色)

이전부터 인공지능 번역기의 번역 수준에 대한 말이 많다. 인공지능 번역기는 절대 사람 번역가의 수준을 뛰어넘을 수 없어 결국은 인공지능 번역기가 그렇게 유용하게 쓰일 것이라 생각하지 않는다. 하지만 인공지능 번역기는 앞으로 더욱 활발히 이용될 것이고 자연어 처리(NLP) 기술이 발전함에 따라 그 효과 또한 좋을 것이다. 이에 드래곤아이는 다음 네 사람들과 인터뷰를 진행했고 인공지능 번역기의 필요성을 확인할 수 있었다.

세계 포럼 기획자 황모 군: 세계의 유명 연사들을 초청하는 포럼 자리에는 통역기가 필수입니다. 공식 언어는 영어로 진행되지만 참석자들 중 영어와 친숙하지 않은 분들도 있고 연사 분들도 발음 문제가 있기 때문입니다. 여태까지 여러 명의 사람 통역가를 모집하여 수동으로 실시간 통역 작업을 시켰는데 그 효과는 그렇게 좋지 않았습니다. 자연, 과학, 기술 방면의 전문 용어 같은 경우 통역가들도 어려워하고 대부분 외래어로 처리해서 통역하기 때문에 참석자들이 여전히 이해하기 힘들었죠. 오히려 전문 분야 단어를 수집하고 학습한 인공지능 통역기가 있다면 더 효과적일 것 같습니다. 물론 사람 통역가를 부를 필요가 없으니 노동 자본도 감소할 것입니다.

드라마·영화 자막 번역가 이모 양: 평균 20~30편 분량의 드라마, 평균 2시간가량의 영화 자막을 번역하려면 굉장히 많은 시간이 필요합니다. 사실 쉬운 어구나 문장 같은 경우에는 단순노동이라 볼 수도 있습니다. 굳이 사람의 손을 거칠 필요가 없는 것들이죠. 제가 처음부터 끝까지 번역을 다 하기보다는 인공지능 번역기가 빠르게 모든 대사를 처음 번역한 후에 제가 검수하는 식으로 하면 업무 효율성이 훨씬 좋을 것 같습니다.

중국 유학생 이모 군: 유학생이면 기숙사에 사는 게 더 안전하고 좋겠지만, 자취에 대한 로망이 있어 기숙사를 뛰쳐나왔습니다. 근데 자립에 대한 준비가 너무 안 된 것일까요? 저는 방에서 그냥 잠만 자는 것 같은데 아랫집에서 제가 자꾸 쾅쾅 뛴다면서 층간 소음 때문에 스트레스를 많이 받는다고 자주 올라와서 소리치시네요. 이런 상황 때마다 당황해서 아는 말도 안 들리고 하고 싶은 말도 안 나옵니다. 이럴 때마다 번역기의 도움을 빌리고 싶은 마음이 굴뚝같습니다.

배낭 여행객 전모 군: 여행을 갔는데 핸드폰을 도둑맞았습니다. 핸드폰에 번역기, 지도 등 모든 것을 의존해왔는데 아무것도 없이 분실 신고를 위해 경찰서에 가야 한다니 막막합니다. 가장 문제인 것은 핸드폰이 없으니 의사소통이 하나도 이뤄지지 않는다는 것입니다. 제 말을 알아주고 이해해주는 사람이 없어 너무 절망적입니다. 대사관이 이런 사소한 분실 신고에 관심을 가져줄지도 의문이고, 도와준다 하더라도 시간이 얼마나 걸릴지 모르겠습니다. 이럴 때 번역기의 소중함을 절실히 느낍니다.

인쇄하기

이전
다음
1+

소요 사이트를 방문해주셔서 고맙습니다. 액수에 관계없이 여러분의 관심과 후원이 소요 사이트를 유지하는 데 큰 힘이 됩니다. 후원금은 협동조합 소요 국민은행 037601-04-047794 계좌(아래 페이팔을 통한 신용카드결제로도 가능)로 후원하실 수 있습니다.