IT DONGA

인공신경망을 만난 구글 번역, 그 성능과 활용도는 얼마나 발전했을까?

남시현

[IT동아 남시현 기자] 사람이 진행하는 번역이 빠르고 완성도가 높은 것은 당연하지만, 비용이 많이 들고, 전문적인 분야, 혹은 너무 간단한 내용까지 맡기기는 곤란하다. 기계의 힘을 사용해 외국어를 번역하려는 노력이 계속해서 이어져 온 이유다. 하지만 2016년 이전의 기계 번역은 단어나 구절을 나눈 후, 사전적 어원을 끌어다 보여주는 게 고작이었다. '운동화끈' 이라는 단어를 검색하면, 운동/화끈으로 나눈 후 'Exercise hot'으로 알려주는 식이었으니 문장은커녕 단어를 파악하기도 힘들었다.

하지만 2016년 11월 15일, 구글이 한국어, 영어, 중국어, 프랑스어, 스페인어, 일본어, 터키어 등 8개에 대한 인공신경망 번역을 적용하겠다고 발표한 이후, 번역기의 성능이 비약적으로 향상됐다. 과거 방식이 검색 기반이었다면, 인공신경망은 문장 자체의 의미를 학습해 번역한다. 운동화끈을 검색하면 관련 단어가 사용된 자료나 문장 등 분석한 다음 결과를 내놓는다. 이후 번역기 제조사들이 앞다퉈 인공 신경망을 도입하게 되며 번역기 성능이 상향 평준화되었다.

세계 최대 검색엔진 구글이 만든 번역기, 현재 성능은 어느 정도?

번역 기술과 성능의 선두 주자는 역시 구글이다. 구글은 번역기와 인공지능, 소프트웨어 등 번역기 제작과 배포에 관련된 모든 부분을 직접 처리할 수 있는 유일한 기업이다. 성능도 높고 활용할 수 있는 방안도 많다. 인공신경망 적용 후 3년이 지난 지금, 구글 번역기의 성능과 입지는 어디까지 왔을까?

한글과 영어는 어순이 달라 매번 번역이 거꾸로 됐는데, 이런 부분까지 개선됐다.

구글 번역을 통해 구글에 대한 설명 문구를 번역해봤다. 사람이 번역한다면 '웹페이지, 이미지, 비디오 등을 포함한 전 세계의 정보를 검색하십시오. 구글은 당신이 원하는 것을 정확히 찾는 데 도움이 될 많은 특수 기능들을 갖고 있습니다.' 정도겠는데, 구글 번역 역시 '웹 페이지, 이미지, 비디오 등을 포함한 세계 정보를 검색하십시오. Google에는 원하는 것을 정확하게 찾는 데 도움이되는 많은 특수 기능이 있습니다.'라는 결과를 내놓았다. 문맥을 이해하는 데 무리가 없고, 역으로 번역하는 성능도 상당하다.

신문 기사나 논설 정도는 번역해서 읽어도 이해에 무리가 없다.

간단한 웹사이트나 신문, 논설, 백과사전 등에 자동 번역을 적용하면, 필자가 글에 담은 뜻을 충분히 이해할 수 있는 수준이다. 예시로 번역한 기사 역시 쉬운 내용이 아니지만, 이해할 수 있는 수준의 완성도로 번역됐다. 해당 기능은 구글 크롬에 자체적으로 포함된 번역 기능이나, 구글 검색 시 '이 페이지 번역하기'로 창을 불러오면 된다. 이 부분에서의 한계점은, 시나 소설 같은 문학 작품은 원문 그대로의 뜻을 살리지 못하고 단지 이해할 수 있는 수준의 결과만 제공한다는 점이다.

다의어로 인한 오류도 크게 잡아냈다. 물론 글쓴이가 표준에서 벗어나는 의도로 작성하면 문장이 다르게 읽혀질 순 있다.

다의어에 의해 문장의 뜻이 의도한 바와 다르게 번역되는 경우는 아직도 여전하다. 이 부문은 문장의 앞뒤 문맥이나, 글쓴이의 의도에 따라 변할 수 있는 것이기 때문에 인공신경망이 발전해도 쉽게 해결되기 어려운 부분이다.

그래서 구글 번역의 경우, 해당 단어를 드래그해 해당 문장에 맞는 다른 의미로 바꾸거나, 문장 자체를 수정·교정할 수 있다. 단어 뜻을 변경하면, 번역기가 다시 한번 동작해 수정된 문장을 보여준다. 데이터가 많을수록 정확도가 상승하는 인공신경망 특성상, 초반에는 다의어로 인한 번역 오류가 제법 있었지만 이제 일상 회화 수준에서 다의어로 인한 오류는 상당히 줄어들었다.

구글 번역을 통해 증강 현실로 번역한 예시, 좌측이 영->한이며 우측은 처음부터 한국어로 된 문장이다.
<구글 번역을 통해 증강 현실로 번역한 예시, 좌측이 영->한이며 우측은 처음부터 한국어로 된 문장이다.>

인공신경망이 적용되면서부터 가장 체감이 되는 부분은 언어 자동 인식이다. 2016년 이전만 하더라도 번역 기능을 이용하기 위해서는 번역할 문장이 무슨 언어로 쓰였는지 알아야 했고, 또 텍스트를 입력해야만 했다. 만약 무슨 언어인지 모르거나, 텍스트를 입력할 방법이 없다면 번역을 시도하기 어려웠다.

현재 구글 번역은 스스로 문맥과 단어를 인식해 자동으로 무슨 언어인지 파악하고, 그에 맞는 번역 결과를 자동으로 제공한다. 구글 렌즈나 구글 어시스턴트, 구글 번역의 카메라 기능을 활용해 촬영하면 언어의 종류를 자동으로 파악해 번역해준다.

주의할 점도 있는데, 인공신경망을 통한 번역은 광학문자판독 방식을 채택해 컴퓨터, 프린터를 거친 글씨만 인식한다. 간판이나 제품 레이블, 광고, 컴퓨터 화면 등은 실시간으로 번역할 수 있으나, 손글씨나 훼손·변형된 문자는 읽을 수 없다.

2016년 인공신경망 적용 이후, 번역기의 번역 완성도와 이해도가 수직상승한 것은 확실하다. 한글과 일본어, 영어나 스페인어처럼 어순이 같은 문자는 실시간 번역으로 대화를 나눌 수 있는 수준에 이르렀다. 잘 모르는 외국어가 있다면, 고민하지 말고 구글 번역의 자동 감지와 문자 번역을 활용하도록 하자.

글 / IT동아 남시현 (sh@itdonga.com)

이전 다음