번역 메모리 기술의 미래는 어떨까요?

카밀 아빌라 2019년 2월 19일 10분 읽기

이 블로그의 1부에서 번역 메모리(TM)의 역사와 트라도스가 수년간 개발 측면에서 접근한 방법을 설명하였습니다. 2부에서는 번역 메모리 기술이 향후 발전하여 나타날 결과를 보다 미래 지향적인 관점으로 살펴보고자 합니다.

이를 위해 트라도스 내 분야별 전문가 두 명을 모셨습니다. 번역 업계의 노련한 베테랑인 대니얼 브록만 제품 관리부 이사, 소프트웨어 개발 및 번역 전문 지식을 갖춘 케빈 플래너건 수석 연구 엔지니어입니다.

대니얼과 케빈에게 TM이 미래 맡게 될 역할에 대한 의견을 물었습니다. 먼저 가장 인기 있는 주제인 인공 지능(AI)을 선택했습니다.


앞으로 번역 메모리를 통해 AI가 어떤 역할을 할 수 있다고 생각하십니까?

대니얼: AI와 머신 러닝은 시리(Siri)와 알렉사(Alexa), 자율 주행 자동차부터 개인 건강 추적에 이르기까지 모두가 이야기하는 주제이며 AI는 빠르게 발전하고 있습니다. 트라도스는 2016년에 혁신적인 자체 학습 적응형 기계 번역 기술을 출시하는 등, 이미 머신 러닝에 대해 경험이 있습니다. 하지만 번역 메모리에 어떤 의미가 있는지 의문이 생깁니다. AI가 번역 생산성을 한 차원 높여 CAT 툴의 정의 그 자체에 변화를 주는 시나리오가 나타날 가능성이 있습니다.

여기서는 번역 제안 사항이 개선되는 면을 볼 수 있습니다. 예를 들어 번역 메모리, 용어집, 기계 번역(MT) 결과를 결합하여 처음부터 번역하는 것이 아니라 항상 최상의 일치 항목을 얻은 뒤 검토한다고 가정해 보겠습니다. 이 사례로는 특정 분야별 영역에서 대규모 TM과 용어집으로 MT 번역 엔진을 훈련하여 특정 사용 사례에 맞게 MT 품질을 더욱 높일 수 있습니다. 또는 번역 메모리와 용어집 콘텐츠를 이용해 MT 결과를 증강하여 두 장점을 모두 결합하는 것입니다.

어떤 경우든 그 목적은 인간 번역가를 대체하기보다는 지원하여 번역 프로세스를 보다 효율적으로 감독하고 초기 결과를 더욱 세부적으로 조정하는 것입니다.

케빈: AI는 번역가 생산성의 핵심 활용 사례 외에도 TM 분석을 수행하고 새 프로젝트와 가장 관련이 높은 TM을 인식하여 프로젝트 효율성을 높일 수 있습니다. 여러 프로젝트와 리소스를 동시에 처리하는 프로젝트 매니저의 경우 이는 프로젝트 공급망을 통해 콘텐츠를 보다 효율적으로 라우팅하도록 지원하는 중요한 역할을 할 수 있습니다.


향후 번역 메모리는 클라우드에서 어떻게 작동하며 어떤 이점이 있을까요?

대니얼: 클라우드 기반 TM 작업 방식은 공급망의 모든 참여자에게 새롭고 놀라운 가능성을 제공합니다. 마지막으로, 번역회사를 통해 협업해서 쉽게 자산을 공유할 수 있는 프리랜서 그룹부터 대규모 번역 프로젝트를 추진하는 대기업에 이르기까지 TM 공유가 대중화되고 누구나 누릴 수 있게 될 겁니다. 이러한 작업 방식을 풍부하고 강력한 데스크탑 환경과 통합할 수 있는 사람이 이 경쟁의 승자가 될 것입니다. 예를 들어, 트라도스 스튜디오의 LookAhead처럼 최근에 개발된 기능을 통해 사용자의 하드 디스크에 있는 로컬 TM으로 작업하는 것과 같거나 개선된 클라우드 기반 TM 성능을 경험할 수 있습니다.


확장 번역 환경 내에서 TM은 어떻게 작동합니까?

대니얼: 현재 번역가는 세 가지 주요 리소스를 활용해 작업을 더욱 쉽고 효율적으로 수행할 수 있습니다. 첫 번째, 기존 TM의 100% 또는 컨텍스트 매치만한 것은 없습니다. 두 번째, 용어 수준에서 번역의 품질과 일관성을 보장하는 기존 용어집 관리입니다. 세 번째, 기계 번역입니다. MT를 사용하면, 오늘날 바로 사용할 수 있는 언어 쌍의 기계 번역이 번역 흐름에 완전히 원활하게 연결할 수 있을 만큼 ‘충분히 우수한’ 상태가 됩니다. 특히 이를 수용하는 작업 의뢰자와 작업자가 늘고 있기 때문입니다.

이제 이 세 가지 리소스가 함께 작동한다고 가정해 보겠습니다. 용어는 MT 제안을 개선할 수 있고, MT 조각은 퍼지 매치 등을 보완할 수 있습니다. 고품질 TM을 구축하고 고품질 용어집을 함께 사용하는 데 수십 년은 아니더라도 수 년을 투입한다는 점을 고려하면 상당히 흥미로운 관점입니다. 변화가 시작되는 부분은 고품질 기계 번역을 함께 사용한다는 점입니다. 이는 모든 번역이 기계에서 완벽하게 나온다는 뜻은 아닙니다. 반대로, MT는 유창한 번역을 제안한다는 점에서 매우 까다로울 수 있습니다. 그러나 유창하다는 것이 반드시 정확하다는 뜻은 아닙니다. 번역가와 리뷰어는 고객이 기대하는 높은 품질의 번역을 제공할 수 있도록 최대한 주의를 기울여야 합니다.

이에 대해 MT는 모든 번역 흐름에서 사용할 수 있는 새롭고 놀라운 도구라는 점을 말씀드렸습니다.


번역 메모리와 기계 번역의 미래는 어떨까요?

대니얼: 퍼지 매치를 활용하는 새로운 방법이 있을 겁니다. 무슨 의미일까요? 편집이 전혀 필요하지 않은 MT 제안은 ‘수정된’ 퍼지 매치라도, 일반적으로 편집이 필요한 70% 또는 80% 퍼지 매치보다 더 나을 수 있습니다. 미래의 결과는 다음과 같을 수 있습니다. TM은 100%에서 90%까지 퍼지 매치에 가장 적합하고, MT는 90% 이하에 가장 적합합니다. 물론 이는 오랫동안 유지되어 온 가격 책정 모델에도 영향을 미칠 것입니다. 이제 작업 의뢰자는 MT 엔진을 통해 합리적이며 적합하게 번역된 새로운 콘텐츠에 할인을 원할까요? 작업자는 이를 쉽게 받아들일 수 있을까요? 양쪽 당사자는 협업하여 합의에 도달할까요?

이러한 예산 관련 문제 외에도 현재 편집 환경이 MT와 함께 TM을 사용하는 데 최적화되었는지를 놓고 의문이 제기될 수도 있습니다.

트라도스 스튜디오와 같은 개방형 플랫폼 CAT 툴 환경은 단기간에 ‘모든’ MT 엔진을 연결하고 잘 알려진 방식으로 계속 작업할 수 있도록 완벽하게 지원한다는 것이 가장 큰 장점입니다. 따라서 사용자가 그래도 작업해 왔고 친숙한 리소스 혼합에 MT를 자연스럽게 추가하는 데 매우 적합합니다. 이는 결코 과소평가되어서는 안 됩니다. 또한 현재 MT 엔진은 세그먼트 수준에서 작동하므로 세그먼트 기반 작업 방식에 자연스럽게 적합합니다.

요약하면, 적어도 단기적으로 트라도스 스튜디오와 같은 CAT 툴은 단순한 ‘플러그인’ MT에 매우 적합합니다.

케빈: 더 높은 품질이 나오면 장기적으로 그리드 기반 편집기를 다시 생각해야 할 수 있습니다. 변화는 새로운 작업 방식, 즉 MT 콘텐츠를 검토하는 데 최적화된 방식에 최적화된 다른 편집 환경으로 찾아올 수 있습니다. 예전에 처음부터 번역하기 위해 필요했던 많은 기능이 사라질 겁니다. 하지만 전환 단계에서는 이미 고객들이 트라도스 스튜디오의 리소스 혼합에 MT만 간단히 추가하여 생산성을 최적화하고 비용을 절감한다는 사실을 듣고 있습니다.


앞으로 번역 메모리 작업에 대한 사용자 경험을 어떻게 개선할 수 있을까요?

케빈: 편집 환경을 다시 생각할 뿐 아니라 TM에 대한 문서 중심 접근 방식이 더 나을 것으로 보입니다. 따라서 TM 일치 항목이 있는 경우 원본 문서 및 번역을 자세히 살펴보고 전체 문서 컨텍스트를 볼 수 있습니다.


upLIFT의 미래는 어떨까요?

케빈: upLIFT 번역 메모리는 지속적으로 개선될 기능입니다. 단어 얼라인먼트가 개선되면 하위 세그먼트 제안을 일컫는 ‘조각’ 품질도 개선되고, 퍼지 매치 수정 사례의 처리 방법도 개선될 것입니다. 또한 다음 사항도 기대하고 있습니다.

  • 번역 제안의 개선과 더불어, upLIFT TM 기술은 용어집 추출을 개선하기 위한 기반을 제공할 수 있습니다.
  • 자동 태그 배치(매치 수정 시에도)가 upLIFT 구성 요소를 이용하여 개발될 수 있습니다.
  • upLIFT 단어 얼라인먼트 결과를 바탕으로 더욱 스마트한 TM 유지관리 기능이 개발되어 오역, 데이터 손상 또는 문서/세그먼트 불일치를 확인할 수 있습니다.

보시다시피, AI에서 MT, 클라우드에 이르기까지 번역 메모리 기술에 앞으로 흥미로운 발전 사항이 많이 있습니다. 

어떤 점이 가장 기대되시나요?

카밀 아빌라
작성자

카밀 아빌라

제품 마케팅 매니저
카밀 아빌라는 RWS의 수석 제품 마케팅 매니저로 번역 업계에서 8년간의 경험이 있으며, 현재 트라도스 제품군을 감독하고 있습니다. 카밀의 핵심 역할은 기업 시장의 현지화에 집중하며 기업이 콘텐츠를 이해함으로써 고객과 효과적으로 커뮤니케이션할 수 있도록 지원하는 것입니다.
작성자 카밀 아빌라