번역 메모리 기술의 과거와 현재

카밀 아빌라 2019년 2월 6일 10분 읽기

번역 메모리에 대한 아이디어는 1970년대 초에 고려되었고 1980년대에 더욱 발전했습니다. 그러나 1990년대가 되어서야 Windows용 Translator’s Workbench를 통해 RWS(이전 SDL)의 번역 메모리에 획기적인 발전이 이루어졌습니다. 이는 실제로 널리 사용된 최초의 TM 엔진으로, 처음에는 1995년에 16비트, 그 다음에는 1998년에 32비트로 출시되었습니다(이전 세대는 너무 작은 커뮤니티를 위한 것으로 DOS 기반이었지만 DOS는 90년대 초반에 초기 성공을 거두었습니다).

이 획기적인 발전이 필요한 이유는 무엇일까요? 당시에 기계 번역이 발전하고 있었지만 너무 저품질로 간주되었습니다. 또한 Windows PC가 조직과 가정에서 주류로 부상함에 따라 프리랜서 번역가와 조직 번역가 모두 디지털 콘텐츠의 증가에 대처할 더 많은 기술을 도입하기 시작했습니다. 또한 프리랜서 에디션 등 특정한 요구 사항이 있는 고객을 위한 솔루션이 있다는 점은 큰 긍정적인 요소로 여겨졌습니다.

번역 메모리는 CAT 툴의 심장이자 두뇌라고 할 수 있습니다. 그러나 처음에는 이 기술에 회의적인 반응이 약간 있었습니다. 현대로 돌아오자면 번역 메모리가 없는 삶은 상상하기 어렵습니다. 트라도스는 1990년대부터 번역 메모리 개발을 유지하면서 항상 고객을 위해 번역 메모리 사용 개선을 모색해 왔습니다.


번역 메모리의 발전

RWS(이전 SDL)가 2005년에 트라도스를 인수했을 때 번역 메모리는 트라도스 스튜디오트라도스 그룹셰어를 위해 처음부터 다시 설계되었습니다. 우리의 주요 목표 중 하나는 고객이 수년 동안 Workbench TM 엔진과 관련하여 보고한 격차를 해소하는 것이었습니다. 여기에는 타겟 언어의 콘코던스 검색, 컨텍스트 및 구조 일치 개념 도입, 완전한 XML 표준 기반 엔진 등이 포함됩니다.


번역 메모리 기능 확장

RWS의 번역 메모리는 기능이 매우 많으며, 생산성 중심의 기능을 더 많이 제공하기 위해 수년간 발전하고 있습니다. AutoSuggest 사전을 예로 들어 보겠습니다.

이는 번역 메모리 콘텐츠에서 생성되며 번역 프로세스 자체에서 AutoSuggest를 통해 구문이나 조각을 제공합니다. 그 다음에는 번역 메모리 내에서 텀베이스나 기타 소스와 일치로 나타나지 않는 단어나 텍스트 덩어리를 검색하는 콘코던스 검색이 있습니다.

AutoSuggest 사전 및 콘코던스 검색은 일상적인 CAT 툴 사용자에게 상당히 잘 알려져 있을 것이나, RWS의 TM이 발전하면서 매우 유용하지만 잘 알려지지 않은 복잡한 기능이 몇 가지 있습니다.

세그먼트 기반인 번역 메모리는 단락 기반 세그먼트 분할도 지원합니다. 이 기능은 소스 또는 타겟 언어가 아시아 언어인 번역 시 유용한데, 사고 과정 순서가 서구 언어와 달라 세그먼트보다는 단락을 번역하는 것이 좋은 경우가 많습니다. 흥미롭게도 단락 기반 세그먼트 분할은 신경망 기계 번역(NMT)에서 다시 인기를 얻었는데, 번역가가 세그먼트별로 번역하지 않고 단락의 전체 맥락을 볼 수 있기 때문입니다.

또한 문서 구조를 사용하여 TM에서 컨텍스트를 제공할 수 있는데, 이는 트라도스 고유의 기능입니다. 즉, 컨텍스트 매치만을 구별할 뿐 아니라 문서에 있는 구조 컨텍스트(색인 마커, 제목, 목록 항목 등)도 사용할 수 있습니다. 세그먼트를 구조 컨텍스트에 따라 다르게 번역해야 하는 일이 많습니다. 예를 들어 색인 항목은 영문 소문자로 작성되지만 동일한 세그먼트의 제목에는 대문자가 필요합니다.


유연성

번역 메모리의 유연성은 업계에서 특별한 앱스토어에서 실제로 확인할 수 있습니다. 트라도스 스튜디오만으로도 TM을 관리하고 유지 관리할 수 있는 다양한 방법을 사용할 수 있지만 다양한 앱을 활용하여 고급 작업 방식의 이점을 얻을 수도 있습니다. 예를 들어, 소스 텍스트, 타겟 텍스트, 소스 및 타겟 텍스트를 아래 나열된 앱 등을 통해 다양한 파일 형식으로 표시할 수 있습니다.

  1. SDLXliff2Tmx
  2. TmConvert

데이터 및 데이터 보호에 대한 관심이 증가함에 따라 앱스토어에서 다운로드할 수 있는 Trados Data Protection Suite 앱을 통해 TM의 데이터를 익명화하는 기능도 있습니다.


확장성

트라도스는 ‘규모 확장 및 축소’에 항상 열정을 보여 왔습니다. 즉, 동시에 수백 명의 사용자까지 규모를 확장할 수 있는 번역 메모리를 갖추는 것도 중요하지만, 인터넷에 연결되지 않은 PC에서 로컬로 작업하는 개별 사용자와 그 사이의 모든 시나리오로 규모를 축소할 수 있는 솔루션을 갖추는 것도 마찬가지로 중요합니다.

모든 경우 경험과 성능은 최대한 좋아야 합니다. 이를 위해서는 다양한 스토리지 메커니즘과 소프트웨어 작업 방식이 필요한 설계 접근 방식이 필요합니다. 이를 로컬 데스크탑 환경에서 작업하는 ‘파일 기반’ 방식과 여러 사용자가 동시에 동일한 리소스를 공유하는 ‘서버 기반’ 방식이라고 합니다.

당사의 파일 기반 TM은 개별 사용자 또는 매우 작은 팀에 매우 적합하고 효율적이며 최적의 효율을 위해 서버 기반 제품도 사용할 수 있습니다.

당사의 서버 기반 TM은 수백 명의 사용자(트라도스 스튜디오 및 트라도스 그룹셰어)를 지원하고 중앙 집중식 번역 메모리를 제어하여 액세스 시간 제한을 설정하여 보다 일관된 번역을 할 수 있습니다. 번역 도중에 자산을 실시간으로 공유할 수 있으면 데스크탑 전용 환경에서는 불가능한 수준으로 콘텐츠 재사용 비율이 증가합니다.

TM 협업은 생산성 향상 기능을 갖춘 파일 기반 번역 메모리와 서버 기반 공유를 모두 제공하여, 프리랜서 번역가는 물론 처리 시간이 끊임없이 증가하는 번역 프로젝트를 대량으로 처리하는 번역회사와 기업을 지원하는 다양한 고객 상호 작용을 고려합니다.


upLIFT 번역 메모리 기술의 부상

수년간 TM의 지속적인 발전 끝에 트라도스 스튜디오 2017이 출시되어 CAT 툴의 ‘작업’을 더욱 지능적으로 바꾸는 upLIFT 기술의 도입으로 진정한 이정표를 세웠습니다.

이 블로그 앞부분에서 TM의 뛰어난 생산성 확장 기능인 AutoSuggest 사전 및 콘코던스 검색에 대해 이야기했습니다. 하지만 한 가지 단점은 이를 사용하여 작업하려면 수동 상호 작용을 통해 설정해야 했지만 upLIFT 기술, 다시 말해 ‘조각 리콜’로 이 모든 것이 바뀌었습니다.

조각 리콜의 기본 기술은 미세 정렬이라는 프로세스입니다. TM에는 번역 메모리 유닛(TU)이라고도 하는 정렬된 세그먼트 쌍이 포함되므로 세그먼트 수준에서의 작업은 쉽습니다. 예를 들면 세그먼트 퍼지 매치가 있으면 저장된 번역 제안을 불러오는 것입니다. 세그먼트 하위 수준에서의 작업은 더 어렵습니다. 예를 들면 TU 세그먼트의 일부(예: 문장 안의 문구 또는 용어)에 대한 매치를 찾고 번역에서 해당되는 부분을 불러오는 것입니다. 트라도스 스튜디오 2017에서는 조각 리콜을 통해 사용자가 아무것도 하지 않고도 전체 TU 조각을 자동으로 볼 수 있게 되면서 이 모든 것이 변경되었습니다.

조각 리콜은 2016년에 시작된 이후로 다듬어지고 개선되었습니다. 이제 조각 일치 항목의 원본을 아이콘 팁을 통해 볼 수 있으며, 퍼지 매치 수정 기능의 일부로 트라도스 스튜디오에서 자동으로 수정한 퍼지 매치를 거부할 수도 있습니다.

개선 사항은 여기에서 멈추지 않습니다. 트라도스 스튜디오 2017 서비스 릴리스 1에 도입된 새로운 LookAhead 기능을 통해 백그라운드에서 TM 결과를 검색하여 번역 메모리(TM) 검색 결과에 더 빠르게 액세스할 수 있습니다. 번역 중인 세그먼트로 이동하면 활성 세그먼트에서 작업하는 동안 트라도스 스튜디오는 이어지는 두 세그먼트의 검색을 수행합니다. 장점은 무엇인가요? 세그먼트를 변경할 때마다 검색 결과(있는 경우)가 이미 ‘검색’된 것처럼 거의 즉시 결과가 나타납니다.


더욱 쉬운 콘텐츠 추가

물론 번역 메모리 관리와 사용도 중요하지만 콘텐츠를 추가로 가져오는 것도 매우 중요합니다.

CAT 툴을 처음 사용하는 경우이든 그렇지 않든 번역 얼라인먼트는 기존 콘텐츠를 사용하여 번역 메모리를 생성함으로써 번역 자산을 바로 만드는 효율적인 방법입니다. 트라도스 스튜디오 2019의 서비스 릴리스 1에서는 새로운 얼라인먼트 선택 및 연결 기능과 고급 분할 및 검색 기능을 추가하여 콘텐츠 얼라인먼트 프로세스를 훨씬 더 다양하고 사용하기 쉽게 만들었습니다.


번역 메모리 기능을 더욱 개선

컨텍스트 매치와 퍼지 매치의 정확성을 개선하여 이전보다 더 많은 매치를 제공합니다. 컨텍스트 매치가 계산되는 방식을 개선하여 정확도가 향상되었으며, 서구 언어의 형태소 분석도 향상하여 퍼지 매치를 개선했습니다.

또한 DTP 시 일반적으로 나타나는 일본어의 반각/전각 문자 인식을 개선했는데, 이는 이 시장에서 진정한 진전이라고 생각합니다.

이 최신 서비스 릴리스는 TM 개선이 끝나지 않았으며 더 향상이 가능함을 나타냅니다. AutoSuggest, upLIFT 조각 리콜, 퍼지 매치 수정과 같은 획기적인 기술이 트라도스 스튜디오의 2019의 형태소 분석/퍼지 매치 개선과 같은 작은 개발 사항과 결합하여 TM의 활용도를 크게 높이게 되어 기쁩니다.

보시다시피 수년간 많은 발전을 이루었습니다. 번역 메모리는 새로운 혁신과 기능으로 계속 개발되어 이전보다 더 간편하게 TM을 사용하고 관리할 수 있게 되었습니다.

카밀 아빌라
작성자

카밀 아빌라

제품 마케팅 매니저
카밀 아빌라는 RWS의 수석 제품 마케팅 매니저로 번역 업계에서 8년간의 경험이 있으며, 현재 트라도스 제품군을 감독하고 있습니다. 카밀의 핵심 역할은 기업 시장의 현지화에 집중하며 기업이 콘텐츠를 이해함으로써 고객과 효과적으로 커뮤니케이션할 수 있도록 지원하는 것입니다.
작성자 카밀 아빌라