翻訳会社向け:スムーズなファイル準備のコツ


この10年、Trados Studioを始めとする最新の翻訳環境は大きく進化し、さまざまなファイル形式をサポートするようになりました。そのため今は、翻訳対象として提供されたほとんどのドキュメントをスムーズに開いて翻訳することができます。以前は翻訳プロセスの一環として当然だったファイルの準備や後処理は不要です。とは言え、現在でも思い通りの結果が得られない場合もあります。たとえば、1つの文がいくつかの分節に分断されてしまい、翻訳しづらいコンテンツになっていることがあります。
複雑なファイルを準備する際の課題
複雑なファイルは、翻訳エディタで開くことができる場合でも、完全に読み込むまでに非常に時間がかかることがあります。完全に読み込んだ後も、翻訳者は作業中に分節間を移動するだけで数秒待たされることがあります。また、翻訳すべきでないテキストを翻訳してしまったり、もっと悪いケースでは一部のコンテンツが翻訳エディタで翻訳対象にならずに未翻訳のままだったりしたために、顧客に不満を持たれる場合もあります。2バイト文字の言語や、右から左に記述する言語、東欧言語などを扱う翻訳者は、翻訳完了後に、訳文言語ドキュメントで文字化けが発生したり、訳文言語がまったく表示されなかったりした経験があるかもしれません。その他の問題として、翻訳したドキュメントのレイアウトが完全に壊れてしまい、それを直すのに非常に時間かかかる、というのもよくあります。
このような問題を総括すると、問題がまったくない翻訳プロセスの実現には依然として程遠い状況であると言えます。多くの場合、ドキュメントを翻訳できるようにしたり、翻訳後のレイアウトを修正したりするために、かなりの量のエンジニアリング作業が必要になります。なぜこのようなことが起こるのでしょうか?今後このような問題の発生を抑えるには、顧客をどのようにリードしていけばよいでしょうか?
ファイル準備の時間を短縮するために顧客と共有できるヒント
- 翻訳者のPCのメモリに負担を掛けないように、ファイルサイズが何百メガバイトもあるような巨大ドキュメントを避け、コンテンツをより小さな単位に整理します。Trados Studioのような最新の翻訳環境では、原文ドキュメントからテキストが抽出され、バイリンガルの中間ドキュメントが生成されます。原文テキストと訳文テキストが含まれたこのファイルを、翻訳者が翻訳作業に使用します。中間バイリンガルファイルには原文テキストと翻訳済みテキストの両方が含まれるため、テキストが倍の量になります。つまり、中間ファイルのサイズは非常に大きくなる場合があるということです。
- 翻訳済みテキストは原文よりも長くなることが多いため、レイアウトには余裕を持たせます。たとえば、ロマンス諸語(フランス語、スペイン語、ポルトガル語、イタリア語など)や東欧言語(ポーランド語、ロシア語、クロアチア語、セルビア語など)は、同じ内容の英語テキストよりもかなり長くなります。そのため、翻訳済みテキストがレイアウトに収まらなくなることがよくあります。
- 画像(JPG、PNG、TIFF)上のテキストはたいてい翻訳対象として抽出されないため、画像にテキストを載せないようにします。翻訳可能なコンテンツを作成するときは、Adobe IllustratorやPhotoshopといったグラフィックアプリケーションのテキスト機能を使用するのは避け、InDesign、Word、Framemakerなどを使用しましょう。グラフィックアプリケーションはビジュアルコンテンツを作成するときに使用します。
- 文の途中で改行を使用し、段落の区切りを使用しないようにします。翻訳対象テキストが翻訳エディタにインポートされると、テキストが分節化されます。つまり、翻訳エディタでテキストが断片化され、1つの文が1つの分節として表示されるということです。段落区切りを使用してドキュメントのレイアウトを整えた場合は、分節が途中で分断されてしまい、翻訳しづらくなってしまいます。
- レイアウトを整えるときは、手動で書式設定するのではなく、スタイル機能を使用します。インデントには、スペースやタブ文字を使用しないようにします。可能なら、自動インデントのスタイルを使用します。
- コーポレートアイデンティティ(CI)の一環として企業固有のフォントを選択する場合は、そのテキストをローカライズする必要があるのか、どの言語にローカライズするのかなどを事前に計画しておきます。訳文言語のすべての文字セットをサポートする企業固有フォントをCIに選択することをお勧めします。
- PDFファイルを翻訳対象として提供することは避けます。提供時はオープン形式のファイルがお薦めです。生成またはスキャンしたPDFからコンテンツを抽出することは可能ではありますが、最終的な訳文のレイアウトは、基本的なオープンテキスト形式で処理した場合ほど整いません。
- メインドキュメントにPDFドキュメントを埋め込まないようにします。代わりに、オープン形式のドキュメントを埋め込むと、ほとんどの場合、翻訳エディタにインポートできます。
- 翻訳対象ドキュメントを提供する前に、翻訳対象と翻訳対象外のテキストを明らかにし、翻訳者や翻訳会社に伝えます。Trados Studioのような最新の翻訳環境には、テキストを翻訳対象として含めたり除外したりするためのさまざまな機能が備わっています。このような機能を利用すれば、ドキュメントの中でインポートする部分や翻訳不要な部分を管理できます。
- レイヤーを利用して、翻訳対象と翻訳対象外のテキストを区切ります。
- 表を作成する場合は、タブではなく、組み込まれている表エディタを使用します。表のヘッダーが長くなることがあるため、スペースに余裕を持たせます。
- 多言語ドキュメントを作成しないようにします(1層に1言語)。これにより、ドキュメントのサイズが大きくなり、低性能なコンピュータで処理しづらくなるのを防げます。また、多言語に翻訳するドキュメントの場合は翻訳を順次行っていくこと。つまり1つの言語が終わったら次の言語へと進めていくことが最も重要です。各言語を担当する複数の翻訳者に同じドキュメントを同時に送信することも、翻訳完了後にすべての翻訳済みバージョンを同じファイルにまとめて管理することも、容易ではありません。このような場合は、言語ごとにドキュメントを作成して作業を開始したほうがスムーズに進みます。
Microsoft Officeアプリケーションのファイルを処理する場合のヒント
- セル内のテキストが長くならないようにします。Excelのセルの最大文字数は32,767文字です。
- MS WordやPowerPointのファイルを処理する場合は、スタイル機能やテキストの非表示機能を使用して翻訳対象テキストと翻訳対象外テキストを分離します。Excelドキュメントの場合は、翻訳者に翻訳対象と翻訳対象外の列/行を必ず伝えます。翻訳対象の列/行を折りたたんだり、非表示にしたりしないでください。そのような列/行は翻訳エディタにインポートされません。
- マクロを使用している場合は、翻訳対象テキストをVBAコードでハードコーティングしないようにします。
- ドキュメントを翻訳対象ファイルとして提供する前に、すべての変更履歴を適用しておくことをお勧めします。
- 古いバイナリファイル形式(DOC、XLS、PPT)の使用を避け、最新形式(DOCX、XLSX、PPTX)を使用します。
- できる限りMicrosoft Publisherの使用を避け、InDesign(またはQuarkXPress)を使用します。現在のところ、Microsoft Publisherには信頼できるファイル形式フィルターがないため、この形式のファイルを翻訳すると、非常に手間のかかる後処理が必要になります。