さらなる高みへ向かう準備:AIは翻訳エンジンをどのように強化するか
これまで、Tradosでは翻訳エンジンを使用し、特定のテキストに対して考えられる最良の翻訳を提供してきました。そして今、人工知能の登場により、このサービスが次のレベルへと引き上げられます。生成AIは、機械翻訳に最適とは言えませんが、言語資産という魔法の粉を振りかければ、求められるスタイルや、語調、用語、さらに特定のプロジェクトに固有のその他の要素を反映した翻訳を生成できます。ここでは、これまでの歴史や、アニメーション映画、翻訳の品質向上に向けた当社の姿勢を取り上げつつ、生成AIについて説明していきたいと思います。
翻訳エンジンの変遷
当社は、新しいクラウドプラットフォームを開発していた当時、言語資産の編成と使用の方法に対し、新しいアプローチを採用することを決めました。従来、各言語資産は個別に扱われ、翻訳メモリ、用語集、機械翻訳の役割は明確に分かれていました。そこで、これらの資産をひとつにまとめ、得られるすべての情報に基づいて可能な限り最良の組み合わせを提供する、相乗効果の高いサービスの創出を目指したのです。翻訳メモリを適用し、未翻訳のテキストを機械翻訳で仕上げ、その翻訳済みテキストを翻訳者が提供された用語集を使用して編集する時代は過ぎ去りました。代わりに、当社は資産の有効性を最大限に高め、「可能な限り最適な一致」を作成できるようになるというビジョンを掲げました。そして誕生したのが翻訳エンジンです。
アニメーション制作会社Aardman Animationsの『チキンラン』という作品をご覧になったことはありますか?そこに、鶏をパイに変えるという恐ろしい機械が登場します。鶏がパイになる仕組みはまったく明かされず、不思議で不気味な機械ではありましたが、エンジニアリングの勝利であることは確かでした。トゥイーディー夫人は「鶏を入れると、パイが出てくる」と言っていました。それが翻訳と、どうつながるのでしょうか?私は常々、翻訳エンジンも同じように不思議な機械だと思っていました(幸い、恐ろしくはなく、不気味でもありませんが)。鶏の代わりにテキストを入れ、パイの代わりに翻訳が出てきます。まさに「テキストを入力すると、翻訳が出力される」のです。この仕組みを知る必要はありませんが、言語資産が限界まで利用され、使用可能な情報になり、ユーザー側は最良の翻訳が出力されると確信できます。下の図は、この「不思議な機械」のアプローチを示しています。
私たちが使用する「トリック」の一部は、まさにこのようなアプローチに求められるものです。それには、従来のAIテクノロジーのほか、次のような機能が含まれます。
- フラグメント一致
- あいまい一致の修正
- 適切な用語集を使用した機械翻訳の促進
それはそれで悪くないと思われるかもしれません。確かにそうです。うまく機能していたと、私も思います。そして、激動の2023年。何が登場したでしょう?そう、AIです!AI革命のスポークスボットは魅力的なチャット生成モデルで、詩を書いたり、プレスリリースを作成したり、LinkedIn用に人目を引く見出しを書いたりしてくれます。当初はOpenAIが有利に見えましたが、いつの間にか他社も巻き返してきました。Google、AWS、Metaなどがすでに参入しています。今後も、さまざまな企業が参入するのは確実でしょう。足音がすぐそこまで迫っています。AIが登場し、今後も存在し続けますが、私たちはそれで何をするのでしょうか?
アップグレードの好機
AIの台頭により、当社の翻訳エンジンの調整と強化が可能になりました。以前も言語資産を限界近くまで活用していましたが、今はその限界がさらに広がっています。ほぼすべてのチャットボットで同じテクノロジーが使用されています。膨大な量の言語データを分析して処理し、LLMと呼ばれるものを作成します。[言語マニア向けの解説:LLMは頭字語ではなく頭文字語です。頭字語は、NATO(ナトー)、SCUBA(スキューバ)、TASER(テーザー)、YOLO(ヨウロウ)のように1つの単語として発音されます。頭文字語は、DNA(ディーエヌエー)、OMG(オーエムジー)、TBD(ティービーディー)、FAQ(エフエーキュー)のように、個々の文字が読み上げられます。MPEG(エムペグ)とJPEG(ジェイペグ)は例外です!]LLMに話を戻しましょう。「LLMって何?」と思う人もいるかもしれません。これはLarge Language Model(大規模言語モデル)の略です。この業界では、中央の単語(Language)に大きな関心を寄せています。LLMにより、当社の翻訳エンジンは足かせを捨て、強力な新機能を生み出すことが可能になり、私たちはそれを翻訳テクノロジー製品の中枢に据えることができます。LLMが役立つのは次のような場面です。
- 状況情報とガイダンスが提供された上でのテキストの翻訳
- ニューラル機械翻訳によって作成された翻訳のポストエディット
- 翻訳されたテキストの品質評価と改善案の提供
- 企業のスタイルや用語集に沿った原文テキストの書き直し
機械翻訳や人の手による翻訳の修正はまもなく実用化されるでしょう。当社が現在、重点的に取り組んでいるのは、上記のリストの1つ目です。当社ではすでにTrados Studioで使用可能な「OpenAI Translator」アプリをリリースしています。このアプリは、LLMを使用してドキュメント内のテキストを変換、最適化、分析し、別の翻訳を提案するほか、プロンプトをサポートします。ここでは詳しくは説明しませんが、RWSコミュニティのWikiページを見ると、さまざまなスタイルや、語調、長さの取得に使用するプロンプトをどのように利用できるのかがわかります。ただし、プロンプトでは、翻訳エンジンに保存されている魅力的な言語資産すべてにアクセスすることはできません。これは企業秘密です。
AIを使用することで、当社の翻訳エンジンはこれまで以上に優れた翻訳を実現できるようになりました。文をある言語から別の言語に翻訳するため、LLMに次の情報を提供できます。
- 同じドキュメント内の他の分節がどのように翻訳されたか
- 過去に類似した分節がどのように翻訳されたか(あいまい一致テクノロジーの再利用)
- 原文テキストでどの用語が特定されたのか、その用語をどのように翻訳すべきか
- 求められる翻訳スタイル(フォーマル、インフォーマル、親しみやすい、プロ向けなど)
- 最大長や性別を問わない言語など、その他の設定
この情報すべてをLLMに提供すれば、私たちが求めているとおりの翻訳が生成されるようになります。さらに、翻訳プロジェクトの典型的なワークフローも提供すれば、LLMを「トレーニング」でき、一層改善されます。また、検証済みの最終翻訳をフィードバックすることで、モデルが学習し、時間の経過とともにより適切な提案を行えるようになります。素晴らしいことですね。当社では、お客様のコンテンツを一般公開されているLLMに渡し、高品質な翻訳を得ています。問題ないですよね?違います?「一般公開されている」点が気になりますか?ご心配いりません。前述の企業に属する人がお客様の知的財産をウェブ上で漏えいさせることはないと、私は確信しています。まだ納得できませんか?では、セキュリティ保護されたプライベートホスト型LLMで、すべての作業を行うのはいかがでしょう?そうすれば、自分のデータが自分だけのものであると確信できます。以下の図は、当社の新しい翻訳エンジンを示しています。鶏を傷つけることはありません。
導入方法
初期導入では、当社の強力なワークフローエディタにアクセスできるTradosユーザー向けのカスタムワークフローに含めることが可能な新しいタスクという形態をとります。これにより、新しいアプローチがもたらす可能性をユーザーの皆様に早期に体験していただけます。今後は、主要機能に組み込み、あらゆる人が利用できるようにしていきます。当社のコミュニティやソーシャルメディアを利用して、最新情報を見逃さないようにしてください。