生成翻訳:不適切な行動を正す

David Pooley 2024年8月27日 読了目安時間:8分
An introduction to translation collaboration
本題に入る前に、私の子どもたちは(普段は)行儀がいいということを申し上げておきたいと思います。もう16歳、20歳、21歳ですから、そうでなくては困ります。でも、これまで常に行儀がいい訳ではありませんでした。長年にわたり幾度となく、話し方、言葉の選び方を(人にしてもらいたいように人にしなさい!と)「優しく正し」、どのようにすれば全般的により良い人間になれるのか示し、次はもっと分別を持った振る舞いができるように常に正しい方向に導く必要がありました。それが翻訳と、どうつながるのか?よい質問です!少し過去を振り返ってみましょう。 
 

まとめ 

私は2023年9月に、これからAIがどのようにTradosの翻訳エンジンを強化していくかについて記事を書きました。そして映画『チキンラン』に言及し、Tradosの翻訳エンジンを、多くの何も知らない鶏たちの宿敵であるパイ製造マシンになぞらえました。私たちが翻訳エンジンに投入するのは、鶏ではなく原文テキストです。そしてパイではなく翻訳を得ます。 
 
この記事を投稿後まもなく、当社は生成翻訳機能をリリースしました。これはAIを活用して既存の翻訳を改善したり、テキストを一から翻訳したりする機能です。当社は次のことを目指しています。 
  • ポストエディット作業の対象となる翻訳の品質を向上させる。 
  • ポストエディット作業の削減によって生産性を向上させる。 
  • 市場投入期間を短縮する。 
上記のすべてが、最終成果物と顧客満足度の向上につながればと考えています。この業界の誰もが注目しているのは、AIに適切なプロンプトを入力すれば、そのAIによって既存のニューラル機械翻訳機能を強化できるのかどうか、さらにそれに取って代わることができるのかどうかという点です。今のところ、この疑問に対する明確な答えは出ていません。しかし、当社は次のようなアプローチによって結果を評価し、翻訳の品質を向上させることに成功しています。 
  • 翻訳を生成するLLMに入力するプロンプトを調整する。(ちなみに「プロンプトエンジニア」が役職になると5年前に誰が想像していたでしょうか) 
  • 翻訳に使用すべき用語をLLMに提供する。 
  • 以前に翻訳済みのコンテンツを使用して、翻訳のスタイルと語調を指定する。 
  • ユーザーがLLMにカスタム指示を出せるようにする。
 

「悪い」翻訳の修正 

私の子どもたちに話を戻します。次の語句をスペイン語から英語に翻訳するとします。 
 
Mis hijos son muy traviesos. 
 
LLMにこの語句の翻訳を依頼してみましょう。これは私が作成したサンプルプロンプトです(私もプロンプトエンジニアになれるでしょうか?)。 
 
テキストをスペイン語から英語に翻訳してください。翻訳すべきテキストは、<<<と>>>で囲まれています。回答には、英語に翻訳されたバージョンのみを出力してください。 
これがそのテキストです。 
<<<Mis hijos son muy traviesos.>>> 
 
そして次のような回答を得ました。 
 
My children are very mischievous.(私の子どもたちはとてもいたずら好きです) 
 
私はちょっと変わっていて、子どもたちについて言及するときは「my offspring」という言葉を使います。「mischievous」も、ハロウィーン以外では使いません。「badly behaved」という言葉を使うと思います。これが私の語彙です。LLMにこの語彙を使ってもらいたいと思います。このようにプロンプトを入力します。 
 
テキストをスペイン語から英語に翻訳してください。翻訳すべきテキストは、<<<と>>>で囲まれています。回答には、英語に翻訳されたバージョンのみを出力してください。 
「hijos」は「offspring」と翻訳してください。 
「traviesos」は「badly behaved」と翻訳してください。 
これがそのテキストです。 
<<<Mis hijos son muy traviesos.>>> 
 
すると次のような回答を得ました。 
 
My offspring are very badly behaved. 
 
完璧です!思っていたとおりに機能してくれました。過去にしてもらった翻訳が気に入っているので、そのスタイルで翻訳したいとします。次のようなプロンプトを入力します。 
 
テキストをスペイン語から英語に翻訳してください。翻訳すべきテキストは、<<<と>>>で囲まれています。回答には、英語に翻訳されたバージョンのみを出力してください。 
コピーしたい以前の翻訳スタイルがあります。スペイン語の「Mis hijos están muy felices.」は英語で「I have very happy children.」と翻訳されました。翻訳をこのパターンに合わせてください。 
これがそのテキストです。 
<<<Mis hijos son muy traviesos.>>>  
 
すると次のような回答を得ました。 
 
I have very mischievous children. 
 
自慢できるようなことではありませんが、小さないたずらっ子たちについて声を大にして言いたい場合は、LLMにまた別のプロンプトを追加します。 
 
テキストをスペイン語から英語に翻訳してください。翻訳すべきテキストは、<<<と>>>で囲まれています。回答には、英語に翻訳されたバージョンのみを出力してください。 
翻訳はすべて大文字にしてください。 
これがそのテキストです。 
<<<Mis hijos son muy traviesos.>>> 
 
そして次のような回答を得ました。 
 
MY CHILDREN ARE VERY MISCHIEVOUS. 
 
用語、以前の翻訳、カスタム指示を使用してLLMから異なる回答を得る方法について見てきました。すべてを1つのプロンプトにまとめたのが、以上の最終形になります。 
 
テキストをスペイン語から英語に翻訳してください。翻訳すべきテキストは、<<<と>>>で囲まれています。回答には、英語に翻訳されたバージョンのみを出力してください。 
「hijos」は「offspring」と翻訳してください。 
「traviesos」は「badly behaved」と翻訳してください。 
コピーしたい以前の翻訳スタイルがあります。スペイン語の「Mis hijos están muy felices.」は英語で「I have very happy children.」と翻訳されました。翻訳をこのパターンに合わせてください。 
翻訳はすべて大文字にしてください。 
これがそのテキストです。 
<<<Mis hijos son muy traviesos.>>> 
 
すると次のような回答が得られます。 
 
I HAVE VERY BADLY BEHAVED OFFSPRING. 
 
声を大にして言いたいようなことはありませんが、やはりこれもちょっと違う気がします。もう一度やり直して、「hijos」を「angels」に翻訳するべきかもしれません。 
 

つまりどのような機能? 

Tradosの生成翻訳機能では、以上のような手法をすべて使用します。生成翻訳をプロジェクトワークフローに含めると、翻訳エンジンやカスタムフィールドなどのプロジェクト設定を使用して、以下のことを行います。 
  • 用語集:原文テキストの用語データベースから用語を見つけてLLMに送信します。 
  • 翻訳メモリ:翻訳メモリ内の一致する翻訳を見つけて、LLMに翻訳例として提供します。 
  • カスタム指示:ターゲットオーディエンス、語調、長さ制限など、その翻訳プロジェクトで定義されている特定の指示を取得し、それをLLMのプロンプトに含めます。 
こうした手法を使用することで、LLMはより優れた翻訳を提供するようになり、ポストエディット作業を削減できるようになり、翻訳コストの削減と市場投入期間の短縮が可能になります。 
 

生成翻訳へのアクセス 

生成翻訳を実際に利用したいお客様は、AI Essentialsアドオン(Trados Team、Trados Accelerate、Trados Enterprise向け)を購入してご利用いただけます。詳しくは、当社までお問い合わせください。 
 
また、Trados Studio 2024の新機能、AI Assistantを使用して、生成翻訳を利用することもできます。 
David Pooley
制作者

David Pooley

Senior Product Manager

DavidはRWSのSenior Product Managerで、20年以上にわたり言語テクノロジー開発と製品管理に取り組んできました。


1997年にソフトウェア開発者としてSDLに入社。初期の翻訳メモリツールの開発に携わり、新しい言語テクノロジーアプリケーションの開発に向けてさまざまな可能性を模索しました。開発者として数々の職務を経験し、現在はRWS Language Cloudのサービスと用語集管理システムを担当しています。Trados Enterpriseでは、コスト、見積もり、品質、セキュリティ、オープンAPI、AI活用を専門としています。 


これまでTMXやSRXなどのローカリゼーション標準の確立に貢献してきましたが、今後も言語テクノロジーに注力していきます。

この執筆者の全記事: David Pooley