Loading...

Google翻訳VSスパムメール1本勝負

よく届くけど見向きもされない迷惑メール。気まぐれで内容を読んでみても、できの悪い機械翻訳のような文面でげんなり。

でも待った。機械翻訳が作ったような文章を機械翻訳にかけるとどうなるか?

実験してわかったのは、Google翻訳のすごさとスパムメール業界(?)の手抜き加減。

今回の原文は、迷惑メールフォルダに入っていたAppleを名乗るスパムメール。元々の文章が日本語であるため、一度Google翻訳で英訳し、それからさらに和訳するという変則的な方法をとっています。

ともかく、大本となる日本語文はこちら。

拝啓、
私たちは、あなたのアカウント情報の一部が誤っていることをお知らせしたいと思います。私たちは、あなたのアカウントを維持するためにお使いのApple ID情報を確認する必要があります。 下のリンクをクリックしてアカウント情報を確認してください。:

マイアカウント確認 >

私たちは24時間以内にあなたからの応答を受信しない場合は、アカウントがロックされます。 Appleチーム

読んでいて気が滅入る日本語ですね。これをGoogle翻訳で英訳したのがこちら。

Dear Sirs,
We would like to inform you that some of your account information is incorrect. We need to verify your Apple ID information to maintain your account. Please check the account information by clicking the link below. :

My account confirmation>

If we do not receive a reply from you within 24 hours, the account will be locked. The Apple team

これをさらに機械翻訳にかけます。

Google翻訳

拝啓、
お客様のアカウント情報の一部が間違っていることをお知らせいたします。 アカウントを維持するには、Apple ID情報を確認する必要があります。 下記のリンクをクリックしてアカウント情報を確認してください。 :

私のアカウント確認>

24時間以内に返信が届かない場合、アカウントはロックされます。 Appleチーム

エキサイト翻訳

拝啓、
私達は、あなたにあなたのアカウント情報のうちのいくらかが不正確であると知らせたい。私達は、あなたのアカウントを維持するために、あなたのアップルID情報を確認する必要がある。どうぞ、下のリンクをクリックしてアカウント情報をチェックしてください。:

私のアカウント確認>

もし24時間以内に私達があなたから返答を受け取らないならば、アカウントはロックされる。アップルチーム

では、訳文のポイントを見ていきましょう。

「私たちは」

この手のスパムメールを見るたびに気になっていたのが、狂ったように乱発される「私たちは」。複数ある文のうちひとつだけに書かれているならまだしも、こうも続くと明らかに不自然です。ここを見るだけでも、日本語のネイティブが書いた文章ではないらしいこと、おそらくは英語のように必ず主語をつけて文章を書くような言葉から日本語に訳されたものであること、そして翻訳の品質管理に金も手間もかけてないのであろうことが読み取れます。こんなものを顧客に送ったとあれば、世界的企業Appleの名誉に関わるでしょう。

この点Google翻訳は素晴らしいもので、この不自然な「私たちは」が一掃されています。これだけでも自然な日本語にぐっと近づいていますね。

こうしたスパムメールがどう作成されているのかはわかりません。しかしGoogle翻訳とエキサイト翻訳の訳文を比較すると、本文の訳を作成しているのはどうやらエキサイト翻訳に近いルールベースの機械翻訳、あるいは翻訳の素人以下の人間であることがうかがえます。

「お客様の」

先ほどの「私たちは」同様、原文では「あなたの」も狂ったように繰り返されています。

oogle翻訳もエキサイト翻訳も「私たち」同様に省略して片付けていますが、Google翻訳の訳文にはひとつ興味深い部分があります。

それこそが最初に出てくる「お客様の」という訳語。実は元になった英訳文には「Customer」など「お客様」と直接に訳せる単語は一つも出てきていないのです。英訳文でこれにあたるのは「Your」なのですが、これを「お客様の」と訳したのは見事に文脈を読み取った結果と言えるでしょう。

おそらくGoogle翻訳はカスタマーサービスの文章のパターンを蓄積しており、そのパターンから演繹してこの文をカスタマーサービスメールだと判断したのでしょう。細かいパターンの内容は当て推量の域を出ませんが、おそらく「We」と「account information」、「incorrect」あたりが要点ではないかと思われます。

「account information」つまり何かのサービスのアカウント情報(あるいは銀行口座(bank account)の情報)が「correct(正確)」なのか「incorrect(不正確)」なのかについて言及できるのはアカウントを発行する側か、アカウント所有者本人だけです。この時点で最初の一文の「We」と「your」の候補がかなり絞られます。

あとは、アカウントを発行して管理する側は大部分がチームである、つまり複数人であること、また「your account」と書いてある場合、「your」はたいていの場合アカウントを保有している人を指すことから、この一文はアカウントを発行している側がアカウントを保有して利用している側に向けて発信したものである可能性がかなり高いと推測できます。

こうした特徴をもとにカスタマーサービスメールのパターンだと判断すれば、「your」をただ「あなた」とするよりは「お客様」とする方が妥当と判断できます。これ以降の「your」を全て省いてあることから見ても、Google翻訳が元々のスパムメール本文より高度な訳文を作っていることがわかります。

「返信が届かない場合」

これは原文の「応答を受信しない場合」、英訳文でいえば「If we do not receive a reply」に相当する部分です。「応答」や「受信」という妙に仰々しい言葉から「返信」という自然な言葉遣いになっている他にも、動作の主体へのフォーカスを移動させることで単語の数を減らしたスリムな訳になっています。

「私たちが返信を受け取る」という表現の裏には、「メールの返信があなたの方から私たちの方に移動する」という一連の動作が存在します。先ほどの表現は「私たち」にフォーカスした上でこれを表現した一例といえます。

これを「私たち」ではなく、「メール」にフォーカスすると、「メールが送られる、メールが届けられる」というように表現が変わってきます。原文の言葉そのものからは離れてしまいますが、「メールの返信があなたの方から私たちの方に移動する」という動作そのものは変わっていません。これを踏まえた上であえて表現を変更し、「返信が届かない場合」と簡潔にして要を得た訳文を作ったGoogle翻訳の判断は見事なものだと思います。

昨今であれば大部分が迷惑メールフォルダに投げ込まれるようなスパムメール。数打ちゃ当たるの精神でとにかく手間とコストを下げているのだろうことは容易に想像できます。

これだけのひどい訳文が何によって作成されているのか、見るたび不思議に思うのです。Google翻訳を使えない事情があるのであれば、一体どんなシステムを使っているのでしょう?

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA