Loading...

まず文を区切り、それから対応する語句を探すGoogle翻訳の流儀

SNS上での舌禍は大事になるもの。つい先日もアメリカの女優ロザンヌ・バーのツイートが人種差別的であると糾弾され、彼女が主演していたドラマが打ち切りになるという騒動がありました。

戯れに当該ツイートをGoogle翻訳とMicrosoft翻訳にかけてみたところ、そこにあったのは人種差別とはまた違う、誤訳という大問題、そして固有名詞の訳の処理に関する両者の仕様の違いでした。

今回の原文は、問題となったロザンヌ・バーのツイートです。

Muslim brotherhood & planet of the apes had a baby=vj.

Google翻訳訳文

類人猿のイスラム教の兄弟姉妹と惑星は赤ん坊= vjを持っていました。

Microsoft翻訳訳文

ムスリム同胞団 & 猿の惑星は、赤ちゃん = vj を持っていた。

このツイートの内容は、オバマ政権下でシニアアドバイザーを務めていたバレリー・ジャネットについて語ったもの。ツイート中のVJとは、バレリー・ジャネットのイニシャルです。

「Muslim brotherhood」と「Planet of the apes」

これはどちらも、日本語で決まった訳語を持つ固有名詞。Muslim brotherhoodとはスンナ派のイスラム主義組織で、日本語では「ムスリム同胞団」という訳語が当てられています。20世紀前半に結成されたムスリム同胞団は非合法な組織として長らくエジプト政府からの弾圧を受けてきましたが、1970年代からは闘争路線から脱却、大衆への慈善活動に軸足を移していきました。

ツイートの主のロザンヌは1952年生まれ。彼女が若い頃にはまだムスリム同胞団は武装闘争のさなかにあったので、イスラム教の危険な集団であるというイメージでこの言葉を使ったのであろうことは想像に難くありません。

イラン出身であり、ある程度イスラム圏に関わりがあるというバレリーのバックグラウンドにからめての発言でしょう。

「Planet of the apes」もまた固有名詞。こちらは最近のシリーズ作品が記憶に新しい『猿の惑星』の英語原題です。

バレリーはアフリカ系アメリカ人の家系なので、そこを揶揄した言葉でしょう。

ツイートの内容は「ムスリム同胞団と猿の惑星を足したようなのがバレリー」というようなもの。本人は本心からのツイートではないと弁解していますが、配慮を欠いた行いであることは動かしがたい事実でしょう。

固有名詞の訳し方

先の段落で2つの固有名詞が出てきましたが、今回なによりも気になったのはその訳語です。

Microsoft翻訳はともかく、Google翻訳は「類人猿のイスラム教の兄弟姉妹と惑星」という、どう見ても意味不明の訳になっています

この誤訳の鍵を握るのは、両者を結ぶ「&」の取り扱いです。

原文を見ると「Muslim brotherhood」と「Planet of the Apes」は「&」で結ばれ、「AとB」という併置の関係になっています。この関係性を正しく解釈できたMicrosoft翻訳の訳文は「&」が意味の切れ目になっており、「”Muslim brotherhood” / & / “Planet of the Apes”」という構成の文章として訳しています

一方のGoogle翻訳の解釈は、「&」を意味の切れ目とは見なさなかったものと思われます。つまり「&」の前後にあるものが個別の対象であるとみなされず、「”Muslim brotherhood and Planet / of / the Apes」という区切られ方をしたというもの。

「Muslim brotherhood and Planet」なる固有名詞はありませんし、「the Apes」も一般名詞として扱って問題のないものです。これをもとに、それぞれの単語を辞書の意味そのままに日本語に変換した結果が「類人猿のイスラム教の兄弟姉妹と惑星」となったのでしょう。

この誤訳は、単に奇怪な訳語を作ったというだけの話では終わらない興味深いものです。なぜならこの訳からは、Google翻訳とMicrosoft翻訳における、固有名詞を翻訳する際の処理の微妙な違いがうかがえるからです。

そもそも、こんな誤訳がなぜ起こるのか?

あらかじめ「Muslim brotherhood」と「Planet of the Apes」の部分だけを抜き出し、それぞれの訳語を「ムスリム同胞団」と「猿の惑星」に確定した後で残りの部分の訳を決めるという処理の流れであれば、Google翻訳のような誤訳は起こらないはず。

ということは、Google翻訳はまず文章の区切り方を決め、できあがった区切り方の枠内に固有名詞として訳せるものがあるのかどうかをチェックしたのではないでしょうか。

Google翻訳に「Muslim brotherhood」と「Planet of the Apes」を単体で訳させると、それぞれ対応する名称がちゃんと出力されます。ということは、今回の場合なら、文章の区切り方が「Muslim brotherhood and Planet / of / the Apes」という区切りであると判断されたために両者が固有名詞である可能性が排除されたように思われます。

Microsoft翻訳は上述のようにあらかじめ固有名詞を確定させて文の構造を区切るか、あるいは特定の文節を固有名詞として訳させる確率が高くなるような何かしらの機構が備わっていると思われます。そのために、今回の場合はGoogle翻訳より的確に固有名詞を訳出できたのでしょう。

とはいえ、結論を出すにはサンプル数が少なすぎるのも事実。今のところはおもしろい傾向があるというだけにとどめておいて、これを読まれた方も退屈しのぎに適当な映画のタイトルを「&」で結んで訳して調べてみてはいかがでしょうか。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です