Loading...

原文がミスだらけ!そんな時、機械翻訳はどうするのか?

多少言葉遣いが間違っていても、読めばなんとなく意味はわかる、ということはままあることです。人間であればそうですが、では、多少めちゃくちゃな文章を機械翻訳に読ませるとどうなるか?

どうやら短い文章であれば、文法ミスに惑わされず大意を掴むことができるようです。

今回の原文はこちら。

all your base are belong to us

Google翻訳

あなたの拠点はすべて私たちのものです

エキサイト翻訳

すべてのあなたのベースは私達に所属である

原文の文法ミス

これは翻訳以前に、原文が文法ミス満載という点に注意してください。

今回の原文は、『ゼロウイング』というコンピューターゲームのヨーロッパ移植版の台詞です。突如攻撃を仕掛けてきた敵組織が悠々と通信回線を開き、「君達の基地は、全て我々がいただいた」と言い放つ本来非常にシリアスな一言なのですが、ヨーロッパ移植版ではなぜか奇妙な英訳になってしまいました。

れだけならすぐに忘れられたことでしょうが、わずか一文の中に高密度に詰め込まれた文法ミスが織りなす絶妙な可笑しさがウケて、英語圏のネットユーザーの間で有名なネタとして定着したのです。

文中にある文法ミスを以下に列挙してみましょう。

・All your base: Yourやhis、mineといった所有格を表す言葉に直接「all」をつけることはできず、「of」を挟まなければならない。「All of your」という書き方が望ましい。

・Baseの数: 「All」とある以上基地は複数あるのだから、そもそも単数の「base」では間違い。「All of your bases」となるべきだろう。

・Are belong to: 「belong」は動詞なので「are」が余分。

・Belong to: 厳密に文法ミスとは呼べないがニュアンスに問題あり。「belong to」は「属する」という意味だが、「あるべき場所に属する」、「快適な(望ましい)場所にいる」というニュアンスがあり、武力で基地を制圧した側が言うのは不自然。支配する、あるいは服従を強いることを表すには「take over」という方が自然。「世界征服する」と言いたいときも「Take over the world」でOK。

これだけのミスが重なっていれば、ネイティブから見ればよほど妙なカタコトに感じるでしょう。あえて日本語に訳すとすれば、「君達基地は、全て我々のほうに属していてある」のような印象になるでしょう。

細かいミスがこれほどあるにも関わらず、Google/エキサイト翻訳ともども一応は破綻のない日本語に訳されています。これはおそらく文の意味を解釈する上で、動詞の活用や複数形の表記よりも単語の配置順が重視された結果と考えられます。

英語の基本的な語順は主語→動詞→目的語です。単語の順番と品詞の種類だけを頼りにこの原文を読み解くだけでも、「base」が主語、「are」と「belong to」が動詞、「us」が目的語だとわかります。動詞がふたつあるので、考えられる場合分けをしてみましょう。

1つ目は動詞の「are」に続いて「belong to」が何かのミスで入り込んだという場合、2つ目は「belong to」が動詞で「are」が余分な場合、3つ目は現在進行形の「are belonging」と書こうとして書き間違えた場合、最後は、受動態の「are belonged to」と書こうとして書き間違えた場合が考えられます。ちなみに「belong」は状態を表す動詞なので現在進行形にはならず、目的語をとらない自動詞なので受動態にはできません。3番目と4番目のケースは文法と表記の2重のミスを犯していることになります。

それぞれの場合の意味はどうなるでしょう。まず1番目の例は「belong to」がなくなって「君達の基地は我々だ」となります。2番目の例と3番目の例は「belong to」の意味が消えないので、おおむね「君達の基地は我々のものだ」となります。4番目の例についてはそもそも意味が通らないため訳しようがないのですが、動作をする主体と動作が向かう対象が入れ替わるという他動詞の受動態の性質から強引に「我々は君達の基地に属する」としておきましょう。

この文章の解釈は、「are」と「belong」のどちらが不要であるかの判断によって大きく変わります。そしてテキストだけを手がかりに(つまり、「belong to」をわざわざ余分に書き足すような間違いをしないだろうという常識的な推論に頼らず)どちらが本来の意図であるか判断するのはほぼ不可能でしょう。ではなぜGoogle翻訳は2番目の意味で訳したのか?

ここで実験として、「He belongs goes fires」という動詞3段重ねの短文をGoogle翻訳にかけてみました。

ると「彼は火事になる」という、最後の「fires」の意味だけを反映した訳語が出てきたのです。それから「fire」を消して「he belongs goes」にすると、訳語は「彼は行く」に変化します。サンプル数が少ないのでまだ確たることは言えませんが、どうやらGoogle翻訳は動詞が並んでいる場合、順番が最後に来る動詞の意味だけを拾う傾向にあることが見て取れます。

少なくともGoogle翻訳はこの原文を、「base」を主語、「belong to」を動詞、「us」を目的語とした文章だと解釈したようです。そしてこれだけの情報でも、かろうじて「基地が我々に属している」という意味を伝える一文を作ることができます。

細かなミスにも関わらず訳文が正確だったのは、こうした大まかな構造を手がかりに訳したからではないでしょうか?

つまり、単語の登場する順番などの大まかな規則を手がかりに「それっぽい意味」をまず掴んでおり、その上で動詞の活用やat、on、inなど細かな文法的規則をもとに訳文の調整をするという2段構えの動作をしているのかもしれないと考えられます。

考えてみれば、細かな文法的規則に頼らず文章の意味を大まかに掴むことは人間でも普通にできることです。「我々 君達の基地 奪った」と書けば国語のテストで点はもらえないでしょうが、日本語の基本的な語順から「我々(主語)が君達の基地(目的語)を奪った(動詞)」と言っている可能性が高いことは見当がつきますし、「君達 我々の基地 奪った」と語順を変えればそれだけで意味が変わったように感じます。

もちろん「てにおは」などによって文法の細部が補われれば、文の意味が予想と違うことがわかるかもしれません。多少不自然ですが、「我々から君達の基地(主語)が奪った(動詞)」となる場合だってあるわけです。

しかし、「我々で君達の基地に奪った」のように文法に間違いがある場合、意味を成さないかもしれない「てにおは」の情報は切り捨て、語順をもとに意味を推測するという方法にも合理性があるのではではないでしょうか。

もちろん、機械翻訳がどのように訳文を作成しているのかをどれだけ論じても推測の域を出ることはありません。

しかし機械翻訳の振る舞いを観察することで、人間が言葉を読み取る行為へについて、これまでにない知見が得られるということも、全くないとは言い切れないと思われます。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です