Loading...

機械翻訳がもたらすかもしれない「ことばの変質」を考える

文章が短いからといって解釈も簡単とは限りません。込み入った構文や対句表現に伴う省略表現など、書き言葉の複雑な構造が入り込んで来ると、短い1文でもたちまち機械翻訳の誤訳を誘うような文章になってしまいます。

今回の原文はWikiquoteより、アイルランドの文学者ジョージ・バーナード・ショーの作品の一節。

One man that has a mind and knows it can always beat ten men who haven’t and don’t.

Google翻訳

心があり、それを知っている一人の男は、いつも持っていない、していない10人の人を打つことができます。

Microsoft翻訳オンライン

1 つの男は、心を持って、それは常にしていない10人の男性を倒すことができます知っている

文の構造についての解説

これは、そもそも原文が少し複雑です。その原因は「that」と「who」を使った長めの形容詞節が2つあること

最初の形容詞節は「one man」にかかっています。前半部分の「One man / that has a mind and know it」までがひとくくりで、「自分で思考でき、それを自覚している人」というような意味を表しています。

2つ目は「ten men / who haven’t and don’t」。これは文章の前半部、「one man」にかかっている形容詞節と対句になっており、「自分で思考せず、その自覚もない10人の人間」という意味。「haven’t」が「has a mind」、「don’t」が「know」と対応しており、正反対の意味を表しています。

「haven’t and don’t」

先述のようにこの文章は、「one man」にかかる形容詞節と「ten men」にかかる形容詞節が対句になっています。そのため訳す際は単に「haven’t」と「don’t」を訳すのでなく、それぞれに対応する動詞、つまり前半に出てきた「has a mind」と「know」を当てはめて訳すべきでしょう。

そのような訳文を作るためには、この文章の前半と後半が対句になっていることを理解し、その上で後半部分の「haven’t」と「don’t」が以前に出てきたどの動詞に対応しているのかを把握し、それぞれを的確に置き換えて訳文に反映させる必要があります。

この点を考えると、どちらの訳文も及第点とは言えません。Microsoft翻訳に関してはどちらかを省略して「していない」だけを訳しているありさま。

対句構造を理解して訳させるには、文脈そのものをよりよく扱えることが欠かせません。文章から文脈や要旨を抜き出して文章を再構成するというタスクは、機械学習を使った自動文書要約ですでに行われていること。そこから得られた知見と機械翻訳を組み合わせれば、よりよく対句構造を訳せるのではないでしょうか。

Google翻訳やMicrosoft翻訳アプリを使えば、テキストや対話をリアルタイムで翻訳することができますが、精度が高まっているとはいえまだまだ限界はあるのが現状。今後の進歩次第でどうなるかはわかりませんが、しばらくの間は、機械翻訳が訳しやすい言葉を使うようユーザーが注意を払い、そうすることで誤訳を防ぐということが必要になるだろうと思われます。個人の発信するものが自動翻訳を通じて言葉の壁を越えて拡散するという意識が当たり前になってくるならば、より誤訳されにくい言葉や表現を使う方向へと向かうことでしょう。

そのような「機械翻訳フレンドリー」な言葉は、また従来の言葉遣いと違ったものになってくるかもしれません。そうした中で、英語の書き言葉にまつわる伝統的な言葉遣いもまた姿を変えていくことがあるのかもしれません。時代とともに言葉遣いが大きく変わるという事例は、少なくとも文章に関していえば、近代日本の言文一致体の普及に伴う変化が上げられます。

言葉の使い方が変わって、それが浸透していくのが先か、機械翻訳がそんな変化を必要としないレベルに達するのが先か、少し興味のあるところではあります。

Microsoft翻訳の文章構成

Microsoft翻訳文は構文の解釈がGoogle翻訳と異なっています。それは前半部分の「knows」を形容詞節の一部ではなく、「one man」を主語とする動詞のように扱っている点

Microsoft翻訳の解釈に即して訳すと、「自ら思考できる人間は、それが思考を持たずそれをしない10人の人間に常に優ることを知っている」というような訳文になります。

ただこの解釈は明らかな間違い

そのことは「knows」の直前に来る「and」の存在、そして最後の「haven’t and don’t」の存在からわかります。

「knows」の直前に「and」が来ているということは、これが「has a mind」とともに形容詞節の中に併置されていることを示しています。もしも「and」がなかったなら、これを「one man」を主語とする動詞として解釈できますが、この場合はそうはいきません。

また「knows」が形容詞節の中にないと仮定してしまうと、最後の「haven’t and don’t」の解釈に無理が生じます。ここが前半部分と対句を成していると仮定すると、最初の形容詞節の中に「haven’t」と「don’t」に対応する動詞が含まれていなければなりません。もしも「knows」がこの文の動詞であるとすれば、「has a mind」に対応する「haven’t」はともかく「don’t」が何にも対応しない宙ぶらりんになってしまいます。

もし前後の形容詞節を対句でないと仮定しても、「don’t」の前に「and」がついているため、これは「ten men」を主語とする動詞にはなりえません。そのため、こちらの仮定でも「don’t」の居場所がなくなってしまうのです。

「and」の1単語を無視したMicrosoft翻訳の訳文からは、まず妥当な解釈としてありそうな文の構造を推定し、それに沿うように「and」をノイズとして排除した、というような翻訳プロセスが見えてくるようです。どのような処理が行われているのかは不明ながら、Google翻訳にも時々見られるように、どこかの時点でノイズとして判断された単語を省略するというステップが含まれているのではないでしょうか。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です