Loading...

月: 2019年2月

Google翻訳がやってしまう、「そっくりさん」の読解ミス

米中首脳会談は合意に至らず終了し、今後もしばらく世界の注目を集めそうな雰囲気。 思えば始まる前から金総書記のそっくりさんが会場であるハノイから追い出されるなど、本題から外れた話題にも事欠かなかった印象です。 このそっくりさんニュース、実は海外でも広く報道されています。 日本でのこのニュースをもし、Google翻訳で英訳して読もうという人がいたとして(ありそうにない仮定)、 果たしてGoogle翻訳 続きを読む

表記ゆれVSGoogle翻訳 ~人称編~

今回の記事の発端は、自然言語処理における日本語の表記ゆれについて考察したこの文書。 「日本語は漢字、ひらがな、カタカナを併用している都合上、英語のようにアルファベットだけで表記される言葉よりも表記の多様性が多い」 なるほど例にあるように、「りんご」一つとっても「りんご」「リンゴ」「林檎」の3種類の表記があります。表記の違いでいちいちつまづかれては、信頼できる自然言語処理システムなど望めません。 そ 続きを読む

「タイムアタック」の英訳2通り、どこまで訳し分けられる?

性能は高くともまだまだ人間並みとはいかない、細かいニュアンスがそぎ落とされると言われるGoogle翻訳でも、英訳をする際の外来語やカタカナ語の訳は基本的に外さないもの。 言ってみれば英単語をそのままカタカナ読みしているだけだから当然のこと。しかし和製英語が入り込むと、話はとたんにややこしくなります。 今回は「タイムアタック」の英訳を例に、和製英語が絡むGoogle翻訳の事例を見てみましょう。 「タ 続きを読む