Loading...

カテゴリー: 類義語の訳し分け

Google翻訳がやってしまう、「そっくりさん」の読解ミス

米中首脳会談は合意に至らず終了し、今後もしばらく世界の注目を集めそうな雰囲気。 思えば始まる前から金総書記のそっくりさんが会場であるハノイから追い出されるなど、本題から外れた話題にも事欠かなかった印象です。 このそっくりさんニュース、実は海外でも広く報道されています。 日本でのこのニュースをもし、Google翻訳で英訳して読もうという人がいたとして(ありそうにない仮定)、 果たしてGoogle翻訳 続きを読む

表記ゆれVSGoogle翻訳 ~人称編~

今回の記事の発端は、自然言語処理における日本語の表記ゆれについて考察したこの文書。 「日本語は漢字、ひらがな、カタカナを併用している都合上、英語のようにアルファベットだけで表記される言葉よりも表記の多様性が多い」 なるほど例にあるように、「りんご」一つとっても「りんご」「リンゴ」「林檎」の3種類の表記があります。表記の違いでいちいちつまづかれては、信頼できる自然言語処理システムなど望めません。 そ 続きを読む

「死ぬ」の類義語、いくつ言えますか?そして機械翻訳はいくつ知っているのか?

前回の記事を書いた後であらためて「そういえば日本語で死ぬという表現もいろいろあるよな」とふと頭をよぎった昨日。 そうなると気になるのは、Google翻訳がどこまでの言葉を認識できるかという事。誰がなんと言おうと気になるもの。 ということで、日本語で「死ぬ」を意味する6通りの表現をGoogle翻訳で英訳させ、その訳語の傾向を調べてみました。 亡くなる 「死ぬ」の次ぐらいに頻繁に使われているんじゃなか 続きを読む