Loading...

中国ニュース読解チャレンジ!AIと児童心理学について

2019年もはや一ヶ月が過ぎようというところ。遅まきながら乗り出す新年の新しいチャレンジ、それは……

中国語の勉強!

……もとい

Google翻訳を使って中国語の新聞記事を読む!

……勉強というよりは実験のようなものですね。

なぜこんなことをするって?

Google翻訳の日中間の翻訳精度が前々から気になっていたことに加え、中国語も少しかじってみたいなと思っていたので、じゃあ一緒にやってしまえ!ということで、じゃあ新聞でも読んでみようか!というのがことの子細。

ぱっとみて興味ありそうな記事をつまみ読みして、勉強がてらに気になったポイントを記録していきます。勉強ついでに。

未知の新華社通信エリアへ

今回ターゲットに選ばれたのは新華社通信

日本のニュースでもよく聞く中国の国営通信社です。なんでも中国語における外国語固有名詞の表記は新華社通信が基準になっているとのこと。

評判を聞くに報道機関としてはちょっと……という印象ですが、外国語と中国語の関わりを考える上ではかなり興味深い組織といえるでしょう。さっそくページを開いてみましょう。

トップページを見てもちんぷんかんぷん。よく見ると読めそうな……読めないような……。

記事リンク:http://www.xinhuanet.com/2019-01/21/c_1124018935.htm

読む記事はこれにしましょう。 「人工智能」ってのはAIのことにちがいない。童って漢字があるから多分子どもが関わることで、「心理问题」が続くことから、たぶん児童心理学研究にAIを応用したようなニュースでしょうか。

AI関連のニュースだからもっとキャッチーでサイバーな画像使ってるのかと思ったら、案外そっけない紙面。

そして長いかとおもったら意外にそうでもないですね。一番下の「いいね」アイコンはシェアボタンかなにかかと思って押したら、記事自体のプラス評価だったようです。自分が押した時点でいいねが3つ目でした。

記事の読解へ

早速記事をGoogle翻訳にかけたところ、おどろいたことに結構読める

一段落目は多少違和感があるなという程度で、人間の初心者が訳した文章だと言われれば納得するぐらいの出来です。おっかなびっくり読んでいってみましょう。

1段落目

1月20日、ワシントン州新華社通信(周洲記者)統計によると、子供の最大20%が不安やうつ病を経験することがありますが、これらの心理的問題は間に合わないため発見が困難な場合が多いため、最善の介入機会を逃します。アメリカの研究者は、そのような問題を迅速かつ正確に識別することができる子供の行動スクリーニングツールを開発するために人工知能を使用しました。

「間に合わないため発見が困難な場合が多いため」と、「ため」が連なっているのは文章として不自然。さらに「間に合わない」にほのかな誤訳のニオイが。一体何が間に合わないのでしょうか?

中国語が読めないなりにGoogle翻訳を辞書代わりに文章を分解したところ、「間に合わない」となっているのは「很难/被/及时/发现」という箇所の和訳のよう。

こんどはちゃんと辞書を引きつつ見てみると、これはそれぞれ「難しい/受動態になることを表す前置詞/素早く・タイムリーに/発見する」という単語の連なりになっています。ここから考えると、訳文は「間に合わない」よりは「早期発見が難しい」の方があっているように思われます。

2段落目

実験中、63人の子供たちが暗室に導かれ、研究者はまず何かを見るように促し、目を覚まさないように気を付けてから、すぐにガラス容器で布を覆い隠し、偽のヘビを引き抜きました。これらの子供たちは遊んでいます。

2段落目も言いたいことはある程度わかる……と言いたいところでも、細かいところを見ると結構な突っ込みどころが。

まず文章が長い。原文が長い一文だからというのもあってのことでしょうが、これなら真ん中あたりで一度切ったほうがバランスもよく読みやすくなるでしょう。地味に最後だけ文を区切ってありますが、この切り方ではよろしくないんじゃあ……?と思ってしまいます。

次に違和感を覚えたのは「まず何かを見るように」の部分。「何かを見る」って、なんとも言えずおかしい言葉遣いじゃないですか?

見るものを指定するなら「何か」はおかしいし、それとも適当に何でも見てていいよと言うのは実験としてどうなの?ということでチェックしてみましょう。

原文は「研究人员/首先/提示/他们/将看到/某种东西」と区切るのだろうかと検討をつけ(素人なので間違っていたらご指摘をお願いします)、それぞれの単語の意味を当てていくと「研究者は/まず/示した/彼ら(子どもたち)に/これから見る/何かを」となります。

こうなると訳文の検討がついてきます。それらしい解釈は、「研究者は子どもたちに対して、これからあるものを見せると伝えた」というものではないでしょうか。

3段落目

多くの場合、研究者はプロセスビデオを見たり、子供の行動や言語を評価したりして、心理的問題があるかどうかを診断します。このテストでは、研究者らはセンサーモニタリングデータを収集し、不安と鬱病のある子供を分析するために機械アルゴリズムを使用した。その結果、正解率は81%であり、一般的な親のアンケートよりも優れている。

ぱっと見は問題がなく、結構すっきりとしたおもしろくない訳文ができています。

ひとつイチャモンをつけるなら「プロセスビデオ」の部分。

原語の「过程」という単語が「過程・プロセス」という日本語に相当しているのですが、これは「実験の過程を映した映像」と解釈するべきでしょう。そうなると妥当な日本語は「実験の過程を映した映像」あたりでしょうか。

4段落目

不安やうつ病を持つ子供たちは、潜在的な不確実性に直面して他の子供たちよりも不安であり、回避する傾向がありますが、センサーとアルゴリズムは助けになります。結論に来てください。

佳境に来たとにおわせる、見るからに問題ありそうな箇所です。大意はつかめても個別の文節は不可解なものが多く、人間の言語理解のいいかげんさを突きつけてくる部分です。

「潜在的な不確実性に直面して」に(おそらく)相当するのは「面临潜在不确定因素」の「」という一文字。これは時間を意味する単語で、例文を見てももしかするとおそらくニュアンスとしては英語の「moment」や「when」のようなものだと解釈するべきに思えます。

となるとより正確な和訳は「潜在的な不確実性に直面したとき」にするべきでしょうか。

そして最後にとってつけたような「結論に来てください」という一文はかなり意味不明。

例文集を見ても一致する文章はありません。原文で相当すると思われる「这一/算法/发现」(この/アルゴリズムの/発見)の単語から考えると、「(実験に使った)アルゴリズムが明らかにしたことはすなわち」のような解釈になるような気はするのですが、どうも自信がないので、学識豊かな誰かがこれを見てツッコんでくれるのを待つことにします。

最終段落

時宜を得た介入がなければ、これらの子供たちは薬物乱用の危険性が高く、成人期には自殺しています。

一気に飛ばして最後の段落。

一番気になったのは「薬物乱用の危険性が高く、成人期には自殺しています」という部分。「自殺しています」と突然断言する不気味さからは誤訳のニオイが漂ってきます

原文は「这些儿童成年后滥用药物和自杀的风险更高。」。漢字が続くと目が滑りそうなのですが、素人目でがんばって読んでいくと「これらの子どもたち/成人後/薬物乱用/と/自殺/の/危険性/さらに高い」という区切れると思います。

この区切り方をもとにすると、どうも「危険性」は「薬物乱用」と「自殺」の両方にかかっているように思えます

とはいえ本当にそうなのか?

これが英語であれば「risks of drug abuse and suicide」と複数形になるので両方にかかっているとわかります

ただ、これを今読んでいる人は中国語に疎い

堪能な人であれば文法的な何らかの規則でもって両方にかかっているのか、あるいは片方にしかかかっていないのかを判断できるのかもしれないのですが、残念なことにこれを書いているのは素人。うかつに判断を下してそのまま間違うのは素人の黄金パターンです

ちなみに「滥用药物和自杀的风险更高」だけを抜き出してGoogle翻訳に訳させてみると「薬物乱用および自殺のリスクが高い」と出てはきます。文脈から見てもこの解釈がよさそうなのですが……最後の確信が持てません

いつの日か博識な方がツッコミを入れてくれるのを待ちつつ、このような形式の文章の読解について勉強を続けることにします。

おわりに

まとまった量の中国語の文章を読むのは漢文の授業以来。ですが、ニュース記事でもGoogle翻訳を使って結構読めそうな手応えです。

ただ、細かいところを穿っていけば誤訳が散見されるのも事実。頭から信用せず、怪しいな、と思ったところは調べておかないと、たいへんな勘違いをしかねないという印象。

あくまでも大枠を粗く理解するための方法にとどめておき、細かい事実のチェックはやはりある程度中国語が読めないと難しいようです。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA