~広報誌せんたん 「開拓者たちの挑戦」から~

[2019年5月号]

▲中村 哲 教授

機械が同時通訳する

 国際的な共同研究やビジネスの進展に加えて、来日外国人観光客の急増、2020年の東京五輪などグローバル化を背景に、日本語と外国語の双方を素早く正確に機械で翻訳して、コミュニケーションを深めることは、必須の社会的基盤の技術開発としての需要が高まっている。世界でも数少ない音声翻訳の拠点である本学知能コミュニケーション研究室の中村哲教授らは、これまでの短い文章の機械翻訳の限界を大幅に超えて、発話の途中から、次々と訳していく同時通訳の方式を取りいれた「次世代音声翻訳」の研究に取り組んでいる。このために配布される科研費は平成29年度から5年間で2億円と大幅な額だ。

 これまで中村教授らが行ってきた音声翻訳の研究は、発話が終了してから認識して、翻訳、音声合成するという方式で、旅行会話など多くの人が体験する場面を念頭に置いて開発し、かなり精度を高めることができた。しかし、「今回のプロジェクトは、その方式とは異なり、同時通訳が中心です。国際学会で長時間の講演を通訳者が文末を待たずに訳していくという高度なスキルを計算機で実現していこうとしています」と中村教授は構想を語る。

 日英の同時通訳が世界の言語でもっとも困難と言われるのは、文法上の語順が全く異なるからだ。例えば、日本語から英語に訳す場合、日本語は文末に動詞や肯定か否定の言葉が来るので、通訳者はある程度、文意を予測しながら、意味が確定した範囲の文節に区切って訳したあと、語順を入れ替えていくという作業をリアルタイムで同時並行に進める必要がある。

 このため、プロジェクトでは、同時通訳の技術に加えて、雑音を除いてクリアな音声を採取し、リアルタイムで認識する技術、翻訳の結果を音声合成する技術の分野の研究者も他大学を含め国際的に参加する大がかりな体制をとった。中村教授は「話し手の強調したい部分や感情を反映したり、映画の字幕のように内容をコンパクトにまとめたりする技術も研究対象にしています」と説明する。

▲須藤 克仁 准教授

 本プロジェクトにおいて機械翻訳技術を担当する須藤克仁准教授は、「音声認識、機械翻訳、音声合成それぞれがリアルタイムで働いて、できたものからバケツリレーのように渡すのですが、時には文末まで待つ必要があります。それが、律速要因になります」と語る。このため、通訳者の訳し方のデータを集め、人工知能(AI)の機械学習により、「どの時点で訳をまとめるか」を解析しておき、自動的に判断させるという。ただ、これまで124時間(約5万文)のデータを集めたが、本格的な実用化には約100倍のデータが必要で、別に専門用語など知識源のデータも入れなければならず、対訳の資料を活用するなどコスト削減の方法も研究している。須藤准教授はこのほか科学技術振興機構の「さきがけ」の個人研究者として機械翻訳の評価に関する研究を手がけるほか、中村教授とともに翻訳の日本語の講義アーカイブに英語字幕を付与する学内プロジェクトも進めている。

 中村教授は「工学的な技術で同時通訳を実現するのが、このプロジェクトの主眼ですが、 同時通訳者の脳の処理モデルの構築など本質的な課題にも及んでいけたらいいと思います。こうした大学ならではのコアな部分の基礎的な研究をNAISTで積極的に推進していきたいと考えています」と意欲を見せている。