ブックタイトルSENTAN せんたん SEP 2021 vol.30

ページ
7/24

このページは SENTAN せんたん SEP 2021 vol.30 の電子ブックに掲載されている7ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。

概要

SENTAN せんたん SEP 2021 vol.30

知の扉を開くや精度の面で実用には未だ課題があり、改良していきたいです」と抱負を語る。さらに「同時音声通訳の研究を通じて、激務の同時通訳者のサポートや、新人のトレーニングなど人間の助けになり得ると考えていて、その有効な使い方も考えてみたい」と柔軟な発想で取り組んでいる。また、留学生のため、日本語の講義アーカイブに自動的に英語字幕をつける学内プロジェクトも手掛けている。発話の生成と音声聴取の仕組みをまねる人が発話を習得する仕組みを模した「マシン・スピーチ・チェイン」の研究は、サクティ特任准教授が行っている。「人は発話するとき、発話した自分の声を聴き、安定した発話をすることができます。機械も、音声認識(聞く)と音声合成(話す)をループ(輪)のように繰り返し、修正することで精度を増すことができます」。現段階では、音声合成や音声認識は、あらかじめ入力した言語特有の音波の波形などの音声データとそのテキストを参照して学習しているが、この方法を使えば音声データとその書き起こしデータのペアがなくても学習ができる。サクティ特任准教授は、インドネシアのバンドン工科大学を卒業後、ドイツ留学を経て来日し、本学に赴任した。「この研究を人間のコミュニケーションをサポートできる技術に発展させたい」と期待する。自閉症のコミュニケーションの訓練医療現場の課題に取り組んでいるのは田中助教。コンピュータ画面上のCGアニメの人型アバター(仮想エージェント)と質問応答を重ね、その返答の内容、表情、応答の遅れ、声の使い方など非言語の反応を解析することで、自閉症のコミュニケーションの訓練や認知症の早期発見に役立つシステムを開発した。自閉スペクトラム症などについては、臨床心理士らが行っている対人関係などを円滑にするための訓練「ソーシャルスキルトレーニング」に基づいたコンピュータシステムを構築した。アバターとのやりとりから、被験者の言葉による伝え方の評価を自動的に提示する技術で、実験では、被験者の能力の向上が確認された。また、認知症については、アバターとの応答の中で健常者と異なる特徴をみつけ、機械学習により判定の基準となるモデルを作製したところ、高効率で判定でき、9割を目標にしている。「今後、日常的に家庭で使ってもらえるようにステップアップしていきたい」。返すことで、思い通りの画像を結んでいく仕組みだ。個人の好みに合わせるなど課題は多いが、品川助教は「頭の中で描いたイメージを素早く確実に伝えられれば、意思疎通が格段にスムーズになります。目標として、広告やイラストの製作現場の補助役を想定しています」。エラーをかまわず翻訳研究室に所属する学生は36名の大世帯。このうち博士後期課程の学生は17名にのぼる。博士後期課程1年の福田りょうさんは、音声翻訳の際に、音声認識の段階でエラーが出ていても、そのまま受け取って機械翻訳に入り、エラーを修正しながら翻訳するという研究だ。AIの深層学習の「知識蒸留」という手法を使い、エラーを含まないデータを学習したモデル(教師モデル)から抽出された重要な知識を引き継いで、エラーのあるモデル(生徒モデル)に学習させて正解を出す。「翻訳の精度の底上げには成功しましたが、文脈から推測するなどさらに高度な手法を研究していきたい」。宮本佳奈さん(同1年)は、メンタルヘルスのために、音楽を使って感情を適切な状態に誘導する研究だ。脳波からAIの手法で予測した感情をリアルタイムに利用し、音楽を変化させるシステムを作っている。「個人に合わせた音楽が感情誘導に役立つことがわかってきました。今後は、日常生活の中で使えるような研究に広げていきたい」という。学部時代はドローンの制御の研究だったが「感情の制御に興味が移りました。研究室は文系を含め異分野の人が多く、毎日が楽しみです」。インドネシア出身のサシ・ノビタサリさん(同1年)は「マシン・スピーチ・チェイン」の研究で、音声認識により周囲の音の環境音のデータを取り、音声合成にフィードバックして、調節するシステムを構築している。「騒がしい場所では、音声合成の音量を上げてゆっくり話すなどのシステムは完成しましたが、リアルタイムでできるようにしたい」。小さいころからプログラマーになるのが夢で、本学のインターンシップに来て、留学を決めた。「一度決めたらやりとげる」が信条だ。▲福田りょうさん▲宮本佳奈さん言葉で画像を描く品川助教は、人が言葉で機械と対話して、望み通りの画像を編集する「ビジョン・アンド・ランゲージ」の研究に取り組んでいる。「明るい背景に」といった、あいまいな言葉の表現に含まれた意図を推測するため、その場でコンピュータが深層学習により画像を修正、提示する。この対話を何度も繰り▲サシ・ノビタサリさん?情報科学領域知能コミュニケーション研究室https://isw3.naist.jp/Contents/Research/mi-02-ja.htmlS E NTAN06