「口パク」で声を出さずに音声認識 ~声を出せない人や状況の為に~
知能情報学、知覚情報処理
自然言語処理、黙声音声認識、無発声音声認識、確率文法、情報抽出
現在の中心としている研究の目的は、声を一切出さずに発声時と同様に口を動かす (いわゆる「口パク」) だけで、音声認識と同様の入力・操作ができるようにすることです。この黙声認識、または無発声音声認識と呼ぶ技術の研究を行っているところは、世界的にもまだ多くはありません。音声認識は有用な技術ですが、実際に情報機器を街中で音声操作する場合などを考えると、話し声が周囲への迷惑となる、他人に聞かれたくない情報を口に出さなければならない、などの問題あります。現在の研究では、音声操作の良い点は保ったままに、実用上では問題となる「聞こえる音の必要性」をなくした、新しい入力・操作手段の実現を目指しています。現状はまだ、基礎研究段階ですが、研究が発展すれば音声認識の応用範囲のほぼすべてを含んだ上で、プライバシー確保などの理由で、声を出せない状況や、工場内のように、騒音が激しくて、マイクが役に立たない状況での音声入力、声帯を失って声を出せない人のための、音声入力手段・発声代行などの分野にも応用できます。また、発声時は実際の会話、黙声時はシステム操作、とモードを切り替えることで、システム操作用の言葉がたまたま会話中に出現しても、システムが誤動作しない処理系も可能です。
これからの世の中、情報機器やネットワークを活用できることは、豊かな生活を送る上で必須と言えましょう。健常者であってもそうですが、何らかのハンディキャップを持つ人にとってはなおさらのことです。
それだけに、現在の研究を起点として、たとえハンディキャップを持つ人であっても、情報機器を安心して操作・活用できるようにするための技術を総括する方向へと発展させていきたいと考えています。