- 「顔画像処理を用いた音声を利用しない音声認識技術(読唇技術)の改善」 九州工業大学 大学院情報工学研究院 知能情報工学研究系 准教授 齊藤 剛史

「顔画像処理を用いた音声を利用しない音声認識技術(読唇技術)の改善」 九州工業大学 大学院情報工学研究院 知能情報工学研究系 准教授 齊藤 剛史

「九州工業大学 新技術説明会」(2019年12月10日開催)にて発表。https://shingi.jst.go.jp/list/kyutech/2019_kyutech.html

【新技術の概要】
読唇技術は、声の出せない障害者のコミュニケーション支援や騒音環境における音声認識の利用など次世代インタフェースの一つとして注目されています。本技術では、顔画像処理...
「九州工業大学 新技術説明会」(2019年12月10日開催)にて発表。https://shingi.jst.go.jp/list/kyutech/2019_kyutech.html

【新技術の概要】
読唇技術は、声の出せない障害者のコミュニケーション支援や騒音環境における音声認識の利用など次世代インタフェースの一つとして注目されています。本技術では、顔画像処理を用いて発話者の属性情報や表情特徴を用いることで従来の読唇技術の精度を改善します。

【従来技術・競合技術との比較】
音声認識技術は実利用されていますが、発声が困難な発話障害者や騒音環境下、声を出しにくい公共の場所などでは利用が難しい問題があります。また従来の読唇技術では発話者の属性情報等は考慮されていません。本技術は従来の読唇技術よりも認識精度の改善を可能としました。

【新技術の特徴】
・発話者の属性情報や表情特徴の導入
・発話障害者のコミュニケーション支援の実現
・音声情報不要の雑多な騒音環境や音声が収録できない環境における発話内容認識の実現

【想定される用途】
・携帯電話・無線機等の音声通信分野
・医療・福祉現場
・玩具・ゲーム等のアミューズメント分野

#情報

channel新技術説明会

※本サイトに掲載されているチャンネル情報や動画情報はYouTube公式のAPIを使って取得・表示しています。

Timetable

動画タイムテーブル

動画数:2147件