電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
音声言語理解のこれまでとこれから
小特集 6.
音声からの感情・態度の理解
Recognition of Emotional and Attitudinal Information Conveyed by Speech
abstract
音声は,言語情報だけではなく,話者の感情や態度などの情報を伝達する.このような情報を用いることで,人間と機械のコミュニケーションをもっと自然で豊かなものにすることが望まれる.本稿では,音声からの感情や態度などの認識技術の現状,及び音声インタフェースへの応用について解説するとともに,音声からの感情・態度の理解に向けた今後の研究を展望する.
キーワード:感情,パラ言語情報,音響的特徴,コーパス
音声をテキストに書き起こすと,音声が本来持っていた情報は一部欠落するが,その情報の中には,音声コミュニケーションの本質と言ってもよい重要な要素が含まれている(1).一般的な音声対話システムでは,ユーザ発話からの言語理解の前段に音声認識モジュールが置かれるが,音声認識の目的は音声のテキスト化であるから,テキストにできない情報,すなわちパラ言語情報はここで欠落する.このような情報を捨てることなくすくい上げ,人間と機械のコミュニケーションをより自然で豊かなものにすることは当然に望まれるが,それはいまだ十分に達成されていない.
本稿は,音声コミュニケーションの重要な要素である感情及びその周辺に焦点を当て,音声からの認識技術及びその応用の現状を解説する.
この種の研究には,(a)感情の認識そのものを目的とするものと,(b)感情などに関連するパラ言語的特徴を利用して音声インタフェースを改善・高度化することを目的とするものがある.(a)の研究には具体的な応用を想定していないものも多く,この点で(a)と(b)の間には感情などを認識することの意味や意義に対する考え方の隔たりがあるように思われる.(a)を「役に立つ」ものとするためには,このギャップを埋める何かを発見しなければならない.その一助となることを願って,本稿ではまず(a)の問題設定のために必要な概念及びその記述について述べた後に,5.で(a)の,次いで,6.で(b)の研究の具体例を取り上げる.音声からの感情・態度の理解に向けた今後の展望は7.で考察する.
心理学における感情の理論には,主に二つの考え方がある.一つはカテゴリカルな感情を前提とする基本感情説,もう一つは感情カテゴリーを認めず連続的な感情を前提とする次元説である.
Paul Ekmanらダーウィンの流れをくむ心理学の学派は,普遍的で文化に依存しない感情(=基本感情)の存在を主張し続けている.基本感情の中でも,「怒り」「喜び」「悲しみ」「驚き」「恐れ」「嫌悪」は,これまでの感情研究の中で繰り返し取り上げられ,しばしば6大感情と呼ばれる.「6大」というネーミングは,感情がそれらだけではないことを意味するのだが,音声からの感情認識の研究には,感情はこれらのうちのどれかであるという仮定に基づいたものも多い.
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード