電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
電話音声の周波数帯域は約3,000~4,000Hzであるが,1920年代,電信用大陸間横断ケーブル(伝送帯域は電話の数十分の一)でも音声を送りたいとの要望があった.この要望に対して,1939年,Dudleyは,人間の発声機構と聴覚特性に基づくボコーダ(分析合成符号化)を発明し,300Hz程度の帯域でも音声伝送が可能であることを示した(1).これは,音声を声道の周波数特性を表す10チャネルの周波数スペクトルと声帯の基本周期,有声・無声情報に分解して送信し,受信側で再合成する技術である.このように,音声技術開発には様々な分野の知見が必要である.音声研究会では,言語学・医学・生理学・心理学の分野も巻き込み,音声言語活動の諸現象の解明から,音声符号化・合成・認識技術による情報通信,福祉・教育応用までの広いトピックを扱っている(2).
音声研究会は,1955年に日本音響学会に設置された「音声の分析合成委員会」(関英男委員長,田宮潤幹事)による年数回の会合が始まりである.当時資料の体裁は自由で,文献としての保存性・引用性は考慮外であった.1963年から研究会運営の委員会名を「音声研究委員会」と改称し,藤村靖,中田和男,大泉充郎,齋藤収三,鈴木誠史,藤崎博也ら歴代委員長により運営主導された.研究の要約は研究会報告として音響学会誌に掲載された.1964年から科研費の音声総合研究・特定研究が継続的に行われ(3),1973年から音声研究会と共催会合となった.原則毎月開催で原稿の体裁も統一され文献として保存・参照可能となった.一方,電子通信学会には古くから音響学会と共催の電気音響,超音波研究会はあったが音声に対応する組織がなかった.そこで,活発な音声研究を本会の会誌・論文誌・大会の企画へ反映するため,1984年に音声研究専門委員会が設置され,1985年から音響学会と共催の音声研究会を実施している.1986年度から研究会資料作成も当会が行い,現在に至っている.
この約60年間で音声符号化・合成・認識技術は大きく進展した.1980年代後半から無線通信の回線数の増加が必要となり,アナログ音声通信と同等品質で4~12kbit/sの低ビット音声符号化技術が要求された.そのブレークスルーとして,符号励振線形予測符号化が提案された.これは,発声機構をモデル化したボコーダ技術と波形ひずみ最小化技術の組合せである.これに,板倉文忠らによる周波数スペクトル情報の高圧縮技術を適用することで,ディジタル音声符号化としてアナログをしのぐ高能率・高品質化が実現された.
音声合成・音声認識技術では,初期のヒューリスティックな特徴抽出,パターンマッチングの時代を経て,大規模音声コーパス利用,隠れマルコフモデル,そして,2010年以降の深層ニューラルネットワークによる機械学習により大幅な性能向上が実現された.これによりスマートホン・カーナビ等の音声入力・音声アシスト,テレビ字幕や音声読み上げ,議会録作成の実用化,更に,音声翻訳,ロボット対話,語学教育といったより高度なサービス提供が可能になった.
謝辞 研究会の成り立ちについて,藤崎博也東大名誉教授から御教示頂いた.ここに感謝致します.
(1) 板倉文忠,“音声分析合成の基礎技術とその音声符号化への応用,”信学会フェロー&マスターズ未来研究会資料,FM06-2-1, July 2006.
(2) 音声研究会の概要,https://www.ieice.org/~sp/jpn/outline.html
(3) 音声科学,大泉充郎(監修)・藤村靖(編著),東京大学出版会,1972.
(平成29年5月15日受付 平成29年7月11日最終受付)
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード