電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
2. 働き方改革を支えるICT
【生産性向上を支えるICT】
特集 2-6
会議録作成を支援するICT
ICTs to Support Meeting Record Creation
abstract
逐語的な会議録の人手による作成は大きな負担が掛かる一方,近年の音声認識技術の進展でその自動化の期待が大きくなっている.本稿では会議のような話し言葉を自動的に書き起こす音声認識技術の現状について概観した上で,国会(衆議院)で導入・運用されているシステムについて紹介する.更に,一般の会議などを対象とした研究開発の展開について紹介し,働き方改革の観点から会議の記録の方法について考察を述べる.
キーワード:音声認識,会議録
組織においては,国家のような大きなものからプロジェクトチームのような小さいものまで,多数の人間が属しているので,会議を行うのが不可欠である.組織における会議は通常明確な目的を有するもので,意思決定を行ったり,それに至るための議論を行ったり,必要な情報をやり取りすることが挙げられる.そして,その結果を組織内で共有するために(あるいは外部への透明性の観点から),記録を残すことが必要になる.これが会議録である.
会議録には大きく分けて2種類ある.一つは,議事とその結論(決定事項)や要点(重要な情報や主要な意見)のみを列挙するもので,議事録と呼ばれることが多い.もう一つは,個々の発言の逐語的な記録であり,逐語録とも呼ばれる(1).議事録は発言の順序との対応関係が明確でなく,その作成には高度な判断が必要となるので,通常は書記担当が作成し,組織全員の確認を経て確定する.議長が議事ごとに結論を復唱するようにすれば,議事録作成自動化の可能性もあるが(2),余り現実的と言えない.これに対して,逐語的な会議録の作成の方が,手間が掛かる反面,音声認識技術による自動化も可能と考えられる.例えば,1時間の音声を書き起こすのに5~10時間要するといわれており,1時間の会議でほぼ1人×日の労力になる(外注すると多くのコストと時間遅れが生じる)ので,これを効率化することの効果は非常に大きいと期待される.本稿では,この逐語的な会議録を効率的に作成するためのICT,特に音声認識技術について概観する.
音声認識の研究開発の歴史は長いが,その主要な目標は計算機(スマートフォンやスマートスピーカを含む)やロボットとのインタフェースであり,人間同士が話す音声を書き起こすシステムを扱うようになったのはこの20年のことである.
ヒューマン・マシンインタフェースでは,ユーザは音声認識装置に向かって話すことを意識した上で,内容を事前に考えて,文法的で単純な文を,明瞭に発声する.これに対して,人間同士の自然な話し言葉では,考えながら発話が行われ,口語的表現が多く,発声も明瞭とは限らない.また,文の区切り自体も不明瞭である.(図1)
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード