![]() |
電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
解説
野球中継を対象とした解説音声自動生成技術
Semi-automatic Production and Distribution System for Audio Descriptions in Live Baseball Broadcasts
A bstract
視覚障害者に向けた情報保障サービスの一つに解説放送があるが,スポーツ中継のような生放送に対してはほとんど付与されていない.そこで我々は,野球中継に対して自動で解説音声を付与する“解説音声制作・配信システム”を開発した.解説音声はクラウドを通して,ユーザのスマートフォンに配信される.解説の基となるテキストは専用ツールを用いて手動で作成されるほか,画像認識の活用により一部自動で生成される.被験者実験を通して,本システムで配信した解説音声が,視覚障害者のスポーツ中継視聴体験の向上に寄与することが示唆された.
キーワード:アクセシビリティ,解説音声,画像処理,画像認識
アクセシビリティの観点から,あらゆる放送映像に対して解説音声を付与することが求められている.解説音声とは,画面が見えなくとも,今発生していることを理解できるように情報を補足する音声であり,視覚障害者に向けた情報保障サービスの一つである.近年,アクセシビリティに対する意識の高まりから,ドラマや映画などの収録済みの映像作品に対して解説音声を付与することは一般的になりつつある.
テレビ放送においては,音声多重放送の副音声として各家庭のテレビに送られる解説放送サービスがある.NHKの場合,連続テレビ小説や大河ドラマに解説音声を付加しているので,興味のある方は是非リモコンの“音声切替”から副音声に変更して聞いてみてほしい.映画に対する解説音声提供サービスとしては,“Hello! Movie(1)”や“UDCast(2)”が有名である.これらのサービスでは,アプリケーションをあらかじめインストールした各ユーザのスマートフォンから解説音声を聞くこととなる.映画の主音声にあらかじめ埋め込まれた“音声マーカ”にアプリケーションが反応し,マーカに応じた解説音声が再生される仕組みである.
近年,AIを活用して映像に対する説明テキストを自動生成する試みも行われている.IBMはWatsonXを用いてテニス映像に対する説明テキストを生成することを試みた(3).マルチモーダル大規模言語モデルを活用したMM-VID(4)と呼ばれる説明テキスト生成モデルも登場している.収録済映像を入力すると,映像や音声情報を基に,映像理解に必要なテキストを自動で出力する.
一方,スポーツ中継のような生放送への解説音声の付与が望まれているにもかかわらず,生放送に対してはほとんど解説音声は付与されていない.生放送に対して解説音声を付与するための最も単純な方法として,解説音声付与専用のアナウンサーが発話する方法がある.ただし,この方法では通常の中継と比べて機材や人的コストが多くかかることから,継続的に行うことが難しい.また,逐次変わる状況を認識しながら,解説すべき内容をリアルタイムで推敲する必要があることから,技術的にも非常に難しいということが課題として挙げられる.以上から,生放送番組に解説音声を付与するには,なるべく低コストかつ容易に提供できる基盤を構築することが重要となる.
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード