小特集 1-2 話し言葉コーパスの構築と公開

電子情報通信学会 - IEICE会誌 試し読みサイト
Vol.102 No.6 (2019/6) 目次へ

前の記事へ次の記事へ


1. 言語・音声データとICT

小特集1-2

話し言葉コーパスの構築と公開

Construction and Publication of Spoken Corpus

小磯花絵

小磯花絵 国立国語研究所音声言語研究領域

Hanae KOISO, Nonmember (Spoken Language Division, The National Institute for Japanese Language and Linguistics, Tachikawa-shi, 191-8561 Japan).

電子情報通信学会誌 Vol.102 No.6 pp.554-557 2019年6月

©電子情報通信学会2019

1.話し言葉データの蓄積・文字化データの公開

 話し言葉の研究は内省が効かないこともあり,音声を録音・文字化して蓄積し,それを研究に活用するという方法論は古くからとられてきた.例えば国立国語研究所では,東京における日常談話の収録を1952年に開始している.比較のために収集されたニュースや講義などの独話と合わせ,音声を文字化した上で語・文節・文・イントネーションなどの情報を付与し,日常談話の特徴を定量的に解明する研究が進められた(1).1960年,1963年には,拡張した話し言葉データに基づき,話し言葉の総合文型を目指す報告書が刊行されており(2),(3),話し言葉データに基づく記述研究から理論研究への展開が図られた.正に現在で言うところのコーパスに基づく研究だが,残念ながら収集された音声データや文字化資料・各種研究用付加情報は公開されることはなかった.この時代,人文系の研究のために集められた多くの話し言葉のデータが,同じ運命をたどったものと思われる.

 人文系の研究のために集められた話し言葉データが公開されるようになったのは1990年代に入ってからである.計算機の普及が背景にあったことは間違いない.


続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。


続きを読む(PDF)   バックナンバーを購入する    入会登録


  

電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。

電子情報通信学会誌 会誌アプリのお知らせ

電子情報通信学会 - IEICE会誌アプリをダウンロード

  Google Play で手に入れよう

本サイトでは会誌記事の一部を試し読み用として提供しています。