電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
1. 言語・音声データとICT
小特集1-2
話し言葉コーパスの構築と公開
Construction and Publication of Spoken Corpus
話し言葉の研究は内省が効かないこともあり,音声を録音・文字化して蓄積し,それを研究に活用するという方法論は古くからとられてきた.例えば国立国語研究所では,東京における日常談話の収録を1952年に開始している.比較のために収集されたニュースや講義などの独話と合わせ,音声を文字化した上で語・文節・文・イントネーションなどの情報を付与し,日常談話の特徴を定量的に解明する研究が進められた(1).1960年,1963年には,拡張した話し言葉データに基づき,話し言葉の総合文型を目指す報告書が刊行されており(2),(3),話し言葉データに基づく記述研究から理論研究への展開が図られた.正に現在で言うところのコーパスに基づく研究だが,残念ながら収集された音声データや文字化資料・各種研究用付加情報は公開されることはなかった.この時代,人文系の研究のために集められた多くの話し言葉のデータが,同じ運命をたどったものと思われる.
人文系の研究のために集められた話し言葉データが公開されるようになったのは1990年代に入ってからである.計算機の普及が背景にあったことは間違いない.
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード