小特集 1-3 日本語の歴史コーパス

電子情報通信学会 - IEICE会誌 試し読みサイト
Vol.102 No.6 (2019/6) 目次へ

前の記事へ次の記事へ


1. 言語・音声データとICT

小特集1-3

日本語の歴史コーパス

Corpus for Historical Studies of Japanese Language

田中牧郎

田中牧郎 明治大学国際日本学部

Makiro TANAKA, Nonmember (School of Global Japanese Studies, Meiji University, Tokyo, 164-8525 Japan).

電子情報通信学会誌 Vol.102 No.6 pp.558-562 2019年6月

©電子情報通信学会2019

1.は じ め に

 ICTの発展は,日本語の古典の電子化とその利用も活発化させている.日本語の古典テキストを研究対象とする学術分野には,仏教学,日本史学,日本文学,日本語学などがあるが,本稿は,日本語学に基盤を置いて,日本語の歴史的研究の資料として作成されている,国立国語研究所編「日本語歴史コーパス」を紹介する.言語学の個別部門である日本語学は,語彙,文法,文章といった言語を構成する要素を切り出して,その構造や運用を研究するので,テキスト中の単語,文,文章などに,研究用の情報を付与した「コーパス」としてのデータベースを重視している.上に挙げた,日本語学以外の学術分野では,言語よりもその内容に関心が向くために,そこで作成が目指される電子テキストでは,言語要素への情報付与は重視されていない.

 日本語の古典の電子化は,日本語学以外の分野の方が先行して始まり,例えば,日本文学の分野では,国文学研究資料館によって,既に1990年代に「日本古典文学大系」(岩波書店)の電子テキスト化が完了していた.電子テキストから進んで,言語要素に情報が付与されたコーパスの整備が行われるようになったのは,国立国語研究所がコーパス言語学に立脚した研究に力を入れ始めた2000年頃からである.明治中期から大正期にかけて最もよく読まれた総合雑誌「太陽」を対象に作られた「太陽コーパス」(1)が,古い時代の資料を対象としたコーパスの最初のものである.その後,2009年に国立国語研究所が大学共同利用機関になったのを機に,上代から近代までの日本語の変遷を通時的にたどることのできる「日本語歴史コーパス」の構築が始まった.以下,このコーパスについて具体的に述べていこう.

2.時代別の対象資料


続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。


続きを読む(PDF)   バックナンバーを購入する    入会登録


  

電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。

電子情報通信学会誌 会誌アプリのお知らせ

電子情報通信学会 - IEICE会誌アプリをダウンロード

  Google Play で手に入れよう

本サイトでは会誌記事の一部を試し読み用として提供しています。