解説 自然言語処理,オントロジーを用いた知識管理

電子情報通信学会 - IEICE会誌 試し読みサイト
Vol.100 No.8 (2017/8) 目次へ

前の記事へ次の記事へ


解説

自然言語処理,オントロジーを用いた知識管理

Knowledge Management Based on Natural Language Processing and Ontology

辻井潤一 西村悟史 中田 亨

辻井潤一 西村悟史 国立研究開発法人産業技術総合研究所人工知能研究センター

中田 亨 国立研究開発法人産業技術総合研究所人工知能研究センター

Jun’ichi TSUJII, Satoshi NISHIMURA, and Toru NAKATA, Nonmembers (Artificial Intelligence Research Center, National Institute of Advanced Industrial Science and Technology, Tokyo, 135-0064 Japan).

電子情報通信学会誌 Vol.100 No.8 pp.859-865 2017年8月

©電子情報通信学会2017

abstract

 人工知能,中でも自然言語処理技術は,近年,実世界への応用において著しい発展を遂げている.その一方で,自然言語は複雑で曖昧な概念や知識を直接取り扱うため,オントロジーという基盤を堅固に作らなければ,その深い意味を正しく処理することができない.そこで本稿では,実用的な具体事例を参照しながら,オントロジー工学の考え方を解説し,自然言語情報から知識を抽出し管理する要点を述べる.第1の事例は,介護現場という人間の行動が主体となるサービスの現場での知識管理である.人手によるサービスの現場の情報を間違いなくかつ簡単に管理できるようにするオントロジー工学の工夫を紹介する.第2の事例は,産業事故を題材として,事故報告書から知識を取り出す試みについて紹介する.

キーワード:自然言語処理,オントロジー,サービス工学,介護,ヒヤリハット

1.ま え が き

 人間の知能とコンピュータの知能(人工知能)との大きな違いは,扱う情報の形態にあった.人間は知識で考えるのに対して,コンピュータは数値データを演算して考える.従来はこの違いがはっきりしていた.

 最近の人工知能の飛躍的な進歩によって,コンピュータも知識を扱って思考できるようになってきた.知識工学は,かつてはエキスパートシステムに代表されるように,かなり記号化されたデータを扱うことを前提としていた.最近の人工知能は記号的な入力を必ずしも必要としない.一般画像認識の技術は,画像データが入力されれば,そこに何が写っているかを説明する文を出力できるという,相当に高い技術水準に達している.非記号的データを言葉に翻訳する技術の現実味は今や確固たるものになったと言えよう.

 この技術の変化は,コンピュータが扱うデータの主役を変えるであろう.自然言語のデータは,かつては複雑さと曖昧さからコンピュータ向けには敬遠されてきたが,今後は言葉こそが情報の中心となっていくだろう.すなわち,システムが何か作業をするとき,状況を言葉で表し,言葉で考え,言葉で人間と打ち合わせて,結論を体現する行動を起こす.そのような言語ドメインを中心とするスタイルが,これからの人工知能の在り方の一つとなると思われる.

 とはいえ,どんな題材に対しても人工知能が言葉と知識を簡単に扱えるわけではない.一般画像認識や囲碁のように膨大な量のデータが得られた題材は,機械学習が適用でき,人工知能の性能が高まった.その一方で,データが少ない題材には,機械学習の進めようがない.

 我々の仕事や生活の現場に便利な人工知能をより幅広く導入したいところであるが,この分野で人工知能へ利用できる形のデータが多く存在するとは言えない.もちろん情報自体は多く存在していて,作業マニュアルや作業報告書といった文書も情報であるし,センサの計測履歴データが仕事や生活の中で日々生まれている.ただ,これらの雑多な情報から深い意味を取り出して扱うことは容易ではない.


続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。


続きを読む(PDF)   バックナンバーを購入する    入会登録


  

電信情報通信学会 - IEICE会誌はモバイルでお読みいただけます。

電子情報通信学会誌 会誌アプリのお知らせ

電信情報通信学会 - IEICE会誌アプリをダウンロード

  Google Play で手に入れよう

本サイトでは会誌記事の一部を試し読み用として提供しています。