特集 8. 【自然言語処理】深層学習がもたらした自然言語処理研究の発展と変革

電子情報通信学会 - IEICE会誌 試し読みサイト
Vol.105 No.5 (2022/5) 目次へ

前の記事へ次の記事へ


特集8. 第3部 音声・自然言語処理分野
【自然言語処理】
深層学習がもたらした自然言語処理研究の発展と変革
Deep Learning Advanced and Revolutionized the Research of Natural Language Processing
岡崎直観

岡崎直観 東京工業大学情報理工学院情報工学系

E-mail okazaki@c.titech.ac.jp

Naoaki OKAZAKI, Nonmember (School of Computing, Tokyo Institute of Technology, Tokyo, 152-8550 Japan).

電子情報通信学会誌 Vol.105 No.5 pp.397-400 2022年5月

©電子情報通信学会2022

abstract

 単語埋込みベクトル,RNNやTransformerなどの系列変換モデル,注意機構,BERTやGPTなどの大規模事前学習済みモデルなど,深層学習は自然言語処理とともに発展した.一方で,大規模計算資源に支えられたデータ駆動形の研究開発が加速し,特徴量エンジニアリングはネットワーク構造の設計に置き換えられた.複合的なタスクもエンドツーエンドでモデル化されるようになり,人間の知的なタスクに対応するベンチマークデータが多く生み出され,研究の再現性に関する関心が高まった.本稿では,自然言語処理における深層学習の発展と,深層学習が自然言語処理の研究に与えた影響を解説する.

キーワード:自然言語処理,深層学習

1.ま え が き

 自然言語処理は,言葉を理解して操ることができるコンピュータの実現を目指す研究分野である.ある言語の文章を別の言語に翻訳する機械翻訳,自然言語で与えられた質問に答える質問応答,人間との間で会話を行う対話エージェント,与えられた文章の情報を集約する自動要約,与えられた文章をカテゴリー分けする文書分類など,広範囲な応用がある.

 自然言語処理の応用の多くは,math単語から成る入力mathが与えられ,math単語から成る出力mathmathを返すシステムとして定式化できる.ここで,mathは出力の単語若しくはラベルの集合である.機械学習に基づく自然言語処理では,入力mathに対する出力mathの「良さ」を条件付き確率mathでモデル化し,mathが最も高くなる出力mathを探索する.例えば,mathに固定し,mathをカテゴリーラベルの集合とすると,文書分類タスクとなる.mathに固定し,mathを品詞ラベルの集合とすると,品詞タグ付け(単語の品詞を推定する)タスクとなる.mathを日本語の単語列,mathを英語の全単語の集合とし,mathが可変であることを許すと,日本語から英語への機械翻訳となる.

 自然言語処理のタスクをこのように定式化した場合,研究開発の要点はmathのモデル化とmathの探索問題の二つである.前者は雑音のある通信路モデルや最大エントロピー法,条件付確率場,後者は動的計画法(例:ビタビアルゴリズム)や近似探索法(例:ビーム探索)などが用いられてきた.深層学習に基づく自然言語処理では,mathのモデル化に深層ニューラルネットワーク(DNN: Deep Neural Network)を用いる.

2.深層学習の導入と発展


続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。


続きを読む(PDF)   バックナンバーを購入する    入会登録

  

電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。

電子情報通信学会誌 会誌アプリのお知らせ

電子情報通信学会 - IEICE会誌アプリをダウンロード

  Google Play で手に入れよう

本サイトでは会誌記事の一部を試し読み用として提供しています。