電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
解説
エンドツーエンド深層学習のフロンティア
Frontier of End-to-End Deep Learning
abstract
本稿では,ニューラルネットワークの基礎的な知識を有する読者を想定し,エンドツーエンド深層学習の最新動向について解説する.エンドツーエンド深層学習は,タスクに対して適切な構造を持つ一つのニューラルネットワークにより入出力関係を直接学習するものであり,従来取り組まれてきた,人間により設計された特徴量による学習に比べて高い精度を実現できた例が多数報告されている.本稿では,まず自然言語処理,音声処理,画像処理を中心に研究の動向について紹介した後に,各分野の動向に基づいて,エンドツーエンド学習がどのようなケースで有効に働くかについて考察を述べる.
キーワード:深層学習,エンドツーエンド,ニューラルネットワーク
近年の人工知能技術の目覚ましい発展の要因の一つとして,エンドツーエンド(end-to-end)深層学習の実現が挙げられる.エンドツーエンド深層学習とは,入力データが与えられてから結果を出力するまで多段の処理を必要としていた機械学習システムを,様々な処理を行う複数の層・モジュールを備えた一つの大きなニューラルネットワークに置き換えて学習を行うものである.自動運転を例に取ると,非エンドツーエンドのアプローチでは,物体認識,レーン検出,経路プランニング,ステアリング制御など,人間が設定した複数個のサブタスクを解く必要があるところ,エンドツーエンド学習では図1のように車載カメラから取得した画像から直接ステアリング操作を学習する(1).
このような学習が可能になった背景には,深層学習の発展と,学習データ量の増加が挙げられる.まず,深層学習の発展について,従来のアプローチと比較して説明する.従来は,タスク全体の入力データを出力データに変換するにあたって,データの中間的な表現,すなわち,多段に接続される各モジュールの入出力を人間が設計する必要があった.このような中間表現の設計は,特徴設計(feature engineering)と呼ばれ,精度に大きく影響する.その一方で,タスクに対して適切な構造を持つ多層のニューラルネットワークを用いてタスク全体の入出力を直接学習すると,人間が設計するよりも優れた様々な粒度の中間表現を自動的に獲得できる場合がある.このような能力の獲得は表現学習と呼ばれ,深層学習を採用するメリットとして知られている(2).次に,クラウドソーシングの発展や,Webサービス・IoTサービスの普及等によって,大規模データセットの収集・作成が容易になったことが,エンドツーエンド深層学習の発展につながっていると考える.その一方で,現状全てのタスクがエンドツーエンド学習で取り組まれているわけではなく,例えば自動運転については個別にタスクを解くアプローチも依然として多く取り組まれている.本稿では,まず2.において各分野におけるエンドツーエンド深層学習の動向について説明した後,3.においてその可能性と課題について論じる.
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード