電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
解説
画像解析関連コンペティションの潮流
Trends on Competitions of Image Analysis and Related Areas
abstract
統計的学習に基づく画像認識は,深層学習の驚異的な成功を背景に目覚ましい発展を続けている.特に近年は,単なる高精度化にとどまらず,次々に新しい高度な認識タスクが実現可能となっている.この分野では学習のためのデータセットが重要な役割を果たしているが,特にコンペティション形式で開催されるワークショップが近年の技術革新の大きな原動力となっている.本稿では,現在本分野において中心的存在となっている大規模画像認識コンペティションであるILSVRCを中心に,研究コミュニティで扱われてきたタスクの変遷と最新動向について,その他の画像系コンペティションの動向も含めながら紹介する.更に,現状で機械は一般的な画像から何を語れるレベルまでに達したのか,また,画像解析・認識の今後の展望についても触れる.
キーワード:画像認識,データセットと評価方法,コンペティション,ILSVRC
制約のない実世界画像の認識・理解は一般物体認識(1)と呼ばれ,古くから人工知能の究極的な目標の一つとされてきた.古典的には幾何的なルールや三次元モデルに基づくアプローチが模索されていたが,1990年代前後から統計的パターン認識に基づくアプローチが大きな成功を収めるようになった.2000年代に入るとより現代的な機械学習手法が多用されるようになり,現代に至るまでコンピュータビジョン分野における一大人気トピックとなっている.
より具体的に画像認識の目的を述べると,入力画像が与えられたときに,これを自動的に何らかのラベル(例えばカテゴリー名や物体の座標など)へ変換する関数を得ることであると言える.統計的学習に基づくアプローチでは,入出力の多数の事例データから成る訓練データセット(はデータ数)から,そのような関数を帰納的に推定する.統計的画像認識手法はこれを実現するために,としてある識別モデルや確率モデルを仮定し,そのパラメータを推定する一連の手続きを与えるものである.
さて,統計的学習に基づくシステムにおいては,認識手法の理論自体ももちろん大事であるが,それ以上に訓練データセットが重要である.いかに高度な数理的手法を用いようとも,訓練データセットが想定していない物事の認識は本質的に不可能であるため,所望のタスクに対して十分に網羅的かつ質の良い事例データを用意する必要がある.また,十分な汎化性能(テスト時の性能)を得るためには訓練データの量も同様に重要である.一般に,多数のパラメータを有する複雑なモデルほど表現能力は高いが,より多数の訓練データがなければ過学習に陥りやすく,高い性能を得ることは難しい.歴史をひも解くと,モデルとデータセットは常に一体となって発展してきており,その時々に最先端として注目されていた手法は,当時のデータの規模や計算機の速度に最も適合した複雑さを有するものであったと言える.現在深層学習として全盛期を迎えているニューラルネットワークも最初から現在のような成功を収めていたわけではなく,データ量や計算機パワーに乏しかった時代は十分な力を発揮できず,浅い識別モデルと特徴量に基づくアプローチがはるかに優勢であったことを忘れてはならないだろう.
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード