小特集 3. AlexNetのそのとき

電子情報通信学会 - IEICE会誌 試し読みサイト
Vol.106 No.12 (2023/12) 目次へ

前の記事へ次の記事へ


そのとき研究の歴史が動いた――画像認識の発展の歴史を振り返って――

小特集 3.

AlexNetのそのとき

The “Moment” of AlexNet

牛久祥孝

牛久祥孝 正員 オムロンサイニックエックス株式会社リサーチアドミニストレイティブディビジョン

Yoshitaka USHIKU, Member (Research Administrative Division, OMRON SINIC X Corpolation, Tokyo, 113-0033 Japan).

電子情報通信学会誌 Vol.106 No.12 pp.1082-1085 2023年12月

©電子情報通信学会2023

Abstract

 本稿では,深層学習の進化の契機となった要素を解説し,特にAlexNetの影響力に注目する.まず,初期の機械学習手法が直面していた課題を回顧する.そして深層学習の台頭を許した背景として,GPUの利用と大規模データセットの整備について焦点を当てる.そして,AlexNetの登場とその衝撃を詳述し,深層学習が注目を集めるきっかけとなった技術的影響について掘り下げる.

キーワード:深層学習,畳込みニューラルネットワーク,CNN,AlexNet

1.は じ め に

 深層学習は人工知能の主要な推進力となり,画像認識,自然言語処理,音声認識など,多くの領域において革新的な改善をもたらしている.特に,畳込みニューラルネットワーク(CNN: Convolutional Neural Network)は,自然の現象を解析する際に人間の知覚システムを模倣することから端を発したニューラルネットワークの中核技術の一つに位置付けられている.しかし,これらの技術が急速に発展し,主流となるまでには多くの要素技術と複数の条件がそろう必要があった.

 CNNの一つであるAlexNet(1)は,深層学習の歴史において特別な位置を占めている.2012年に登場したこのネットワークは,当時の画像認識タスクであるImageNet大規模画像認識コンペティション(ILSVRC: ImageNet Large Scale Visual Recognition Challenge)で他の手法を大きく上回る結果を出し,全世界の研究者の目を引いた.AlexNetの登場は,深層学習が幅広い領域での問題解決に対する有効な手段となり得ることを示した瞬間であり,以後の深層学習の発展に大きな影響を与えた.

 本稿では,このような深層学習の進化を可能にした要素技術の動向に焦点を当てる.特に,大量のデータと強力な計算能力,そしてそれらを活用した革新的なアルゴリズムの開発といった背景について詳述し,AlexNetがどのようにしてその時代の象徴となり,また未来の深層学習の方向性を示したのかを解説する.

2.深層学習が進化する前の状況

 最初に,深層学習が主流になる前の機械学習の状況を見てみよう.この時代,サポートベクトルマシン(SVM: Support Vector Machine)や決定木,ランダムフォレストなどの手法が広く用いられていた.これらの手法は,比較的小規模なデータセットに対して優れた結果を提供し,多くの実世界の問題に対する解決策となった.

 本稿で扱うAlexNetがブレークスルーを起こした画像認識では,SVMを用いたアプローチが主流であった.SVMは特徴量空間において,各クラスを識別する超平面を獲得する際に,その超平面から最も近いベクトル(サポートベクトル)までの距離(マージン)を最大化するように学習する識別手法である.一番簡単な定式化では超平面(線形分類器)による分類を行うので,各クラスの特徴量ベクトルの分布が複雑な場合には非線形な分類器が用いられる.そこでよく使われていたのがカーネル化の概念であるが,この詳細は前田英作氏の解説記事(本小特集7,p.1100)を参照されたい.


続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。


続きを読む(PDF)   バックナンバーを購入する    入会登録

  

電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。

電子情報通信学会誌 会誌アプリのお知らせ

電子情報通信学会 - IEICE会誌アプリをダウンロード

  Google Play で手に入れよう

本サイトでは会誌記事の一部を試し読み用として提供しています。