特集 3-2 畳込みニューラルネットワークのFPGA実装

電子情報通信学会 - IEICE会誌 試し読みサイト
Vol.103 No.5 (2020/5) 目次へ

前の記事へ次の記事へ


特集 3-2 畳込みニューラルネットワークのFPGA実装

中原啓貴 正員 東京工業大学工学院情報通信系

Hiroki NAKAHARA, Member (School of Engineering, Tokyo Institute of Technology, Tokyo, 152-8552 Japan).

電子情報通信学会誌 Vol.103 No.5 pp.501-506 2020年5月

©電子情報通信学会2020

abstract

 ディープラーニングの一種である畳込みニューラルネットワーク(CNN)は画像認識に適しているが,大量の積和演算を必要とするため,ハードウェア実装する場合,多大なコストを必要とする.本稿では,ハードウェアコスト削減のための様々な最適化手法を紹介し,FPGA実装に適した2値化CNNの学習方法,並びにハードウェア実装方法について紹介する.

キーワード:畳込みニューラルネットワーク,FPGA,深層学習

1.ま え が き

 近年の深層学習の研究の目覚ましい成果によりすばらしい改善・高度なタスクが達成されており,画像,ビデオ,音声処理などは顕著な例であろう.例えば,畳込みニューラルネットワーク(CNN: Convolutional Neural Network)はImageNet画像認識タスクにおけるTop5の画像分類精度を73.8%から84.7%に引き上げた反面,CNNのモデルサイズはいまだに増加し続けており,多大な計算量とストレージが必要である.例えば,CNNの一種であるVGG(1)は224×224ピクセルの画像サイズで390億の浮動小数点数演算を必要とし,500MByteのパラメータを持つ.計算時間は入力画像サイズに比例するため,高解像度の画像を計算するには1,000億以上の演算が必要であり,現に物体検出や姿勢推定などは認識精度を上げるために入力画像は高解像度化している.

 しかし,その計算のためのストレージや複雑度,消費電力が応用範囲を制限している状況であり,特に組込みシステムではその制約が厳しい.一般的なCPUは10~100Gflopを1秒間に実行するため,その電力効率は多くの場合1GOP/Jを下回る.CPUは高性能が求められるクラウド上のアプリケーションや低消費電力が要求される場合,適用が難しい.同様に,GPUも電力消費が大きい問題を抱える一方,FPGAがエネルギー効率の良いCNN計算のプラットホームの候補である.FPGAは高い並列性や不必要なロジックを排除することでCNNが持つ高い並列性と低ビット精度可能な特性を活用できる.ハードウェアアルゴリズムの研究においても,CNNモデルの認識精度劣化を抑えつつハードウェアに適した単純なモデルに置き換えることでCPUやGPUと比較して高エネルギー効率を達成可能にしている.本稿ではエネルギー効率が高く柔軟なFPGAベースのCNNアクセラレータとその設計手法を要約し,FPGAに適したバイナリー(2値)CNNアクセラレータの設計手法を紹介する.

2.CNN(Convolutional Neural Network)


続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。


続きを読む(PDF)   バックナンバーを購入する    入会登録

  

電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。

電子情報通信学会誌 会誌アプリのお知らせ

電子情報通信学会 - IEICE会誌アプリをダウンロード

  Google Play で手に入れよう

本サイトでは会誌記事の一部を試し読み用として提供しています。