特集 様々なハードウェアに適応したAI実装技術 3. AI 実装技術   3-6 ベクトルプロセッサを用いたAI処理の高速化 High Performance Implementation of AI Processing with Vector Processor

特集 様々なハードウェアに適応したAI実装技術
3. AI 実装技術
 
3-6 ベクトルプロセッサを用いたAI処理の高速化
High Performance Implementation of AI Processing with Vector Processor

p.529
荒木拓也 大野善之 石坂一久

機械学習を高速化するフレームワークの実装・評価の事例紹介
 NECは1980年代からベクトル形コンピュータの提供を行っている.従来は大形モデルのみでありスーパコンピュータとしての用途が中心であったが,最新のSX-Aurora TSUBASAからはベクトルプロセッサをPCIeカード上に実装することで,小形モデルからの提供を可能としている.これに伴い,ベクトルプロセッサの新たな応用としてAI処理の高速化を行っている.ベクトルプロセッサが得意とするメモリバンド幅を生かすアルゴリズムのうち,統計的機械学習及び深層学習を対象とし,フレームワークの実装,移植を行った.本稿ではその実装と評価について紹介する.

コメントを残す