電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
解説
実務にデータ分析コンペは有効か
Usefulness of Data Science Competitions for Practical Business
A bstract
データ分析コンペティションに対する注目度が年々高まる一方で,それに参加することの実用的な意義については,賛否の議論が絶えず交わされている.本稿では,筆者らの経験を基に,データ分析コンペティションに参画することによってどのようなスキル向上が見込めるのか,また実応用においてどのように有益なのかという観点で,具体例を交えながら,その有効性を議論する.
キーワード:データサイエンス,機械学習,データ分析コンペティション
AI・機械学習の技術進展及び企業におけるデータサイエンスの活用が急速に拡大する中,データ分析コンペティション(以下,データ分析コンペ)に対する認知度も年々上昇している.データ分析コンペとは,企業や研究機関が抱える課題について,それに関するデータを一般に公開し,所望のタスクを解く性能を参加者に競わせるものである.事前に定められた目的変数に対する予測性能を教師あり学習を用いて競うものが典型的であるが,昨今はコンペの形式も多角化しつつあり,扱うデータの形式も多岐にわたる.データ分析コンペが実施されるプラットホームとして最も代表的なものはKaggle(1)であるが,そのほかにも各国様々なプラットホームが存在する.
データ分析コンペは競技性が高く,数多のデータサイエンティストを夢中にさせる一方,その実用性についてはしばしば議論の的になっている.本稿では,データサイエンスにおけるスキル向上及び実応用という観点で,データ分析コンペの有効性について筆者らの見解を述べる.特に,データ分析コンペに余り詳しくない方にとって,その理解の一助となれば幸いである.なお,2.~3.は阪田が,4.は高原が,主に執筆を担当している.
まずは,ビジネス(実務)におけるデータ分析のプロセスを説明しよう.図1は,データ分析の標準プロセスとして提唱されているCRISP-DM(2)を参考に,筆者の実務経験に基づき整理し直したものである.なお,データ分析コンペとの対比のため,教師あり学習の適用を意識して描かれている.
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード