電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
解説
統計的因果探索
――観察データから因果関係を導く方法とその応用――
Causal Discovery and Its Application to Infer Causal Relationships from Observational Data
A bstract
多くの科学的研究の目的は単に変数間の相関関係を求めることではなく,因果関係を求めることにある.因果関係を知る最も効果的な方法はランダム化比較試験である.しかし,経済的,倫理的,技術的に実行が不可能な比較実験も多い.これに対して,統計的因果探索とは観察データから変数間の因果関係を推定する技術である.本稿では,近年様々な発展がなされている統計的因果探索の方法論と現状抱えている問題点を紹介する.また,統計的因果探索を応用した機械学習の応用研究についても解説する.
キーワード:統計的因果探索,因果推論,介入,LiNGAM
科学的研究の多くは単に相関関係を明らかにするだけでなく因果関係を明らかにすることを目指している.因果関係を知る最も効果的な方法はランダム化比較試験と呼ばれるものである.これは,ランダムに研究の対象をグループに分け,それぞれのグループに異なる介入(外的操作)を実施して,結果を比べるものである.しかし,このような実験は経済的・倫理的・技術的な問題で実行できないことが多い.これに対して,本稿で解説する統計的因果探索は,介入を伴った実験を行わずに,既に得られた観測データのみから因果関係を推測する技術である.
本稿は統計的因果探索に関する知識がない人に向けて,統計的因果探索の前提・方法・原理,そして応用を解説する.本稿では,主にJudea Pearl(1)によって提唱された枠組みと,その枠組みを基に構築されてきた手法を扱う.
変数間の確率・相関関係はデータに現れる関係を指すのに対し,因果関係はそのようなデータを生み出す構造を指す.例えば,「芝生が濡れているので,雨が降っていたのだろう」という表現や,「雨が降っていたので,芝生は濡れているだろう」という表現は,芝生と雨について経験的に分かっている確率・相関関係を指している.一方で,「芝生を濡らしても雨は降らない」という表現や,「人工的に雨を降らすことによって芝生は濡れる」という表現は,芝生と雨の間にある,構造としての因果関係を話題にしている.
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード