電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
深層学習は自然科学の研究方法にも様々な影響をもたらした.本稿では一例として「分子と幾何構造の表現学習」について解説する.分子は化学・生命科学・材料科学など多くの自然科学分野の中心的対象であるが,分子をどう表現し機械学習へ入力すればよいのかは最も重要で難しい問題である.機械学習はデータとして入力されない情報を全く考慮しないため,入力表現はつかみ取れる因果の射程をも規定してしまう.自然科学研究にも長年携わってきた機械学習屋の目線から,現在の方法的中心である深層学習がこの分野に与えた影響を概観する.
キーワード:分子グラフ,グラフ表現学習,Graph Neural Networks(GNNs),幾何的深層学習
分子と幾何構造の表現学習は,近年,化学や生命科学などの自然科学分野のみならず機械学習や人工知能分野でも盛んに研究されているトピックである.分子は分子生物学や化学だけではなく,創薬,医学,材料科学,農学,環境科学など幅広い自然科学分野の土台である.自然科学の対象が複雑化するに伴い,どの分野でもデータ利活用に対して強い関心(と懐疑)が向けられるようになっている現在,こうした技術は自然科学の研究方法を変える新しい道具としても期待されている(1)~(4).
筆者は機械学習の研究者であると同時に,化学や生命科学の組織に所属し自然科学者と協働してデータを活用した自然科学研究に長年携わってきた機械学習ユーザでもある.いずれの立場でも,モダンな深層学習はPyTorch,JAX,TensorFlowなどの強力で扱いやすい自動微分系実装が実現した「微分可能プログラミング」という枠組みとして機械学習モデルの設計プロセスを変貌させたと感じている.本稿では機械学習屋の目線から深層学習がこの分野をどのように変えたかについて概観する.
深層学習の利活用が盛んに研究されるようになる以前から,コンピュータと情報技術を化学領域の幅広い問題で利活用する分野として「ケモインフォマティクス(化学情報学)」は長い歴史を持つ.関心の分子について検索したり描画したりするのに今やコンピュータは欠かせない.実験で使う分子を注文したり必要となる分子の合成法を調べたりする際,データベースや知識ベースへ問合せする状況は化学者でなくとも想像できるであろう.
論文や教科書で分子は普通構造式で指定される.化学構造式は点と線で抽象されており「グラフ構造」に似ている.実際,分子とは原子と原子の結合の組合せであり,その組合せは量子力学的に制約される.分子のグラフ表現は,部分構造や類似構造の検索,分子構造の描画や保存など様々なタスクで使われる基本的データ構造であり,ケモインフォマティクス分野では古くから使われている.また,「グラフ」という用語の初出がシルベスターによる数学的な化学構造研究であったように,グラフと分子の関わりはグラフ誕生時からの因縁でもある(5).
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード