523_main.jpg

解釈可能AIによるデータ駆動理学の実現へ向けた取り組み

  • ソーシャル・データサイエンス研究科 准教授本武 陽一

2023年10月2日 掲載

「データ駆動理学」とは

画像:本武陽一氏

ソーシャル・データサイエンス研究科
准教授 本武 陽一

近年の機械学習関連技術の急速な発展に応じて、学術研究や技術開発分野への機械学習関連技術の導入が活発に試みられるようになっています。私の研究する「データ駆動理学」は、物質内部の原子・分子が織りなす物理的現象や人間やほかの生物の行動によって形成される社会科学的現象といった、多様な自然現象をあまねく対象として、それらを機械学習でモデル化し、そのモデルを解釈して自然現象の理(コトワリ)、つまり自然現象の背景にある仕組み・原理を解明することを目指す学問分野です。データ駆動理学はData-Driven Scienceを日本語に当てた訳語ですが、よく用いられる訳語はデータ駆動"科学"となります。私は、コトワリを解明する点に特に注力して研究を行っているため、Scienceを敢えてこの言葉が陽に現れた理学と訳して私の専門分野の呼称として用いています。後述するように、コトワリの解明は科学的アプローチで社会課題を解決する際に根幹をなす要素となるため、データを用いて課題解決を実現することを目指すデータ駆動理学は、まさにソーシャル・データサイエンス研究科に適合した研究分野の一つであると私は考えています。

次に、データ駆動理学分野で、科学による社会課題の解決へ向けて、具体的にどのような研究を実施しているかを説明しようと思います。

図1:科学による社会課題解決と人間と機械学習の協業

そのためにまず、科学による社会課題解決の流れを、その好例である熱力学の事例を用いて説明します(図1)。1769年にジェームズ・ワットによって開発された熱機関が、産業革命や工業化社会の原動力となったことはよく知られています。科学者は、その性能を向上させ原理を解明することを通して熱力学の構築をはじめました。最初は、圧力や体積といった観測可能な物理量のモデル化から始まりました。このような特定の現象について観測されたデータの範囲内でその現象をモデル化したものを、本稿では内挿モデルと呼称します。科学者が現象の内挿モデル構築にとどまっていれば、科学は今のような莫大な投資を受け、社会課題解決の有力な手段とされることはなかったでしょう。科学者は、単なる特定の現象の内挿モデル構築だけにとどまらず、熱機関だけでなくこの宇宙に存在する現象であまねく成立するエントロピー増大則や、自由エネルギーといった抽象的で汎用的な原理・法則・概念を発見するに至りました。この宇宙に存在するあらゆる現象を記述する熱力学は、最終的にアメリカの物理学者のウィラード・ギブズ(1839-1903)が化学反応論をも包含するものとして完成させました。これによって、熱機関の理論であった熱力学が化学反応における新たな指針の存在を予言し、その結果、ハーバー・ボッシュ法のような、人工的なアンモニアの合成による肥料づくりの技術の開発を導きました。このようなある特定の現象の観測データの範囲を超えた、一般的に成り立つようなモデルのことを、本稿では外挿モデルと呼称します。つまり、科学者によって、単なる内挿モデルを超えた一般原理(外挿モデル)の解明が実現されたことによって、当時の一つの大きな社会課題であった食料不足が解決されたのです。

このように、単なる内挿モデルを超えた一般原理(外挿モデル)を演繹(えんえき)的に導き、それを大胆に外挿する人間の科学的洞察力は、科学を駆動し社会課題を解決するための知識の源泉となるものです。

しかしながら、現象が初期宇宙の形成や磁性材料の磁区構造形成、高分子材料内の構造形成、生物の群れのダイナミクス、核融合炉内のプラズマ乱流のダイナミクス、各種経済現象といった非線形・非平衡で複雑な現象となると、そもそも内挿モデルの構築自体が困難となります。その場合、科学者の洞察による一般原理の探索の段階に至ることができなくなってしまいます。

近年、深層ニューラルネットワークをはじめとする機械学習モデルを用いて複雑な科学データを分析・モデル化する研究が活発に行われています。一部の人は、機械学習によって科学者がAIに置き換わることを期待するかもしれませんが、残念なことに原理的に機械学習は、与えられたデータの内挿的なモデル構築を得意としており、人間の科学者のような柔軟な一般原理の発見や外挿は苦手としています。したがって、機械学習だけによって前述のような、内挿モデルの構築から外挿的な一般原理の発見の流れを実現することは困難です。そこでデータ駆動理学では、複雑なデータの内挿モデル構築を得意とする機械学習と、科学的洞察によって大胆な演繹的外挿を実現する人間の協業が重要と考え、機械学習を用いて複雑現象の一般原理・法則を探索する科学者を支援する枠組みの構築に取り組んでいます。

人間と機械学習の協業を実現するうえで、最も重要な課題の一つとなるのが機械学習で得られた内挿モデルを解釈して人間に伝達する手法の開発になります。特に、近年発展した機械学習関連技術の根幹を成す深層ニューラルネットワークのような複雑な機械学習モデルは、多量のパラメータを持つ非線形関数で構成されたブラックボックスとなるため、学習結果の解釈が一般に非常に困難とされています。そこで私の研究室では、このような複雑な内挿モデルと人間である科学者の間を橋渡しする、機械学習の解釈手法や解釈可能な高性能モデルの開発や、解釈可能な機械学習モデルを用いた複雑現象の原理解明による社会課題の解決を目指しています。ChatGPTなどの、近年の高性能で実用に耐える機械学習関連技術の発展や、自動運転技術の社会実装の要請などによって、AIの判断や推論の機序を解釈することの重要性がますます増大しています。これらの機械学習モデルも複雑現象の内挿モデルととらえることができるため、データ駆動理学のために開発された解釈可能AI技術は、このような社会課題の解決にも直接貢献できると考えています。

ところで、自然現象などのデータを用いて科学的法則性を見つけるといったことは、昔から科学者が取り組んできたことです。それとデータ駆動理学とは、「データ量が違う」と言う人もいますが、私は本質的には同じことであるととらえています。違いは、物理モデルの範囲が深層ニューラルネットワークのような機械学習モデルも包含するようになったという点だと考えています。また、データ駆動理学はあらゆる学問の本質そのものであると言えると考えており、データ駆動理学は"いわゆる"理系領域も社会科学も包含した学融合的な分野と考えることもできます。

「データ駆動理学の構築に向けた私の研究室での取り組み」

私の研究室では、最終的なゴールである社会課題の解決を強く意識し、その課題の専門家との議論を通して、研究課題を具体化・定量化したうえで、その課題を解決するために必要な解釈可能な機械学習モデルの開発を行うといった、目的志向型の研究開発を行っています。具体的な課題を重視するのは、科学の真の威力は前述のような抽象化による外挿性にあるため、開発した手法で抽出された複雑現象の原理・法則の正しさと威力を検証するには、研究室で発見した原理・法則を、現実世界の課題解決にある種の外挿をして検証をする必要があると考えるためです。

研究室では特に宇宙の大規模構造から磁性材料や高分子材料などの物質内部の小さな構造、そして生物集団が織りなす構造まで、自然界のあらゆる場所にみられる非周期的な秩序構造であるパターンの形成や変化する過程を扱うパターンダイナミクスを研究ターゲットの現象として、その原理・法則の発見を試みています。パターンダイナミクスはパターンが存在する現象であればすべてがそのターゲットになる可能性があり、物理的な現象だけでなく、たとえばある種の地域性の継時変化のような複雑な空間構造を持つ社会科学的現象も扱えるとても幅広い現象を包含した分野です。このようなパターンダイナミクスを対象として、私の研究室で実施している解釈可能AIを用いたデータ駆動理学枠組みの研究開発の取り組みは、次の二つのアプローチによる手法開発とその共通基盤技術開発の三つに大別されます。

一つ目が、深層ニューラルネットワークのような表現能力の高い機械学習モデルによるアプローチです。このアプローチは、高いデータの表現能力を持つ一方で、構築された機械学習モデルの解釈が困難であるという課題を持ちます。そこで、深層ニューラルネットワークからの解釈可能な物理情報抽出手法の開発や適用を研究します。たとえば深層ニューラルネットワークは、データ分布が持つ構造を低次元多様体のような部分空間として抽出して、タスク達成に有用な情報を得る機能があると報告されています。物理系でもデータの低次元構造は、保存量や秩序変数といった物理的制約に関連すると考えられます。すなわち、深層ニューラルネットワークがモデル化したデータ多様体から、保存則や秩序変数といった解釈可能情報が抽出できると期待されます。また、これらの少数の変数によって現象が記述できることも意味しており、そのような縮約モデル自体が、解釈可能情報となり得ます。これまでに我々は、力学系の一種であるハミルトン系を対象として、座標変換に対する系の不変性と保存量を結びつけるネーターの定理に基づいて、位置と運動量の時間遅れ空間上の時系列データ多様体の対称性から、力学系の対称性が推定できることを理論的に確認し、それを元に学習済み深層ニューラルネットワークからの保存量抽出法を開発しました。あるいは、勾配系やハミルトン系といったポテンシャル関数の勾配情報に基づいてダイナミクスが決定される系を対象として、複雑なパターンダイナミクスの縮約モデル構築をする研究なども行っています。

二つ目のアプローチが、フーリエ基底や統計量、あるいは多項式といった解釈性の高い基底関数の線形和によるパターンダイナミクスのモデル化アプローチです。結晶構造のような周期構造に対するフーリエ基底空間や、熱力学現象のようなランダム現象における圧力や温度といった統計量空間は、それらの重要な情報を保持しつつモデル化するうえでの基盤を与えました。このアプローチは高い解釈性を持つ一方で、私の研究室でターゲットとするパターンダイナミクスでは、現象を表現しきれないという問題があります。たとえば、材料構造にみられる非周期的な秩序構造を形成する非線形で非平衡なパターン形成現象を扱う適切な座標系はいまだに発見されたとは言い難い状況です。そこで、パターンダイナミクスの表現に適切な表現能力は高いが解釈性もあるような基底の導入を試みるのがこのアプローチです。近年、パーシステントホモロジーを用いた位相的データ解析を用いることで、アモルファスのガラス状態をはじめとした非周期的な秩序構造を特徴付けられることが報告されています。パーシステントホモロジーとは、穴の数のようなトポロジカルな構造に、その構造の空間スケール等の情報を付加した不変量のことです。具体的には、位相的データ分析に基づく基底関数を導入し、複雑なダイナミクスのモデル化を行い、その原理を解明する研究を実施しています。

三つ目はこれら2つのアプローチの共通基盤となる科学者の研究活動過程のモデル化研究です。科学の定義を論じる際の重要な項目の一つは「ア・プリオリな知識の排除」です。一方で、科学者による原理・法則抽出過程は、実は人間である科学者の多くの認知的な過程によって構成されます。たとえば、科学計測とその分析の現場では、モデルの適合範囲という物理的事前知識に基づいて、データの特定部分の当てはまりを重視した回帰といった、人間の「主観」に強く依存した分析がよく行われます。科学的洞察はまさにこのような営みの一つであり、データ駆動理学の目指す、科学者の洞察のサポートにおいて、この過程をモデル化することは有用です。我々はベイズ推論と呼ばれる統計的な枠組みを利用して、ベイズ推論を元に科学者の営みをモデル化する研究を行っています。ベイズ統計と科学者の営みの関係を簡単に説明します。ベイズ統計に基づく潜在パラメータxの推論では、関係する確率変数についてのすべての情報を持つ同時確率p(x,y)を媒介として、因果関係p(y|x)p(x)を逆転p(x|y)p(y)してxを推定します。一方で科学者は、この世界を因果律x→yという視点から理解したうえで、因果を遡りy→xその背景にある物理的潜在構造xを解明します。つまり、ベイズの定理は、同時確率という世界を因果律により理解し、その因果を遡ることで物理的潜在構造を解明するという、科学者の営みをモデル化しているとみることができます。すなわち、計測をベイズ推論でモデル化することは、計測データを分析する科学者の営みのモデル化ととらえることができるのです。また、多くの科学者は、ある現象を説明できるモデルが複数ある場合、より単純なモデルを選択するという信念を持っています。この「オッカムのかみそり」的な信仰が、これまでの科学を駆動してきたと言っても過言ではないでしょう。この科学者の信念はベイズ推論の枠組みによって自然にモデル化されます。 我々はこれまでに、物性物理学や材料科学といったさまざまな分野において、科学計測の営みをベイズ統計によってモデル化してきました。さらに、ベイズ推論を計測に適用することで、計測データに基づく有効モデル抽出や、事後分布からの物理情報抽出といった、単純な計測データの分析にとどまらない物理学者を支援する情報抽出の実現を試みています。

我々は、これら三つの研究を組み合わせることで、複雑なパターンダイナミクスの原理・法則の発見と、それを用いた社会課題の解決を実現することを目標とした研究活動を行っています。現在具体的に扱っている社会課題は、革新的な材料開発や核融合技術の実現といった持続可能な社会の実現のための各種技術課題の解決です。そのような革新的な技術開発をする科学者をサポートする、解釈可能AIの枠組みを開発するためには、構造材料、磁性材料、高分子材料、電磁流体などの幅広い材料・現象において観測される、複雑なパターンダイナミクスの物理法則・原理を解明する必要があります。私の研究室では、このような材料科学による社会課題の解決を志向するデータ駆動理学の研究を、科学技術振興機構の戦略的創造研究推進事業「さきがけ」や、NEDO「未踏チャレンジ2050」といった国のプロジェクトとして採択してもらい、一橋大学内にとどまらず複数の学外研究者との協力のもとで実施しています。また、研究室に高性能マルチGPU計算機や、600コアCPU計算機、大容量メモリ搭載計算機といった大規模な計算機環境を構築することで、大規模で複雑な実課題を解決するための手法開発やその有用性を検証するための体制も確保しています。

「私の研究に興味を持ってくださった皆様へ」

前述のように、データ駆動理学は学融合的研究ですので、この記事を読んでくださっている、何らかの社会課題を抱えているすべての方と一緒に課題解決に取り組みたいと考えています。そこで、まずは私の人となりを知っていただくべく、データ駆動理学の構築を志すようになった経緯をお話ししたいと思います。

私は「この世界の現象をすべて知りたい」と思うような子どもでした。それを実現できる枠組みとして、物理学が最も可能性が高いと考えました。しかしながら高校の時点で自分には物理学の能力が足りないと認識するようになり、その自分の足りない能力を拡張するAIのような技術が必要であると考えるようになりました。大学進学に際しては、人工知能や機械学習の研究をすべく東北大学の情報系の学部に入りました。ところが、当時の人工知能は、今日のそれのような柔軟で高い性能を持っておらず、自分の知能拡張には活用できそうにありませんでした。そこで人工知能の研究から離れ理学部物理学科に転部し、北海道大学大学院理学院宇宙理学専攻の修士課程に進み、素粒子理論を専門とされ、かつ物性物理学への応用などの先駆的な学融合的研究をされている石川健三教授(当時)のもとで勉強と研究を行いました。ところが案の定、自分の能力不足に悩むとともに、そもそも「この世界の現象をすべて知りたい」という目標を100年程度で実現することは困難であるという当然の事実が現実として突きつけられました。そこで、企業へ就職しようと思い立ち、就活の末内定を得ました。しかしなぜかその瞬間にとても落ち込みました。なぜ自分が落ち込んでいるのか、原因をしばらく考えた結果、それは「仕事には短期的に達成できる目標が設定でき、売り上げや利益という形で成果も見えやすいので、このまま就職すれば、きっと楽しく生きていけるのだろう。そして日々の課題を乗り越えることの楽しみに本来の人生の目標が覆い隠されてしまい、最期の瞬間まであっという間に駆け抜けてしまうだろう。しかし、間違いなく死ぬ瞬間に『私はこんなことがしたかったのか?なんで私はこのような目的を忘れた無意味な人生を送ってしまったのだろう』と後悔するに違いない」という強い直感によるものでした。

そのような矛盾した状態を解決するために、人生の目標を「この世界の現象をすべて知るように努力し続ける」ことへと緩和するとともに、素粒子論で修士号を取得後、今度は、東京大学大学院総合文化研究科の修士課程に入学し、機械学習による知能拡張の試みに立ち戻ることにしました。二度目の修士課程では、実社会での応用も念頭においた高次認知研究の先駆的研究をされている植田一博教授のもとで脳計測を用いたヒューマンエージェントインタラクションの研究を行いました。修士号を持っているのに、不慣れな分野のためか自分の能力不足のためか、一年留年をするという状態にあった2012年に、ちょうど「Googleが、深層ニューラルネットワークで猫を認識する学習をしたところ、猫に対応するような表象が自然と出現した」というニュースが飛び込んできました。「これだ!」と直感して修士課程の修了後の2013年に、同じ研究科の人工生命や複雑系分野の先駆的研究者である池上高志教授の研究室の博士課程に進み、深層ニューラルネットワークを分析してその内部構造を部分的に理解したり、そこで得られた知見をもとに大規模な複雑現象を分析する研究を行いました。その結果、深層ニューラルネットワークのような機械学習モデルは、理解することが困難である、大自由度な複雑現象を観察することができる望遠鏡や顕微鏡のような測定装置になり得るとの確信を持つに至りました。

その確信のもと、博士(学術)取得後、2016年4月から3年間、東京大学大学院新領域創成科学研究科の特任研究員として、スパースモデリングやベイズ推論を用いたデータ駆動科学の先駆的研究者である岡田真人教授の研究室でデータ駆動科学に関する研究を実施しました。そこでは、深層ニューラルネットワーク以外のより単純な手法を用いて、鋼材の破壊現象や放射光測定系を対象として、既存の物理モデルを改善したり、そのためのヒントをデータから抽出するような研究を行いました。これによって、既存の物理モデルの素晴らしさを再確認するとともに、その人類の資産をいかに機械学習に取り込むかが重要であるということを気づかされました。2019年には、大学共同利用機関法人 情報・システム研究機構の統計数理研究所に入りました。統計数理研究所では特任助教として日本の統計的機械学習研究の先駆的研究者である福水健次教授のもと、統計的機械学習によるデータ駆動科学の研究に従事しました。統計数理研究所は、「Akaike Information Criterion(AIC)」という世界的に非常に有名な統計モデルの評価指標を提案した赤池弘次氏(故人)が所長を務めたことのある研究所です。赤池先生は、開発した手法を実際に用いることを重視されていたそうで、研究所にいる研究者たちはそのマインドを受けつぎ、適用現象を強く意識した分析手法の開発を行っており、彼らとの議論を通して得た彼らの視点や知識から、自分の研究を進めるうえで核となる数多くの考え方や研究の指針を得ました。そして今年、一橋大学大学院ソーシャル・データサイエンス研究科でデータ駆動理学に関する研究室を立ち上げた次第です。

このように、私の動機はデータ分析そのものや、その手法開発にあるのではなく、現象の理解にあります。また、「この世界の現象をすべて知りたい」ということがそもそもの人生の目標ですので、この世界のあらゆる分野について知ることに大きな喜びを感じます。その意味で、この世界にあるあらゆる社会課題が私の興味関心の対象となりますため、幅広い分野の人々との知識交流ができると良いなと思っています。

「私の担当する講義や研究教育で想定する学生の人物像」

最後に、これからソーシャル・データサイエンス学部や大学院を受験する皆さんへ、私の担当する講義や研究教育で想定する学生の人物像をお伝えしたいと思います。

まず私の担当する講義や研究教育の目的は、種々の社会課題を解決するために、理学や工学、社会科学といった分野に存在する「自然現象」を理解するために必要なデータサイエンスを学び、それを実際の社会課題に応用できるようになってもらうことです。したがって学生の皆さんには、データ分析技術の理解を目的とするのではなく、講義を通して各自が興味関心を持つ現象における課題をいかにして解決するかを探究してもらいたいと考えています。

機械学習という技術は今後コモディティ化の一途をたどり、多くの人が習得・活用できるようになります。しかし、その技術を身につければ、現象が解明できるというものではありません。重要なのは、問題を設定し、仮説を立て、データを集めて分析し、モデルを提示・評価し、社会実装するといった一連の研究プロセスを実現できる能力を身につけることです。こうした能力なくして、データサイエンスによって科学を発展させ、社会課題を解決していくことは困難です。私の研究室での研究教育では、特にこの点を重視して、研究室配属後にできるだけ早く研究を開始し、これらの研究プロセスを実施してもらい、論文を出版することを経験してもらう予定です。修士課程では、修士1年のうちに論文投稿までの段階を完了することを想定しています。最初の論文投稿までは、短期的に研究プロセスを学んでもらうためにある程度私のほうで研究内容を指定しますが、その後は自由に研究をやってもらおうと考えています。このような研究能力を早期に習得してもらうためにも、私の講義や研究室には、何か特定の気になる現象を持っていて、主体的にその機序を解明する研究に取り組みたいという人にぜひ来ていただきたいと考えています。