宇宙の歴史を解読する新AI「GAME」。ノイズの海から物理法則の「変化率」を95パーセントの精度向上で抽出

夜空を彩る星々や銀河が我々から遠ざかる速度を測ることは、宇宙の始まりと終わりを読み解く上で最も根源的な作業である。現在、この宇宙はダークエネルギーという未知の推進力によって加速膨張を続けている。物理学者たちは観測データからそのエネルギーの性質を抽出しようと試みているが、観測機器がもたらすノイズという深い霧が常に彼らの視界を阻んできた。

データから直接、宇宙の膨張速度の変化率（時間微分）を読み取ることは、嵐が吹き荒れる海上で船の微小な加速度を正確に割り出すような困難を伴う。このたび、イタリアとスペインの物理学研究チームが開発した新しい人工知能アルゴリズム「GAME」は、複数の数式生成モデルの意見を集約するアプローチにより、この難題を打ち破った。微分の計算精度を従来手法に比べて劇的に引き上げたこの技術は、私たちが抱える宇宙のルールブックを根本から書き換えるための極めて鋭利なメスとなる。

01.宇宙のルールブックの綻び。ハッブルテンションが突きつける観測の限界02.カーネルの呪縛と微分の罠。データ至上主義が陥った数学的ジレンマ03.集合知と滑らかさの美学。GAMEが仕掛ける「L-curve」の調停04.95パーセントの視力回復。「宇宙の時計」が刻むダークエネルギーの真実05.不確実性の定式化とStage IVサーベイ。次世代の宇宙論に向けた羅針盤宇宙のルールブックの綻び。ハッブルテンションが突きつける観測の限界

現代の宇宙論において確固たる地位を築いている標準的な理論枠組みは「ΛCDM（ラムダ・コールドダークマター）モデル」である。この理論は、宇宙誕生直後の名残である宇宙マイクロ波背景放射の微細な温度ゆらぎから、銀河の大規模な網の目構造に至るまで、驚くほど正確に宇宙の姿を記述してきた。そこには宇宙の全エネルギーの大部分を占めるダークマターやダークエネルギー（宇宙定数Λ）が組み込まれている。誰も直接観測したことのないこれらの要素を仮定することで、宇宙の振る舞いは見事に説明づけられてきた。

しかし近年、この完璧に思えたルールブックに深刻な矛盾が生じ始めている。宇宙の現在の膨張率を示す「ハッブル定数」の測定において、観測手法の間で説明のつかない食い違いが起きているのだ。初期宇宙の光であるマイクロ波背景放射をプランク衛星で観測し、ΛCDMモデルを当てはめて予測した膨張率は、約67 km/s/Mpcという値を示す。一方、近傍宇宙にあるIa型超新星やセファイド変光星の観測から直接測定した膨張率は、約73 km/s/Mpcという有意に高い値を示している。この「ハッブルテンション」と呼ばれる食い違いは、観測誤差の範囲をはるかに超えており、既存のΛCDMモデルが宇宙の完全な記述ではない可能性を色濃く示唆している。

こうした背景から、特定の理論的パラダイムや人間が設定した仮説に一切依存せず、観測データそのものに宇宙の歴史を語らせようとする「モデル独立」のアプローチが急速に支持を集めている。あらかじめ用意した理論式にデータを当てはめるのではなく、真っ新な状態からデータに潜む物理法則を帰納的に導き出す試みである。

カーネルの呪縛と微分の罠。データ至上主義が陥った数学的ジレンマ

モデル独立のアプローチにおいて、これまで多用されてきた手法の一つがガウス過程（Gaussian Processes）である。これは確率論に基づく強力な手法であるが、データ点間の相関関係をどう見積もるかを決定する「カーネル関数」を人間が事前に入力しなければならない。「このデータはこれくらいの滑らかさを持つはずだ」という仮定を人為的に持ち込む必要があり、完全なモデル独立とは言い難い側面があった。

そこで物理学者たちが着目したのが、遺伝的アルゴリズムを利用したシンボリック回帰である。このアルゴリズムは、サイン、コサイン、指数関数、多項式といった数式のパーツを生物の遺伝子に見立てる。これらをランダムに組み合わせ、交差や突然変異という操作を繰り返しながら、何万世代にもわたって観測データに最も適合する数式を自然淘汰によって生み出していく。この手法はカーネル関数の制約を受けず、人間が容易に解釈可能な明示的な数式を最終的に出力する。

だが、このデータ至上主義のアプローチにも致命的な弱点が潜んでいた。宇宙の観測データからダークエネルギーの状態方程式（そのエネルギーが時間とともにどう変化するかを示す指標）を導き出すには、ハッブルパラメータという宇宙の膨張率の推移を示す関数を少なくとも一回「微分」しなければならない。ここで数学的な悪夢が始まる。

遺伝的アルゴリズムが生み出した複雑な数式が、ノイズを含んだ観測データに見事に重なったとしても、その導関数、すなわち傾きや変化の速度を求めようとした途端、グラフの線は激しく波打ってしまうのだ。データに厳密に適合しようとするあまり、本来の物理現象には存在しない微小な観測ノイズのブレまで数式に取り込んでしまう過学習が起きる。金融市場の分析において、株価の長期的な上昇トレンドを示す美しい曲線が引けても、日々の変動率を厳密に計算しようとするとノイズが極端に増幅されて無意味な乱高下を示してしまう現象と同じ理屈である。宇宙の膨張速度の微細な変化を捉えようとする際、この微分の不安定さは致命傷となる。

集合知と滑らかさの美学。GAMEが仕掛ける「L-curve」の調停

観測ノイズの増幅という罠に陥ることなく、背後に潜む真の物理法則の変化率を抽出するにはどうすればよいのか。ローマ・トル・ヴェルガータ大学やスペイン国立研究会議の研究者からなるチームが提示した解答が、「Marginalised Ensembles（周辺化されたアンサンブル）」の概念を取り入れた進化版アルゴリズム「GAME」である。

従来の遺伝的アルゴリズムは、長大な計算の末にデータへの適合度合い（二乗和誤差の最小化）が最も優れたたった一つの最適解を単独の勝者として選出していた。しかしGAMEは、ただ一つの運の良い数式に結果を委ねない。初期条件やハイパーパラメータの設定を変えて実行された多数のアルゴリズムから、優秀な候補を複数ピックアップし、それらの集合知としての加重平均を構築する。一部のモデルがたまたま拾ってしまった局所的なノイズの影響は、多数のモデルの意見を統合する過程で相殺されていく。

さらに卓越しているのは、この集合知をまとめる際の重み付けの基準である。GAMEは、数式がデータにどれほど適合しているかという評価軸に加えて、その数式を二階微分した値に基づく「粗さのペナルティ」を評価基準に組み込んだ。理路整然と滑らかに変化するモデルの意見には重い価値を与え、ノイズに過敏に反応して荒々しく変動するモデルの意見は軽く扱うという数学的な調停である。

データへの忠実な適合と曲線の滑らかさという相反する要素の最適なバランスを決定するため、チームはL-curve（L字曲線）法と呼ばれる幾何学的な解析手法を採用した。横軸に曲線の粗さ、縦軸にデータ適合度（カイ二乗値）をとって両対数グラフを描くと、プロットされた境界線はアルファベットのL字型に大きく曲がる箇所（エルボー）を描く。この屈曲点こそが、ノイズへの過剰適合を防ぎつつ元のシグナルを最も忠実に再現する究極の妥協点となる。GAMEはこの点を自動的に割り出し、各関数の重みを決定する仕組みを持つ。

95パーセントの視力回復。「宇宙の時計」が刻むダークエネルギーの真実

この新たな評価基準を持った集合知アプローチがもたらした成果は圧倒的である。研究チームが、既知の滑らかな物理モデルを元に人工的なノイズを付与したテストデータを生成し、アルゴリズムに元の形を推測させる実験を行った。その結果、GAMEは関数そのものの再構築において、従来手法と比較して累積誤差を約20パーセント削減した。

そして真価を発揮したのは、ダークエネルギーの状態解明に直結する導関数の推測である。従来の単一モデルが境界付近でノイズに引きずられて甚大な計算誤差を生み出していたのに対し、GAMEが算出した導関数は元の物理モデルの曲線を極めて正確になぞり、累積誤差を従来の約4783から約221へと劇的に低下させた。約95パーセントの驚異的な精度向上である。

テストデータを用いた再構築精度の比較。左側のパネルは関数そのものの再構築を示し、標準的な遺伝的アルゴリズム（オレンジ色の点線）と新手法のGAME（青色の点線）は共に背後にある真のモデル（黒色の実線）をよく追従している。しかし右側の導関数（微分）のグラフに目を向けると、従来手法が両端の境界付近で真のモデルから大きく逸脱して激しく波打っているのに対し、GAMEの手法は全域にわたって本来の物理法則の滑らかさを極めて正確に復元している。
(Credit: M. Peronaci, M. Martinelli, S. Nesseris, arXiv (2026). DOI: 10.48550/arXiv.2602.12870)

実観測データへの適用においても、GAMEはその堅牢性を直ちに証明した。チームは「Cosmic Chronometers（宇宙の時計）」と呼ばれるデータ群を用いてハッブルパラメータの再構築に挑んだ。宇宙空間には、激しい星形成の時代を終えてただ静かに老いていく巨大な初期型銀河が存在する。これらは宇宙の標準時計として振る舞う。赤方偏移（地球から遠ざかることによる光の波長の伸び）がわずかに異なる二つの銀河を見つけ出し、その「見かけの年齢差」を測定する。これにより、その時代の宇宙がどれだけのスピードで空間を引き伸ばしていたか（膨張率）を直接算出できる。超新星爆発を用いた光度距離の測定とは異なり、計算過程に煩雑な積分を含まないため、微分の影響がダイレクトに結果へ反映される。それゆえに、アルゴリズムの微分の安定性を問うには最適な試金石となる。

GAMEを用いて再構築した膨張率を微分し、そこからダークエネルギーの状態方程式を逆算した結果は、現在の標準モデルであるΛCDMの予測と見事に合致した。最新の重粒子音響振動観測プロジェクトであるDESIが導き出した物質密度の前提を採用した場合、現在の状態方程式はマイナス0.986（プラスマイナス0.132の誤差）と算出された。この数値は、ダークエネルギーの正体が時間の経過とともに変化しない「宇宙定数（マイナス1）」であるとする仮説を強く支持している。

不確実性の定式化とStage IVサーベイ。次世代の宇宙論に向けた羅針盤

GAMEの手法の真の価値は、人工知能による数式推定に欠かせない「結果に対する不確実性の定量化」という全く新しい枠組みを構築した点にある。

研究チームは、経路積分法（path-integral approach）と呼ばれる手法を用いて、観測データそのものに由来する統計的な誤差をまず見積もった。量子力学の考え方を応用し、最適解の周辺に広がる関数の空間全体を見渡すことで、データノイズが引き起こす誤差の帯を滑らかに算出する。これと並行して、集合知を形成する各アルゴリズムがどの程度異なる見解を持っているかを示す「構成由来のばらつき（アンサンブル分散）」を算出した。これら二つの独立した不確実性を直交する誤差として合算することにより、人工知能特有の「間違っているのに過剰な自信を持つ」現象を防ぎ、物理学的に誠実なエラーバンド（誤差の範囲）を引くことに成功した。

今後数年のうちに、Euclid宇宙望遠鏡やDESIプロジェクトなど、いわゆるStage IVと呼ばれる次世代の大規模宇宙観測サーベイが、前例のない精度と規模で銀河の分布データを地球に送り届けてくる。研究チームが行ったシミュレーション検証では、Stage IVクラスの高精度データを想定したモックカタログをGAMEに読み込ませた場合、現在のデータを用いた際と比較して約2.6倍の解像度でダークエネルギーの状態方程式を制限できることが示された。

現段階の実証実験では、個々の観測データ同士の相関関係（共分散行列）を完全には評価関数に組み込んでいない点や、宇宙空間の曲率がゼロ（平坦）であるという前提条件を置いている点など、さらなる拡張の余地は残されている。特定の理論的偏見に与することなく、膨大なノイズの奥底に横たわる真の物理法則を直接描き出すGAMEの手法は、来るべき精密宇宙論の時代において、私たちが手にする最も堅牢な羅針盤となる。

論文