【戦争の数学】なぜ戦争は止められないのかをゲーム理論で考える

書籍『ド文系でも楽しい数学 直感がことごとく裏切られる7つの話』はこちら↓↓↓
https://www.amazon.co.jp/dp/4046071362

書籍発売記念トークイベントin大阪(5月6日)の詳細とチケット購入はこちら↓↓↓

『ド文系でも楽しい数学 直感がことごとく裏切られる7つの話」出版記念イベントin大阪!』

29 Comments

  1. 始めから協調路線(核を持たない)に立ってる日本って、ゲーム理論的にはかなり異質なのか

  2. AIに期待する部分ってここなんだよなぁ。人間でない+ゲーム理論を前提に考え、ネットワークで互いのAIが共有できるわけだから、パレート最適を選べる確率が人間より上がるわけだからね。動画内では繰り返し…つまりは[しっぺ返し戦略]を取ればいいが、最初に出し抜いたのなら、それを続けた方がいい。なぜなら相手が本当に譲歩する可能性が無いわけだからね。そうなると勝ち逃げし続けることが最適解になる。回数を無限化というけど、人間には寿命というタイムリミットがあるからね。 最初の論理にしても、次手と流れで見ても人間同士より、AI同士の方がパレート最適の可能性がある

  3. Amazonで予約してた本、届きました🎁
    待ってました😊
    面白い✨️✨️

  4. 5:51 「自分の得を考えた結果、全員が損する」って当たり前だろ。自分の得と全員の得という相容れない目的があるのに、自分の得を求めた結果全員の得が達成されてないって言ってること進次郎だぞ

  5. 現在私は数学科大学院でまさに繰り返しゲームを背景に戦争における最適戦略を研究しています。
    この動画では、まるでこの世から戦争がなくならないように説明されていますが、軍拡、軍縮の数値が説明のため恣意的に設定されていることなどに注意が必要です。(「優位に立てるので+20としよう」など)

    逆に、数値をある程度いじれば軍縮が最適な戦略であるような設定も可能だということです。

    私は、軍拡や裏切り、攻撃など戦争につながる戦略ではなく、現代では協力が最適な戦略であることを証明するため研究を行なっています。

  6. 実際には国単位で合理的には全く動いてないんですよね。選挙や汚職裁判の停止、つまり権力者の保身が目的だったりで。軍拡戦略が軍需産業の利益のためであって国全体ではもともと不合理だったりとか。実際戦後日本の繁栄は生産性の低い軍事部門が小さかったことが一因とされています。

    もちろんゲーム理論の価値を否定しているのではなく、2主体モデルだけを聞き齧った初学者が軍拡を合理的と単純に考えないと良いなと。

  7. 大変勉強になりました。
    ところでアメリカ大統領は4年制で、トランプにとっては交渉回数には限りがあるので、
    任期中は強硬もしくは軍拡を選択することになりませんか?

  8. イラン=イスラム体制が合理的なゲーマーとは限らないんだなぁ…
    情報あり(SNSでやりとりあり)・有限状態(資金や資源が枯渇するまで)・非合理(相手が最善手を出すとは限らない)のゲームかな?

  9. 第三次世界大戦は(きっかけになる)核戦争後の世界の戦争になるので、地面に棒で書いても本業を続けられる数学者の戦争になる……という事だったりして笑

  10. モサデクに猛烈アタックをして海上封鎖していたイギリス海軍を回避して石油を買い付けに行ったのが出光。
    それこそが日章丸号事件

  11. Q:繰り返し囚人のジレンマ理論による全体利益を高めるパレート改善へと導く方策を日本による満州事変以降の国際社会(当時の中国や米国など)が行なうとする仮定で、
    その後の日中戦争・日独伊三国同盟締結・北部仏印進駐・南部仏印進駐に対して、それぞれどのような内容のしっぺ返しが妥当と考えますか?
    ただし、しっぺ返しの内容は、なるべく武力制裁ではない方法で、報復の均衡性・即応性を重視するものとします。

    AI回答:非常に高度な設定です。
    ここでは <Repeated Prisoner's Dilemma(繰り返し囚人のジレンマ)> と <Pareto Improvement(パレート改善)> を軸に、

    * 武力ではない
    * 均衡的(やり過ぎない)
    * 即応的(遅れない)
    という「協調を回復させるしっぺ返し(Tit-for-Tat型)」を設計します。

    対象となる歴史的出来事:
    * Mukden Incident(満州事変)
    * Second Sino-Japanese War(日中戦争)
    * Tripartite Pact(日独伊三国同盟)
    * Japanese occupation of northern French Indochina(北部仏印進駐)
    * Japanese occupation of southern French Indochina(南部仏印進駐)

    また関与主体:
    * Japan
    * China
    * United States
    * League of Nations(国際連盟)

    # 基本設計思想:(理論面)
    繰り返し囚人のジレンマで協調を維持する最適戦略は:「寛容なTit-for-Tat」です。

    具体的には:
    1. 最初は協調
    2. 裏切られたら即座に軽度報復
    3. 相手が戻ればすぐ協調回復
    4. 過剰制裁は禁止
    この思想で設計します。

    # 全体方針(最重要)
    もし当時の国際社会が本当に合理的なら:
    <全面禁輸(石油禁輸)のような極端措置は最後まで使わない>はずです。
    理由:極端制裁は「絶望 → 戦争」を誘発するためです。(これは理論上ほぼ確実)

    # ケース①:満州事変(1931)
    対象:Mukden Incident
    これは<最初の裏切り>です。ここでの対応が最重要でした。

    # 妥当なしっぺ返し
    ## レベル1(即応・軽度):「満州関連のみ限定経済制裁」
    内容:
    * 満州産品への関税上乗せ
    * 満州関連企業の融資制限
    * 日本本土は対象外
    ポイント:「限定性」です。全面制裁ではない。

    ## レベル2(同時に提示):「条件付き協調提案」
    内容:
    * 国際監視団受け入れ
    * 鉄道権益の共同管理
    * 満州自治の国際管理案
    これは:「逃げ道の提示」です。(極めて重要)

    # 理論的評価:この対応は<最もパレート改善に近い>です。
    全面対立を避けられます。

    # ケース②:日中戦争(1937)
    対象:Second Sino-Japanese War
    ここでは:<制裁の段階的強化>が必要でした。

    # 妥当なしっぺ返し
    ## レベル1(均衡型):「軍需関連のみ輸出制限」
    内容:
    * 軍用航空機部品
    * 軍需機械
    * 軍用燃料添加剤
    重要:「民生石油は維持」ここが核心です。

    ## レベル2(外交圧力)
    内容:
    * 国際停戦会議の常設
    * 仲裁義務化
    これは「協調回帰の機会」を残します。

    # 理論評価:完全禁輸より<長期協調確率が高い>です。

    # ケース③:日独伊三国同盟(1940)
    対象:Tripartite Pact
    これは<対米牽制>の意味を持ちます。

    # 妥当なしっぺ返し:「安全保障透明化要求」
    内容:
    * 同盟適用条件の公開要求
    * 第三国仲裁条項の提案

    同時:<金融制裁(限定)>
    内容:軍事投資関連のみ制限
    ポイント:<軍事ではなく信用コスト増>です。

    # 理論評価:これは<戦争誘発確率を下げる>効果があります。

    # ケース④:北部仏印進駐(1940)
    対象:Japanese occupation of northern French Indochina
    ここで重要:<過剰反応禁止>です。

    # 妥当なしっぺ返し:「地域限定資源制限」
    内容:
    * 仏印経由輸送のみ制限
    * 他地域は維持
    同時:<撤退期限交渉>
    期限:6~12ヶ月。

    # 理論評価:この段階では<まだ戦争回避可能>です。

    # ケース⑤:南部仏印進駐(1941)
    対象:Japanese occupation of southern French Indochina
    これは<最も危険な行動>です。
    実際史:ここで石油禁輸が発動しました。
    しかし、これは「極端制裁」です。

    # 妥当なしっぺ返し(代替案):「段階的石油制限」ではなく、石油「凍結・配給制」が最適です。

    ## 内容
    * 石油供給を50%削減
    * 完全停止しない
    * 撤退すれば即回復
    重要:<生存ラインを残す>

    # 理論評価:全面禁輸より<戦争回避確率が大幅上昇>します。

    # 最も重要な原則(歴史的教訓)
    極端制裁:<石油全面禁輸>は
    ゲーム理論上、「裏切りの固定化」を起こします。
    結果:戦争確率が急上昇します。

    # 総合評価:(もしこの戦略が採用されていたら)
    起きた可能性:
    * 日米戦争:大幅低下
    * 日中戦争:長期停戦可能
    * 真珠湾攻撃:回避確率上昇
    推定戦争回避確率:40~60%程度(完全回避ではない)

    # 最重要結論:
    この歴史局面での最大の失敗は「報復が遅く、かつ極端だったこと」です。

    最適戦略は「早く・軽く・戻れる報復」でした。

  12. Q:繰り返し囚人のジレンマ理論による全体利益を高めるパレート改善へと導く方策を、第一次世界大戦終結以降の国際社会(当時のアメリカ合衆国、イギリス、フランス、ドイツ、イタリア)が行なうとする仮定で、
    ドイツへの過酷な報復だったと評されるヴェルサイユ条約の内容を調整することで、ヒトラーやムッソリーニといった当時の国際秩序への挑戦者(彼らは裏切り固定の傾向が強い)を生み出さないようにするか、
    仮に生み出してしまっても無力化して大きな戦争を防ぎ、仮に戦争を避けられないとしても小さな戦争に留めるための現実的方策について考察してください。

    AI回答:非常に本質的な問いです。
    これは「なぜ第一次世界大戦後の国際秩序は“協調均衡”を維持できなかったのか」を、
    <繰り返し囚人のジレンマ(Repeated Prisoner’s Dilemma)>で再設計する問題と言えます。

    対象となる主要プレイヤーは:
    * アメリカ合衆国
    * イギリス
    * フランス
    * ドイツ
    * イタリア
    制度の中心は「ヴェルサイユ条約」です。
    そして問題の核心は:「敗者を“固定裏切り者(Always Defect)”に変えない制度を作れたか?」という点です。

    # Ⅰ. まず歴史をゲーム理論で再構成する
    ## 1919年のゲーム構造

    勝者(英仏中心)の選択:
    * C:寛容(協調)
    * D:厳罰(報復)

    敗者(ドイツ)の選択:
    * C:秩序参加
    * D:秩序破壊(再軍備・復讐)

    実際の結果:
    > 勝者:D(厳罰)
    > 敗者:D(復讐志向)

    つまり「D–D均衡」が固定されました。

    これが:
    * アドルフ・ヒトラー
    * ベニート・ムッソリーニ
    のような<秩序破壊型プレイヤー>を生みました。

    # Ⅱ. パレート改善の基本原則(重要)
    繰り返し囚人のジレンマで協調を維持する条件は:
    ## 原則1:報復は可能だが、永続させない(Forgiving Tit-for-Tat)
    ## 原則2:裏切るより協調の方が得になる設計
    ## 原則3:敗者に「未来利益」を持たせる

    この3つが揃えば、<全体利益が増えつつ安定する(パレート改善)>が可能です。

    # Ⅲ. ヴェルサイユ条約の「修正すべき核心部分」
    ここが最重要です。<すべてを変える必要はない。しかし3点は必須でした>

    # 修正①:賠償金の「条件付き・可変化」
    現実:ドイツは巨額賠償を課された。

    結果:
    * 経済崩壊
    * ハイパーインフレ
    * 急進政治化

    ## 代替案(最も現実的):賠償金を「GDP連動型」にする。
    例:
    * 成長時:支払い増
    * 不況時:減免
    * 一定期間後:自動削減

    これは<繰り返しゲーム的には最強>です。
    なぜなら、「協調 → 報酬」「裏切り → 損失」が明確になるため。

    ## 期待効果:
    * 経済崩壊回避
    * 中間層維持
    * 急進勢力弱体化
    つまり、<ヒトラー出現確率が大きく低下>します。

    # 修正②:「敗戦国の秩序参加」を保証
    現実:ドイツは長期間、<国際秩序から排除>されました。
    これは「最大の戦略的失敗」でした。

    ## 代替案:早期に「国際連盟」へ加盟させる。

    条件:
    * 軍縮順守
    * 国境尊重
    * 紛争仲裁参加
    これは<協調への“入り口”を残す>設計です。

    ## 効果:排除ではなく「参加による拘束」が可能になります。

    # 修正③:「軍事制限」の心理的再設計

    現実:ドイツ軍は極端に制限された。
    これは「国家的屈辱」を固定しました。

    ## 代替案:軍事制限を「段階解除型」にする。
    例:
    * 5年後:一部緩和
    * 10年後:条件付き解除
    * 違反時:再制限
    これは「希望の時間軸」を作ります。

    # Ⅳ. ヒトラー・ムッソリーニ型の「裏切り固定者」対策
    仮に彼らが出現しても「無力化できる制度」は設計可能でした。

    ## 方策1:早期の小規模報復
    最重要ケース:1936年ラインラント進駐
    この時のドイツ軍は極めて弱かった。

    もし、英仏が即時行動していれば、ヒトラー政権崩壊の可能性が高かった
    と多くの歴史家が指摘しています。

    これは「典型的Tit-for-Tatの失敗」です。:「裏切りに即応しなかった」

    ## 方策2:イタリアを敵にしない
    重要事件:エチオピア侵攻
    この時、英仏は制裁を行った。

    結果:
    * ベニート・ムッソリーニ

    * ナチス・ドイツ
    側に接近。

    ## 代替案:限定譲歩
    * 植民地調整
    * 経済利益分配
    これは「分断戦略」として有効でした。

    # Ⅴ. 「戦争が不可避な場合」でも小さく抑える設計
    これも可能でした。

    ## 方法1:早期局地戦
    最重要タイミング:1938年ミュンヘン会談

    ここで全面譲歩ではなく、「限定武力示威」を行う。
    結果、戦争は「短期局地戦」で終わった可能性があります。

    ## 方法2:経済封鎖の早期使用

    全面戦争前:
    * 輸出制限
    * 金融遮断

    これは軍事よりも:「コスト効率が高い」手段です。

    # Ⅵ. 最大の教訓(最重要)
    実は、問題の核心は:「条約の厳しさそのものではない」です。

    ## 本当の問題:「罰はあったが、回復の道がなかった」

    # 繰り返しゲーム理論的最適解
    最重要公式:「罰 + 回復可能性 = 安定」

    罰のみ:→ 復讐
    回復のみ:→ 裏切り
    両方必要です。

    # Ⅶ. 最終結論(統合モデル)
    もし1919年に次の5条件が実装されていたなら:
    第二次世界大戦の規模は<大幅に縮小した可能性が高い>です。

    ## 「パレート改善型」5条件
    ① 賠償金のGDP連動化
    ② 早期国際秩序参加
    ③ 軍事制限の段階解除
    ④ 初期違反への即応
    ⑤ 敵の分断(特にイタリア)

    # Ⅷ. 最も重要な洞察(理論的核心)
    繰り返し囚人のジレンマでは:<最大の失敗は「最初の過罰」ではない「最初の裏切りへの無反応」である>
    つまり:
    * 最初は寛容
    * しかし裏切りには即応
    * だが許す余地を残す
    これが:「歴史上最も欠けていた戦略」でした。

  13. これ、ゲーム回数が無限って難しから現実こうなってるのかしら…
    会社でも国のポストでも任期もあれば、そもそも人の寿命もあるから
    国は概念でずっと続くみたいな錯覚あるけど、個人のゲームには終わりがあって…

    それを考えると少子化って平和にとっても良くない気がする。

    自分らの子供のいる世界はゲームを延長するから…。

  14. ほう!書籍発売とトークイベント開催とな!?
    うp主様、おめでとうございます!

    数学系チャンネルなのに、時事も学べるとは!
    なんと素晴らしい!!

  15. そもそも人間は感情の生き物だから、理論通りにはいかないのよねぇ
    あと、他のコメも指摘してるけど国対国だけでなく、国内のいろんな派閥のパワーバランスがあるから理屈もねじ曲がるよね
    国民が望んで無いのに軍拡したり移民呼んだり

  16. 全ての政治家が全ての国の利益、未来永劫続く国家のことを考えることができたら戦争はなくなる。
    つまり戦争は無くならない…

  17. マクロならわかるけど、個々の事例(今回のイラン・アメリカ)に対してゲーム理論で考えてもな、って感じではある。
    すでにイランは損得だけの計算なら協調を考えている、ただし、今は跳ね返りの革命防衛隊が強硬論を言うし、殺されるし、内戦の危険がある。
    具体的な金銭をともなう損得ではなく、面子というお気持ちを立てる理屈が重要な場面。一般的な損得ではなく、"感情"という非合理調整のフェーズ。
    また、ゲーム理論での二者間での損得というより、第三者に成り下がった感情の化物(防衛隊)が居る状況ではもう少し複雑。

  18. これって、
    自白&黙秘が1年と3年
    黙秘&黙秘が0年
    自白&自白が2年づつ
    なら黙秘の可能性高くなるんじゃないかな?

  19. 面白い動画でした。でも囚人のパラドックスが成立するのは、お互い話し合いができないからでは?それをそのまま一般化するのは、ちょっと論理が飛躍していると思います。話し合いができる状況ならば、相手が約束を守れると信頼できるかが鍵になりそうですが。

  20. この理論から考えるとトリガーは既に引かれてしまっているのかも……どっちが引いたのかは知らんけど