ナッシュ均衡

ナッシュ均衡の最新ニュースをまとめて検索!

ナッシュ均衡(ナッシュきんこう、Nash equilibrium)は、ゲーム理論における非協力ゲームの解の一種であり、いくつかの解の概念の中で最も基本的な概念である。数学者のジョン・フォーブス・ナッシュにちなんで名付けられた。

ナッシュ均衡は、他のプレーヤーの戦略を所与とした場合、どのプレーヤーも自分の戦略を変更することによってより高い利得を得ることができない戦略の組み合わせである。ナッシュ均衡の下では、どのプレーヤーも戦略を変更する誘因を持たない。

ナッシュ均衡は、必ずしもパレート効率的ではない。その良い例が、囚人のジレンマである。

目次

[編集] 定義

形式的な定義は次の通りである。標準型ゲーム G = (N, S, u) (N はプレーヤーの集合、S = \prod_{i \in N} S_i は戦略の組の集合、u = (u_i)_{i \in N} \; (u_i : S \rightarrow \mathbb{R}) は効用の組)において、戦略の組 s^* \in S がナッシュ均衡であるとは、全てのプレーヤー i \in N と、全ての s_i \in S_i に対して、

 u_i(s^*) \geq u_i(s_i, s^*_{-i})

を満たすことである。

ただし、s-i は、i 以外のプレーヤーの戦略の組をさす。

[編集] 純粋戦略ゲームとナッシュ均衡

[編集] 支配戦略によるナッシュ均衡

純粋戦略ゲーム (Pure strategy game) とは、参加者 (プレーヤー) が必ずどれかの戦略を選ぶゲームである。例えば、以下の表は、二人のプレーヤー Pa と Pb がそれぞれ戦略 (A1 または A2) と (B1 または B2) を選べるときの、それぞれの利得を示す。並んだ数字の左側は Pa の利得、右側は Pb の利得である。

Pa/Pb B1 B2
A1 5, 2 2, 4
A2 4, 6 1, 6

まず Pa の利得に注目すると、Pb がどちらの戦略を選ぼうが、Pa は A1 戦略を選んだ方がより大きな利得を得ることができる。このような関係が成り立つとき、A1 は強支配戦略であると表現する。支配するとは、ある戦略を選ぶことが他方の戦略を選ぶより有利であるという意味である。

次に Pb の利得に注目すると、Pa がどちらに戦略を選んでも、B2 戦略を選んだ方が B1 戦略のとき以上の利得を得られる。Pa が A2 戦略を選んだ場合には B1 と B2 は同等になるので、このような関係のとき B2 は弱支配戦略であるという。

結果として、Pa にとっての最適戦略は A1、Pb にとっての最適戦略は B2 となり、両者ともここから戦略を変更しても利得は減る。この組み合わせ (A1, B2) がナッシュ均衡となる。

Pa、Pb が (A1, B2) という戦略をとった場合、Paは戦略を変更して A2 をとれば利得が 2 から 1 へ減少してしまうため、戦略を変更する誘因を持たない。同様に Pb も、戦略を変更して B1 をとれば利得が 4 から 2 へ減少してしまうため、戦略を変更する誘因を持たない。

なお、Pa、Pb が (A2, B1) という戦略をとった場合の利得は (4, 6) となり、ナッシュ均衡における利得と比べて Pa、Pb ともにより大きな利得を得ることができる。この場合、Pa がより大きな 5 の利得を得るため A1 に戦略を変更する誘因を持つため、ナッシュ均衡ではない。すなわち、このゲームは囚人のジレンマゲームである。また、(A1, B2) から (A2, B1) への戦略変更は、パレート改善であり、ナッシュ均衡 (A1, B2) はパレート効率的ではない。

[編集] 逐次消去によるナッシュ均衡

相手の戦略によってどの戦略が最も大きな利得を出すかが変化する場合、他の戦略すべてを支配できる戦略が存在しない場合がある。そのような場合、他から支配されている戦略を消去していくことで残った戦略の組み合わせをナッシュ均衡と定義できる。支配戦略によってナッシュ均衡が定義できる場合、それは消去によって定義されたものと一致する。

Pa/Pb B1 B2 B3
A1 5, 2 2, 4 4, 0
A2 4, 6 3, 6 2, 5
A3 3, 3 1, 2 7, 2

↓B3 は B2 に支配されているため、B3 を消去。

Pa/Pb B1 B2
A1 5, 2 2, 4
A2 4, 6 3, 6
A3 3, 3 1, 2

↓A3 は A2 に支配されているため A3 を消去。

Pa/Pb B1 B2
A1 5, 2 2, 4
A2 4, 6 3, 6

↓B1 は B2 に支配されているため B1 を消去。

Pa/Pb B2
A1 2, 4
A2 3, 6

ナッシュ均衡は (A2, B2)。

[編集] 混合戦略ゲームにおけるナッシュ均衡

混合戦略ゲームとは、参加者が各行動を選ぶ確率を戦略とするような非協力ゲームのことである。この場合、ナッシュ均衡は各参加者の行動確率の組として表される。有限ゲーム (プレーヤーの数と各プレーヤーの戦略の数が有限のゲーム) は少なくとも 1 つのナッシュ均衡を (混合戦略ゲームで考えれば) 持つことが証明されている (ナッシュの定理。ナッシュは、この証明を角谷不動点定理を応用することによって得た)。

Pa/Pb B1
確率 q
B2
確率 (1 - q)
A1
確率 p
1, 2 0, 0
A2
確率 (1 - p)
0, 0 2, 1

この表のゲームの場合は Pa の得る利得の期待値は:

1・pq + 2・(1 - p)(1 - q) = 3pq - 2p - 2q + 2 = (3q - 2)p + 2(1 - q)

である。これを p の関数だと考えると:

  • q > 2/3 なら:単調増加の直線グラフなので、期待値の最大値は p = 1 のとき q
  • q < 2/3 なら:単調減少の直線グラフなので、期待値の最大値は p = 0 のとき 2 - 2q
  • q = 2/3 なら:期待値は一定で 2/3

となる。

Pb の得る利得の期待値の最大値も、p によって同様に決定される。この二つのグラフの交点がナッシュ均衡となる。このゲームの場合は (2/3, 1/3) がそうである。

[編集] 関連項目

最終更新 2009年11月6日 (金) 19:36 (日時は個人設定で未設定ならばUTC)。
【ナッシュ均衡】変更履歴

ご利用上の注意