- 経済大学院の院試勉強をしている人
- 混合戦略ナッシュ均衡で解けない問題を無くしたい人
今回は、3人の混合戦略ナッシュ均衡の求め方を解説していこうと思います。
2×3の混合戦略ナッシュ均衡も難易度の高い問題ですが、3人の場合もかなり難易度は高くなります。
ですが、この問題をマスターできればかなり差をつけることができます。

このレベルを問題なく解けるようになれば、かなり有利になりますよ!
それでは、早速実際の過去問を利用して解き方を学んでいきましょう。
- 混合戦略ナッシュ均衡の求め方<



突然ですが、記事を読む前に3分だけ時間をください!
t-newsというサイトに登録すると、今だけAmazonギフト券500円がプレゼントされます!
- 大学生活のお役立ち情報が手に入る!
- 高時給家庭教師案件が豊富にある!
- 高時給採点バイトの案内が届いて荒稼ぎ可能!



興味のある方は下のボタンから登録してみてくださいね!
下のボタン以外からの登録だとAmazonギフト券はもらえないので注意してください!
3人の場合の混合戦略ナッシュ均衡の求め方
それでは、今回は東京工業大学の経営工学系の大学院入試の過去問を実際に利用して解き方を解説していこうかと思います。



これまでよりも難易度が上がっているのでついてきてくださいね
それでは、今回の問題はこちらになります。
問題
以下の3人戦略系ゲームにおいて、全てのナッシュ均衡を混合戦略の範囲で求めよ。各セルの値は、左から順にプレイヤー1の利得、プレイヤー2の利得、プレイヤー3の利得を表す。
〜プレイヤー3の戦略1〜
プレイヤー2 | |||
戦略1 | 戦略2 | ||
プレイヤー1 | 戦略1 | $0, 0, 0$ | $4, 8, -3$ |
戦略2 | $2, 4, -2$ | $0, 0, 0$ |
〜プレイヤー3の戦略2〜
プレイヤー2 | |||
戦略1 | 戦略2 | ||
プレイヤー1 | 戦略1 | $0, 0, 0$ | $1, 2, -1$ |
戦略2 | $2, 4, -4$ | $0, 0, 0$ |
①:混合戦略に関する定理を利用する
まずは、混合戦略に関する定理を利用してナッシュ均衡を求めていきます。
ある混合戦略が他のプレイヤーの混合戦略の組みに対して最適反応戦略であったとすると、その混合戦略によって正の確率で選ばれる全ての純粋戦略も最適反応戦略になる。さらに、このときこれらの純戦略の任意の混合戦略も最適反応戦略となる。
よって、今回の場合は以下の3式が成り立つ必要があります。
- $4p(1 – q)r + p(1 – q)(1 – r)$ $= 2(1 – p)qr + 2(1 – p)q(1 – r)$
- $4(1 – p)qr + 4(1 – p)q(1 – r)$ $= 8p(1 – q)r + 2p(1 – q)(1 – r)$
- $-2(1 – p)qr -3p(1 – q)r$ $= -4(1 – p)q(1 – r) -p(1 – q)(1 – r)$
これを連立して解くと、$p = \frac{1}{2}$$q = \frac{1}{2}$$r = \frac{1}{3}$となります。
よって、$((\frac{1}{2}, \frac{1}{2}), (\frac{1}{2}, \frac{1}{2}), (\frac{1}{3}, \frac{2}{3}))$はナッシュ均衡の1つになります。
次からは、一旦プレイヤー3が純粋戦略を取ると仮定して問題を解いていきます。
②:プレイヤー3が純粋戦略をとるとして仮定
まずは、各プレイヤーの選択肢は2つなので、一方の確率を$p$とおいた場合もう一方の確率は$1-p$になることはわかるかと思います。
そのため、今回もプレイヤー1の戦略1をとる確率を$p$、プレイヤー2の戦略1を取る確率を$q$とおきます。
この時に、プレイヤー3の利得を考えていきます。
プレイヤー3が戦略$i$を取るときの利得を$E_{3i}$と表現します。
すると、
$E_{31}$ $= -2(1 – p)q$ $+$ $(-3)p(1 – q)$
$= 5pq – 2q – 3p$
$E_{32}$ $= -4(1-p)q$ $+$ $(-1)p(1 – q)$
$= 5pq – 4q – p$
となります。
③:プレイヤー3がどういう条件で戦略を変えるかチェック
次にすることは、プレイヤー3がどのように戦略を変えるのかを考えることです。
つまり、どのような条件で$E_{31} > E_{32}$となるのかを確かめていきます。
$E_{31} > E_{32}$
$\Leftrightarrow$ $-2q – 3p > -4q – p$
$\Leftrightarrow$ $2q > 2p$
$\Leftrightarrow$ $q > p$
つまり、
- $q > p$の時は戦略1
- $q < p$の時は戦略2
- $q = p$の時は任意の戦略
ということがわかります。
これを活かして、次にプレイヤー1とプレイヤー2の最適反応戦略を求めていきます。



ここから先は2×2と似ているので安心してください
④:プレイヤー3の条件のもと各プレイヤーの混合戦略をチェック
さて、プレイヤー1の利得を$E_1$とするとこのようになります。
$\begin{eqnarray}E_1 &=&\left\{\begin{array}{l}4p(1-q) + 2q(1-p)\ (q > p)の時\\p(1-q) + 2q(1-p)\ (q < p)の時\end{array}\right.\\\\&=&\left\{\begin{array}{l}(4 – 6q)p + 2q\ (q > p)の時\\(1 – 3p) + 2q\ (q < p)の時\end{array}\right.\end{eqnarray}$



$p > q$と$p < q$で場合わけしているのは、プレイヤー3の戦略が変わるからです
同じように、プレイヤー2の利得を求めると下のようになります。
$E_2 =\left\{\begin{array}{l}(4 – 12p)q + 8p\ (q > p)の時\\(4 – 6p)q + 2p\ (q < p)の時\end{array}\right.$
よって、$q > p$と$q < p$で場合わけをしてグラフを書いていきましょう。
⑤:場合わけをして均衡を求める
それでは、具体的にナッシュ均衡を全て求めていきます。
プレイヤー3がどの戦略を取るかに気をつけながら3種類で場合わけをしていきます。
Ⅰ:$q > p$の場合
まずは、$q > p$の場合を考えていきます。
$q > p$の場合、プレイヤー3は戦略1をとります。
そのもとで、$E_1$と$E_2$のグラフを書いていきましょう。


$q > p$に注目すると赤色の丸の部分が混合戦略ナッシュ均衡になっていることがわかります。
よって、このときの混合戦略ナッシュ均衡は
$((\frac{1}{3}, \frac{2}{3}), (\frac{2}{3}, \frac{1}{3}), (1, 0))$と$((0, 1), (1, 0), (1, 0))$になります。
Ⅱ:$q < p$の場合
次に、$q < p$の場合を考えていきます。
$q < p$の場合、プレイヤー3は戦略2をとります。
そのもとで、$E_1$と$E_2$のグラフを書いていきましょう。


$q < p$に注目すると赤色の丸の部分が混合戦略ナッシュ均衡になっていることがわかります。
よって、このときの混合戦略ナッシュ均衡は
$((\frac{2}{3}, \frac{1}{3}), (\frac{1}{3}, \frac{2}{3}), (1, 0))$と$((1, 0), (0, 1), (0, 1))$になります。
Ⅲ:$p = q$の場合
最後に$q = p$の場合を考えていきます。
この場合は、一番最初にナッシュ均衡を求めているので省略します。
これでナッシュ均衡は完璧です
今回は、3人の混合戦略ナッシュ均衡を求めていきました。
正直、このレベルまで解けるようになればほとんどの問題を解くことができると思います。
期末試験や経済大学院を受験予定の方はぜひ演習問題もこなしてくださいね。
以上:3人の混合戦略ナッシュ均衡の求め方でした。



記事を最後まで読んでいただき、ありがとうございます!
最後に、3分だけ時間をください!
t-newsというサイトに登録すると、今だけAmazonギフト券500円がプレゼントされます!
- 大学生活のお役立ち情報が手に入る!
- 高時給家庭教師案件が豊富にある!
- 高時給採点バイトの案内が届いて荒稼ぎ可能!



興味のある方は下のボタンから登録してみてくださいね!
下のボタン以外からの登録だとAmazonギフト券はもらえないので注意してください!
コメント