ゲーム理論

パレート最適とナッシュ均衡|ゲーム理論におけるパレーと最適を5分で解説

こんな人におすすめ
  • パレーと最適について知りたい人
  • ナッシュ均衡とパレート最適の関係について知りたい人
れん
れん
こんにちは、経営工学を専攻しているれんです

今回は、ゲーム理論におけるパレーと最適について紹介していこうと思います。

パレート最適はミクロ経済学で学習する内容ですが、ゲーム理論とも絡んできます。

特に、囚人のジレンマと言った有名問題と絡んできることが多いです。

難しく感じる人も多いですが、一度理解してしまえば簡単なのでこの機会にマスターしちゃいましょう!

パレート最適について

まずは、パレート最適の定義を紹介した後に、わかりやすく言い換えていこうと思います。

パレート最適の厳密な定義

パレート最適とは

戦略の組$(s_1, s_2, …, s_n)$における利得を、$f_i(s_1, s_2, …, s_n)$で表現する。

この時、戦略の組$(s_1, s_2, …, s_n)$がパレート最適

$\Leftrightarrow$

全ての$i \in N$に対し、$f_i(t_1, t_2, …, t_n)$ $>$ $f_i(s_1, s_2, …, s_n)$となる戦略の組$(t_1, t_2, …, t_n)$が存在しない

このままでは、全く意味がわからない人がほとんどだと思います。

そのため、わかりやすく噛み砕いて紹介していきます

パレート最適とは簡単にいうとどういうことなのか

パレート最適を一言でいうと、「他人の利得を下げずに自分の利得を増やすことができない状態のこと」を言います。

まずは、わかりやすくプレイヤーが2人の場合を考えていきます。

Aさん\Bさん $b_1$ $b_2$
$a_1$ $(8, 4)$ $(4, 5)$
$a_2$ $(2, 3)$ $(6, 6)$

例えば、このような戦略形2人ゲームがあったとしましょう。

この時、パレート最適な戦略の組はどれかわかりますか?

れん
れん
答えは、Aさんが戦略$a_2$、Bさんが戦略$b_2$をとった時です!

その理由を定義と照らし合わせて解説していきます。

まずはBさんに関して考えていきます。

Bさんに関しては、($a_2$, $b_2$)をとった時の利得が一番大きいので考える必要がありません。

そのため、Aさんだけ考えていきます。

Aさんは、($a_1$, $b_1$)の戦略の組を選択した時の方が利得が6から8に増加します。

その一方でBさんの利得は6から2に減少してしまいます。

Aさんの利得を増やすためには、Bさんの利得を減らさないといけません

よって、($a_1$, $b_1$)はパレート最適ということになります。

れん
れん
数式の定義だとわかりにくい部分が多いので、具体例を考えてみると理解が深まりますよ!

囚人のジレンマ|パレート最適とナッシュ均衡の具体例

それでは、ここからゲーム理論におけるパレート最適の有名問題である「囚人のジレンマ」を紹介していきます。

れん
れん
名前だけなら聞いたことがある人も少なくないかもしれませんね

①:囚人のジレンマについて

まずは、囚人のジレンマについて紹介していきます。

問題

2人の容疑者AとBが共犯容疑で別々の牢屋に閉じ込められています。

検事は、それぞれの囚人に対して次のように述べました。

  • 本来は懲役5年だが、二人とも黙秘したら懲役2年に減らしてあげる
  • 片方が真実を話して、片方が黙秘した場合、真実を話した方は懲役0年、黙秘した方は懲役10年
  • 両方真実を話した場合、懲役は5年

この時、容疑者AとBがとるべき行動とは?

文字だけでみても、あまりよくわからないので戦略形ゲームに直して考えていきましょう。

れん
れん
ゲーム理論でナッシュ均衡を求めるときは、基本的に戦略形ゲームに表現し直した方が考えやすいですよ!

戦略形ゲームに直してみると以下のようになります。

Aさん\Bさん 黙秘 自白
黙秘 $(2, 2)$ $(10, 0)$
自白 $(0, 10)$ $(5, 5)$

ここからは、実際にナッシュ均衡を求めていこうと思います。

②:囚人のジレンマのナッシュ均衡

続いては、囚人のジレンマにおけるナッシュ均衡を求めていきましょう。

今回は、数字が小さい方が利得が大きくなる(嬉しい)ことに注意して純粋戦略ナッシュ均衡を求めていきましょう。

れん
れん
純粋戦略ナッシュ均衡の求め方はこちらの記事でわかりやすく解説しています

まずは、Bさんが黙秘をする場合を考えます。

Aさん\Bさん 黙秘 自白
黙秘 $(2, 2)$ $(10, 0)$
自白 $($$0$$, 10)$ $(5, 5)$

すると、Aさんは自白した方がいいことになりますね。

次にBさんが自白する場合を考えましょう。

Aさん\Bさん 黙秘 自白
黙秘 $(2, 2)$ $(10, 0)$
自白 $($$0$$, 10)$ $($$5$$, 5)$

すると、Aさんは自白をした方が良いということになります。

れん
れん
Aさんの「自白」する戦略が「黙秘」する戦略を支配していることに気づけば一瞬でしたね!

続いて、Aさんが黙秘する場合を考えます。

Aさん\Bさん 黙秘 自白
黙秘 $(2, 2)$ $(10, $$0$$)$
自白 $($$0$$, 10)$ $($$5$$, 5)$

すると、Bさんは自白した方が利得が大きくなります。

また、Aさんが自白する場合を考えると、Bさんは自白した方がいいことが簡単にわかりますね。

Aさん\Bさん 黙秘 自白
黙秘 $(2, 2)$ $(10, $$0$$)$
自白 $($$0$$, 10)$ $($$5$$, $$5$$)$

するとナッシュ均衡は、(Aさんの戦略, Bさんの戦略) = (自白, 自白)になることがわかるかと思います。

③:囚人のジレンマのナッシュ均衡はパレート最適?

さて、ここで囚人のジレンマにおけるナッシュ均衡がパレート最適なのかを考えていきましょう。

パレート最適とは

他人の利得を下げずに自分の利得を増やすことができない状態のこと

それでは、実際にAさんの利得を増える場合を考えていきます。

Aさん\Bさん 黙秘 自白
黙秘 $(2, 2)$ $(10, 0)$
自白 $(0, 10)$ $(5, 5)$

Aさんの利得が上昇するのは$(黙秘, 黙秘)$と$(自白, 黙秘)$の2種類です。

まずは$(自白, 黙秘)$の場合を考えていこうかと思います。

$(自白, 黙秘)$の場合は、Aさんの利得は確かに大きくなりますが、Bさんは懲役年数が増加してしまうので利得は小さくなります。

つまり、$(自白, 黙秘)$の場合はAさん自身の利得を増やすためにBさんの利得を減らしているのでパレート最適ではありません。

次に$(黙秘, 黙秘)$の場合を考えていきます。

この場合はAさんもBさんも懲役年数が減るのでお互い利得が大きくなります。

そのため、ナッシュ均衡の$(自白, 自白)$はパレート最適となりません

そして、$(黙秘, 黙秘)$からAさんの利得を増やそうとしてもBさんの利得が必ず減少してしまうので$(黙秘, 黙秘)$はパレート最適であることがわかります。

れん
れん
ナッシュ均衡だからパレート最適とはならないので注意してくださいね!

パレート最適は理解してしまえば簡単です!

今回はパレート最適について紹介しました。

ナッシュ均衡とパレート最適がごっちゃになってわからなくなる人も少なくないと思いますが、この記事を参考にしてしっかり理解してくださいね。

れん
れん
ナッシュ均衡について復習したい方はこちらの記事をご覧ください!

参考:ナッシュ均衡|わかりやすく純粋戦略ナッシュ均衡を解説します|例題つき

また、随時演習問題も作成していくのでTwitterのフォローもお待ちしています。