ゲーム理論の要点を分かりやすく。ナッシュ均衡編。

ゲーム理論の要点を分かりやすく。ナッシュ均衡編。

ゲーム理論はコツさえつかめばかなり簡単な理論なのですが、説明する人によって分かりにくかったり、誤解を招かない説明をするために回りくどい言い方をする人も多く、頭がこんがらがってしまう方もよく出てきます。そのため、ここでは多少の誤解は恐れず、簡潔にゲーム理論の論点を整理します。

ゲーム理論とはどんなものか

ゲーム理論とは、相手との交渉などの際に、相手と自分の戦略を設定することで、数学的に戦略を立てるための理論です。実際に本当にさまざまな状況に応用できるのですが、言葉で表すよりもある問題を取り扱うことで理解していきましょう。

ゲーム理論の表の見方

まずは、こんな問題が与えられた場合を考えてみましょう。

 

一郎と二郎は犯罪の共犯者です。二人は逮捕されてしまい、取り調べ室で検事にこんな交渉を投げかけられました。

「お前らが犯行をしたことは知っている。このまま黙秘を続けてもムショ入りは確実だ。しかし、今ここで自白すればお前の刑期は一年だけにしておいてやろう。その代わり、自白しなかった方は罰として10年間豚箱暮らしだぜ。」

2人は5年の求刑があったことを知っています。お互いが自白してしまえば5年間刑務所の中です。しかし、お互い黙秘しあえば証拠不十分で刑期が3年に減ることも知っています。さて、二人はどんな選択をするのでしょうか。ゲーム理論に即して考えなさい。

 

⑴ ()内の数字(利得のこと)の左右どちら側がどのプレイヤーの利得かを知る。

これは表と共に以下のように確実に与えられます。

ゲーム理論説明図
ゲーム理論図

今回だと、「一郎の選択が()内の左の数字、二郎の選択が()内の右の数字であるとする」といった感じになります。

 

(2) どちらの選択をするべきか、⑵で分かった利得どうしを突き合わせて判断。

まずは 、赤丸で囲まれた部分を順に見ていきましょう。相手の選択ごとに一郎の選択を検討してみましょう、ということですね。二郎が黙秘の時、左側の数字、つまり一郎の選択での利得は(今回は-ですので損失ですが)黙秘の時 -3 と自白の時 -1 ですね。この場合、損失の少ない-1の方が良い選択であるのは言うまでもありません。このことから一郎は自白を選ぶべきだと分かります。

つぎに上の表の赤丸で囲まれた数字を見ましょう。次は二郎が自白を選んだ時の一郎の選択を吟味しましょう。さっきと同じように、-10と-5なら当然-5の損失を選ぶはずですから一郎はやはり自白を選ぶべきですね。

 

(3) ⑵に戻って、もう片方のプレイヤーの選択を同じように見る。

今回の場合、一郎の黙秘の選択の場合、二郎の利得は黙秘の時-3、自白の時-1だから自白の方が良い選択。また、一郎の自白の選択の場合、二郎の利得は黙秘の時-10、自白の時-5だからやはり自白が良い選択。結局選ぶべき選択は自白に決まるのです。

ゲーム理論で大事なこと

ゲーム理論はその柔軟性と簡潔な構造から様々な分野からの応用もあり、このサイトで紹介するのはお豆のように小さな一部分ではありますが、一つだけ必ずどんなゲーム理論の話にも共通のことがあります。それは相手の戦略を所与とすることです。 

ふっふっふ。難しい言葉でしょう。つまり相手の戦略が最初から決まってるものとするってことなんですよ。さっきの表の見方でも、相手の戦略が黙秘だった場合、自白だった場合といった風に分けたと思います。なにもゲーム理論だけで大事なことでもないんですが、この自分以外の戦略を所与とするというのは誰でも日ごろからやっていることです。 

例えば、世の中の男どもはなかなかどうして、自分の好きになった女には特別な感情を抱き、「他の人にはこんなこと言わない」だの「彼女には彼氏はいないはずだ」だの勝手に妄想することはみなさん周知のところではないでしょうか。これこそ、自分以外のプレイヤーの戦略を勝手に決めている、つまり所与としていることに他ならないのです。まあしかし、「あのブスには彼氏はさすがにいないだろう」といって、どうしても彼女が欲しいような盛りの男たちがこぞってあるブスに告白をなげかけ、なぜか顔が良いわけでもない女がモテてしまうなんてのもゲーム理論で把握できるようなところではないでしょうか。この場合「喪男(もてない男)たちのジレンマ」とでも名付けましょうか。 

まあとにかく相手の戦略を所与とすることは、自分の戦略を決定するための必要条件だし、社会の構造をゲーム理論で的確に把握することも可能ですね。さっきのように(笑) 

まとめ

お気づきかもしれませんが、今回の例では相手が自白の選択をしたとしても、黙秘の選択をしたとしても、自白の方の利得が大きかったはずです。このように、相手の戦略と関係なしに決まる、一番良い戦略を支配戦略といいます。ちなみにこの相手に対して行う一番良い戦略を最適応答と言います。そして、今回の(2),(3)で行ったように、双方のプレイヤーが最適な選択を行った状態をナッシュ均衡と言います。最適応答同士がぶつかる点と言ってもいいかもしれません。今回ですと、一郎の自白と二郎の自白がぶつかる点が右下の利得(5,5)ですね。

そして最後に今回のようなケースのことを囚人のジレンマと呼びます。お互いが支配戦略をとった結果、(-3,-3)のようなもっと良い利得もあったのに、(-5,-5)といった二人とも悪い利得になってしまうというジレンマからそんな名前になっています。もっと抽象化していうと、社会全体の利得として最適な状態、パレート最適があるのに、個人の利得を求めるとパレート最適を実現できないジレンマ、ともいえることでしょう。

さて、まとめで用語を詰め込みすぎた感がありますね(笑)しかし実はもう少し知っておいた方がいいゲーム理論についての知識があります。ですので、次回はもう少し詳しくゲーム理論の知識を学んでいきましょう!!