Web教材一覧OR決定理論

ゲームの理論の概要


ゲームの理論とは、ジャンケンやカケなど、相手と利害関係が異なるときに、どのような手(戦略)をとればよいかを検討する技法です。

鞍点がある場合-純粋戦略

鞍点あり Bの戦略最小値
B1B2B3
Aの戦略 A1-1-2-2
A2-1-1
A3
最大値  

右のペイオフ・マトリクスのケースを考えます。たまたまAがA3を選択すると,BはA3の行のうちの最小の1にさせようとしてB2を選択します。するとAはB2の列での最大の1を得るためにA3を選択します。結局はAはA3,BはB2を選択することで落ち着きます。(A3,B2)の値1は,AとBが適切な行動をしたとき,Aが少なくとも確保できる利益であるともいえます。その値のゲームの解といいます。

「少なくとも確保できる利益」とは,ミニマックス原理の概念でもあります。Aがミニマックス原理で行動すれば,各行の最小値のうち最大のものを選ぶので3を選択します。Bもミニマックス原理で行動すれば,ペイオフ・マトリックスの値の符号が逆転するのですから,各列の最大値のうち最小のものを選ぶのでB2を選択します。

(A3,B2)のような点を鞍点(あんてん)といいます。鞍点は「その行の最小値であり,かつ,列の最大値である点」です。そのような点があるとき,「鞍点を持つ」といいます(鞍点という名称は馬具の鞍の形が横からみれば凹型の曲線,前から見れば凸型の曲線ですが,凹型曲線の最小値であり凸型曲線の最大値である点があることからつけられたものです)。また,鞍点が存在するときには,両者が唯一の戦略を選択しますが,それを純粋戦略といいます。

以上のことを整理すると,「行の最小値であり,かつ,列の最大値である点が存在するとき,その点を鞍点という。両者はその鞍点を持つ戦略を選択するが,それを純粋戦略という。ゲームの値は鞍点の値になる。」といえます。

鞍点がない場合-混合戦略

鞍点なし Bの戦略最小値
B1B2
Aの戦略 A1-3-3
A2-2-2
最大値 

右のペイオフ・マトリクスでは鞍点がありませんので,純粋戦略にはなりません。
 AがA1を選択する確率をp,BがB1を選択する確率をqとすると,
   (A1,B1)での期待値:  1pq
   (A1,B2)での期待値: -3p(1-q)
   (A1,B1)での期待値: -2(1-p)q
   (A1,B1)での期待値:  4(1-p)(1-q)
ですから,全体でのゲームの値Vは,
   V=1pq-3p(1-q)-2(1-p)q+4(1-p)(1-q)
    =10pq-7p-6q+4
    =10(p-0.6)(q-0.7)-0.2
となります。

ここで,もしAがp=0.8(>0.6)の戦略をとれば,BはVを小さくしたいのですからq=0とするでしょう。またAがp=0.4(<0.6)の戦略をとればBはq=1とするでしょう。そのようなことをさせないために,Aがp=0.6とすれば,Bがqをどのような値にしても,-0.2の値を確保することができます。
 逆にBとしては,q-0.7>0とすればAはp=1,q-0.7<0とすればAはp=0にするので,Vは-0.2よりも大になってしまいます。それを防ぐためには,q=0.6とすればよいことになります。

結論として,AはA1を0.6,A2を0.4の確率で選択し,BはB1を0.7,B2を0.3の確率で選択することにより,ゲームの値を-0.2にすることができます。このように,戦略が確率になる場合を混合戦略といいます。

2人零和ゲームは線形計画法(LP:リニア・プログラミング)により解くことができますが,ここでは説明を省略します。

●発展→「ゲームの理論」 (or-dm-zerowa)