Web教材一覧オペレーションズ・リサーチ決定理論とゲームの理論

決定理論とゲームの理論の種類

学習のポイント

例えば,次のような表(利失表,ペイオフマトリクスという)が与えられているとき,積極案/消極案のいづれを選択するべきかというような問題です。

             相手の戦略
             好況 不況
    私の  積極案  10 -3 
    戦略  消極案   5  2 

●発展→「決定理論とゲームの理論」 (or-dm-intro)

キーワード

期待値、決定理論、ゲームの理論、デシジョンツリー


以下の数値は、次の利失表(ペイオフマトリクスという)が与えられているとしています。
             相手の戦略
             好況 不況
    私の  積極案  10 -3
    戦略  消極案   5  2

期待値
・相手は自然(私に好意も敵意も持たない)
・相手の戦略は確率既知(例:好況=0.6,不況=0.4)
のとき。期待値が大きいほうを選択する。
   積極案を選択すれば,10×0.6-3×0.4=4.8 選択
   消極案を選択すれば, 5×0.6+2×0.4=3.8
→参照:「期待値」
決定理論
・相手は自然
・確率未知
の場合です。
・ラプラスの原理(晴・雨の確率は同じと仮定)
・マクシマックス原理(楽天家の原理:自然は自分に好意を持つと仮定)
・ミニマックス原理(悲観家の原理:自然は自分に悪意を持つの仮定)
などがあります。
→参照:「決定理論」
ゲームの理論
・競争相手(相手は私の利失を最小にしようとする)
・確率未知(相手の出方はわからない)
の場合にどの戦略を選択するかという技法を,ゲームの理論といいます。
その基本形は,関係者が2人で一方の得は他方の損の関係のときで,2人零和ゲームといいます。利得表の値により,鞍点がある場合とない場合にわかれ,最適戦略は次のようになります。
・鞍点あり→純粋戦略:積極案/消極案の一方に決まる
・鞍点なし→混合戦略:例えば,積極案:消極案=0.7:0.3のような確率になる
→参照:「2人零和ゲーム」
デシジョンツリー
多段階意思決定問題です。例えば,期間を前半・後半にわけて,前半から大規模投資をするか,前半は小規模投資をして,後半で追加投資をするかしないか検討するというような問題に利用されます。
→参照:「デシジョンツリー」