スタートページ> Web教材一覧> オペレーションズリサーチ> ゲームの理論と期待値
景気や天候などのように,こちらの意思決定には関係なく状況が決まり,その状況が発生する確率がわかっているときには,期待値が最大にある案を選択するのが合理的だと考えられます。その考え方を理解します。
決定理論,戦略,利失表(ペイオフ・マトリクス),確率既知,期待値,効用
次のペイオフ・マトリクスが与えられているとします。
確率→ | 景気 | ||
---|---|---|---|
好況 | 不況 | ||
0.6 | 0.4 | ||
私の戦略 | 積極案 | 10 | -3 |
消極案 | 5 | 2 |
もし,好況になることがわかっているのであれば,積極案を選択すれば10の利益があるのに,消極案だと5の利益にしかならないのですから,積極案を選択すればよいのですが,将来は不確実なので,このような問題が存在するのです。
なんらかの理由により,私は好況になる確率が60%で不況になる確率が40%であると知っている(あるいは思っている)としたら(これを確率既知のときといいます),
積極案を選択すれば,10×0.6-3×0.4=4.8
消極案を選択すれば, 5×0.6+2×0.4=3.8
となりますので,積極案のほうが有利であると判断するでしょう。
ここでの4.8や3.8のことを期待値といいます。すなわち,確率既知の場合には期待値が最大の戦略を選択することになります。
景気 | 期待値 | 評価 | 好況 | 不況 | 0.6 | 0.4 |
---|---|---|---|---|---|
私の戦略 | 積極案 | 10 | -3 | 4.8 | ←最大 |
消極案 | 5 | 2 | 3.8 |
戦略は2つに限定する必要はありませんし,双方の戦略の個数が同じである必要もありません。私の戦略に「中間案」を加えたり,景気に「超好況」や「超不況」などを加えてもこの考え方を用いることができます。さらにはこのような離散的な行列の形式ではなく連続的な数式で与えることもできますが,これは数学的に高度になるので割愛します。
でも期待値最大の考え方でよいのでしょうか? このようなケースが数多く起こるのであれば,平均すればこのようにするのがよいといえますが,1回しか行わないとすれば,偶然により確率の低いことが発生することもありますので,これが「唯一の」「正しい」決定方法であり,これに従って決定「するべき」だとはいえません。しかし,これだけの条件で決定するとすれば,これ以外に合理的な説明のできる方法を示すのは困難でしょう。それでこの方法を「一般的な」方法として受け入れることになります。決定理論とはこのような性格のものなのです。
期待値最大の考え方には,次のような応用ができます。ここで好況になる確率をα(不況の確率は1-α)として,双方の期待値を計算してみますと,
積極案:10α-3(1-α)=13α-3
消極案: 5α+2(1-α)= 3α+2
となります。ここで,13α-3=3α+2とすれば,α=0.5となりますので,「好況の確率が50%以上だと思うならば積極案のほうが有利になる」といえます。このようなことを知れば,意思決定をしやすくなるとも考えられますね。
ここでのペイオフ・マトリクスを10億円とか-3億円という貨幣価値としましたが,経営者としては10億円でも5億円でも利益がある程度あれば満足するので,10億円は5億円の2倍の価値があるとは思わないかもしれません。逆に,3億円の損失になったら倒産の危険があるとして,-10程度に捉えることも考えられます。
また金額の大きさにも関係します。ジャンケンをして勝ったら100円貰え負けたら20円払えというゲームでしたら,多くの人が参加するでしょう。1万円と2千円でも参加する人もいるでしょうが,100万円と20万円では参加者はかなり少なくなるでしょう。
すなわち,貨幣金額の持つ価値は人により異なるのです。当事者による価値を効用といいます。ペイオフ・マトリクスを貨幣金額で表示するよりも効用に換算した値のほうが適切だともいえます。また,効用でそれを与えたにせよ,効用に上の期待値の計算のような単純計算が成り立つかどうかも問題です。この効用の計算についての理論もあるのですが,ここで取り扱うにはあまりにも複雑すぎますので省略します。
天候 | 晴 | 雨 | 0.8 | 0.2 |
---|---|---|---|
傘を | 持つ | 1 | -1 |
持たない | 2 | -3 |
次の表から期待値の高い「傘を持たない」ほうが有利です。
天候 | 期待値 | 評価 | 晴 | 雨 | 0.8 | 0.2 |
---|---|---|---|---|---|
傘を | 持つ | 1 | -1 | 1×0.8-1×0.2=0.6 | |
持たない | 2 | -3 | 2×0.8-3×0.2=1.0 | ←最大 |
雨になる確率をαとすれば,
傘を持つときの期待値:1(1-α)-1α
持たないときの期待値:2(1-α)-3α
これが等しいときはα=0.375。すなわち37.5%以上のときです。
過去問題: 「決定問題」