スタートページWeb教材一覧オペレーションズリサーチゲームの理論

決定理論とゲームの理論

学習のポイント

好況・不況に対して積極案・消極案のどちらを選択するかという自然を相手にした意思決定の方法を(狭義の)決定理論といい,相手との競争環境における意思決定に関する理論をゲームの理論といいます。このシリーズでは,オペレーションズ・リサーチの基本的な考え方である意思決定とゲームの理論の初歩を学習します。

キーワード

意思決定,戦略,選択基準,利失表(ペイオフ・マトリクス),期待値,マクシマックス,ミニマックス,ゲームの理論,二人零和ゲーム,非零和ゲーム,囚人のジレンマ,デシジョン・ツリー


ここでの意思決定

意思決定とは,何らかの事態が生じたときに,どのような決定を下すかを理論的に考察することです。それには多様なアプローチがありますが,ここでは次のような分野を取り扱います。

事前に複数の案(それを戦略といいます)があり,それから特定の戦略を選択することを意思決定といいます。そして,各戦略についての情報と選択基準が与えられているときに,どう意思決定をするかを考えるのがここでのテーマです。いいかえれば「どのような考え方をしたら,どのように決定するのが数学的に妥当だろうか」という分野です。

現実の意思決定では,前提となる戦略の立案やその情報の把握が重要ですし,選択基準は場合により異なりますし,意思決定者の価値観が大きく影響します。さらに,現実は複雑ですから,抽象化して単純化した「数学的な」アプローチで事態が解決するとは思えません。ですから,ここで取り上げる内容を,そのまま現実問題に適用するには無理があります。

しかし,このような理論を理解していると,問題の本質を単純化して整理することに役立ちます。また,ここで扱う考え方は,オペレーションズ・リサーチ全体を通した基本的な考え方でもありますので,あえて取り上げた次第です。

目次

●相手が自然のとき

ペイオフ・マトリクス 景気
好況不況
私の戦略積極案10-3
消極案

景気の好不況という相手は,当社の戦略や意思決定に関係なく好況・不況の意思決定(?)をしています。当社が積極策・消極策を選択した後で好況・不況になったときの利益・損失は右の利失表(ペイオフ・マトリクス)になると予測できたとします。利益を最大にするには,どのような選択をすればよいでしょうか?

期待値(or-dm-kitaichi
好況となる確率が70%だとわかっていれば,期待値を最大にするように行動するでしょう。ここでは,期待値の考え方を理解します。
決定理論(or-dm-kettei
その確率がわからないときは,どのような決定をするでしょうか? これを狭義の決定理論といいますが,それにはマクシマックス,ミニマックス,リグレット・ミニマックスというようないろいろな考え方があります。

●相手が競争相手のとき

二人零和ゲーム(or-dm-zerowa
  Bの戦略
B1B2
Aの戦略A1-3
A2-2
相手が天候ではなく競争相手のときをゲームの理論といいます。特に,甲の利失表で甲が4を得たら乙は-4になるというように,一方の利益は他方の損失という場合を二人零和ゲームといいます。甲は利失表で利益を最大になるように,乙はそれを最小にする戦略をとると考えます。
非零和ゲーム(or-dm-nonzero
(A,B) Bの戦略
B1B2
Aの戦略 A1( 3, 1)(-1,-3)
A2(-2,-2)( 1, 2)
右図の利失表の左側は甲の利失で右側は乙の利失です。このように互いの利失が異なるゲームを非零和ゲームといいます。これには多くのバラエティがありますが,なかでも囚人のジレンマというモデルにおける協調や裏切りなどは,実社会での戦略を理解するのにも有効な考え方です。

多段階での意思決定

デシジョン・ツリー(or-dm-dtree
期待値の問題に戻ります。私は好況になる確率は70%程度だと思っているのですが,投資の意思決定をする前に市場調査をすうるかどうかの意思決定をしたいと思います。私はこの種の調査では,調査結果が好況としたときは90%,不況としたときは60%程度の信頼性があると思っています。市場調査にためにいくらの費用をかけてもよいでしょうか。
このような多段階の意思決定問題にはデシジョン・ツリーという手法が役に立ちます。

理解度チェック

過去問題: 「決定問題」