Web教材一覧オペレーションズ・リサーチ予測

予測手法の概要


「この商品はどれだけ売れるだろうか」とか「株価は上昇するだろうか、下落するだろうか」など、将来のことは不確定要素があるため、高い精度で確実な予測をすることは困難ですが、それを追求することはビジネスに不可欠です。

予測をするには、商品など対象の特性を考慮すること、市場調査を行うこと、長年の経験を生かすことなど、総合的なアプローチが必要ですが、ここでは統計的手法による時系列予測を取り扱います。

時系列予測

時系列予測の手法を一般化すれば、次の公式で表現できます。
   y=ft(yt)+ft-1(yt-1)+・・・+f2(y2)+f1(y1)
ここで、yはt+1期の予測値、yiはi期での実績値です。例えば、
   y=y32+6/y2-2y3+3
のような数式で表され、y3=4、y2=3、y3=5ならば、
   y=16+2-10+3=11
となります。

このように、時系列手法とは、他の要因をすべて無視して、過去のデータだけを用いて統計的(数学的)処理を行なうのですから、信頼のある予測をするには限界があります。これだけで予測するのではなく、多様な手段のうちの一つとして用いるべきです。

予測の目的は、単に「あたるかどうか」だけではありません。従来とは質的に異なる要因が発生したかどうかを認識することも重要な目的です。統計的手法により過去のデータの延長で予測した値と、実現した値が大きく異なる場合、従来の数式が通用しないことから、何らかの質的変化が生じていることを発見することができます。

よい予測方法とは、次の事項を満たすものだといわれています(曹徳弼「需要,予測,統計手法」より)
   需要の不規則な変動を滑らかにする
   需要の傾向変化に敏感である
   予測誤差のばらつきが小さい
   予測方法が簡単である
   予測方法のメカニズムが明確である
   予測誤差の範囲が明確である

自己回帰モデル(AR:Autoregressive)

自己回帰とは、例えば過去の売上実績だけを用いて来期の売上を予測するというように、予測するもの自身の過去の実績データだけで予測値を計算することです。。
 また、通常のビジネスでは、上のような複雑な式にすることは少なく、次のような一次式を用いるのが一般的です。
   y=att+at-1t-1+・・・+a22+a11+a0
すなわち、過去の実績値yiにaiの重みづけをして予測するのです。さらに通常では、
   a0=0
   at+at-1+・・・+a2+a1=1
とします。
 時系列予測手法は数多くありますが、このような数式において、係数aiをどのように決定すればよいかを求めるものだといえます。

指数平滑法(Exponential smoothing)

指数平滑法は自己回帰モデルでの係数aiを求める方法の一つです。すべての過去データを用いるが、近い過去の重みを高く、遠い過去の重みを小さくしたものです。
 指数平滑法のうち、最も単純なのが一次の指数平滑法です。次のようにして予測します。
   t+1期の予測値=a×t期の実績値+ (1-a)×t期の予測値   ・・・A
          =t期の予測値+a×(t期の実績値-t期の予測値)
ここで,aは平滑化定数であり,
   a=1とすれば:t+1期の予測値=t期の実績値
   a=0とすれば:t+1期の予測値=t期の予測値
となります。
直前の実績値と予測値を知っているだけで簡単に予測できる特徴があります。

なぜ「指数」というのかというと、A式を展開すると、
   t+1期の予測値(y)      =a(1-a)yt+a(1-a)2t-1+・・・+a(1-a)t1
となり、係数が指数になるからです。
 すなわち、指数平滑法では、すべての過去データを用い、最近のデータの重みを大にした移動平均法なのです。

詳細:「指数平滑法」

移動平均法(MA:Moving Average)

最も単純な予測手法は移動平均法です。
 もし、需要に変化がないとするならば、t+1期の予測値はt期の実績値と同じなのですから、
    yt+1=yt
となります(これでは予測する必要もないでしょうが)。
 「最近の数期の平均を予測値とする」ことがよく行われます。例えば3期の平均とするならば、
    yt+1=0.333yt+0.333yt-1+0.333yt-2
となり、5期の平均とするならば、
    yt+1=0.2yt+0.2yt-1+0.2yt-2+0.2yt-3+0.2yt-4
となります。
 このように、移動平均法では、最近の数期間のデータだけを用い、しかもその係数が同じであるのが特徴です。需要がほぼ横ばいのときならよいのですが、増加や減少の傾向がある場合は、それに追いつけない欠点があります。

自己回帰移動平均モデル(ARMA:Autoregressive moving average model)

ARとMAを組み合わせた手法です。詳しい数学的説明は割愛します。イメージ的には
    yt+1 = p*ARの式 + q*MAの式
となり、p=0としたときMA、q=0としたときARになります。

なお、ARMAは予測値が発散しないことを前提とした定常な時系列過程を対象にしており、傾向変動が顕著なときにはARIMA(Auto Regressive Integrated Moving Average)モデルを適用します。

最小二乗法による予測

この方法は自己回帰ではありません。毎年の実績データがある式で決定され、その式は予測年度での成立するという仮定で予測します。

過去のi年度の実績値yiは、その年度の変数xiにより決まり、その式は、毎年度同じで
   y = a*x + b  (a, bは定数)
になるとします。このa, bを決定することが目的です。

過去の実績に適用すると、この式と完全に一致することはないので、誤差εが生じます。
   yi = a*xi + b + εi
 変形して、
   εi = a*xi + b - yi
 ここで、xiを年度(1、2、・・・、n)だとすると、
   ε = 1a+b-y
   ε = 2a+b-y
     :
   ε = na+b-y
となります。誤差の平方和
   ε+ε+・・・+ε
を最小にするようにaとbを計算で求めます。その手法が最小二乗法です。→詳細:「最小二乗法」
そして,n+1年目の予測値yn+1は,
   yn+1 =(n+1)a+b
として求められます。

このように変数xiを年度だとすると、最小二乗法は移動平均法の発展形式(毎年の係数が異なる)の一つになります。計算は省略しますが、例えばn=5のとき
   y=0.8yt+0.5yt-1+0.2yt-3-0.1yt-4-0.4yt-5
になります。最近と最初の係数が大きく、負の係数があることが特徴です。

なお、変数iを測定可能な要因(例えばGDPなど)に置き換えることもできます。予測するには予測期のGDPが既知である(売上高よりも信頼性の高い予測値がある)必要があります。

成長曲線

新製品が発表されてから一般に普及し陳腐化するまでの需要は、ゴンペルツ曲線やロジスティック曲線などの成長曲線に従うといわれています。この曲線へのあてはめは、数学的に高度ですので省略します。

詳細:「成長曲線」

季節調整法

夏・冬で需要が異なるとか、12月に需要が大になるなど、需要が月により大きく変化することがよくあります。さらに長期的な長期の時系列データの分析では、景気変動などにより変化します。
 それで、各期間のデータを、
   Y=T+C+S+I(加法型)  Y=T・C・S・I(乗法型)
からなっているものとして、それぞれの要素に分解することが行われます。
   T:長期変動
   C:循環変動
   S:季節変動
   I:不規則変動

この代表的な手法に米センサス局によるX-11やX-12-ARIMAがあります。非常に複雑な(緻密な)計算が行われています(省略)。

単に季節変動だけを考慮する場合は、次の手順により予測します。
  1 毎年の月間平均実績値=年間実績合計値/12を計算する。
  2 n年間の毎月実績値の平均値を計算する。
  3 1と2の比である季節指数を計算する。
  4 1から最小二乗法などにより,来年の月間平均実績値を計算する。
  5 4の予測値に3の季節指数を乗じて,来年の月別予測値を計算する。

複雑系の予測

シミュレーションモデル

上述の統計的手法は一つの系列データでの予測でした。ところが「地球温暖化の将来予測」などでは、人口の増加、省エネの動向、自然エネルギー技術など多様な要素が複雑に影響しています。
 個々の要素について、ある時点tと次の時点t+⊿tでの値の変化を、時点tでの他の要素の値で表す定式化を行います(モデル化)。このモデルは微分の数式群になるので、コンピュータ処理により、将来の予測ができます。
 しかも、定式や値をいろいろ変化させることにより、「クリーンシティにより省エネルギーが加速されたら」とか「原発廃止の政策が行われTら」などの影響を、机上実験的に調べることができます。

数学的手法以外の予測方法

社会や技術の分野では、多様な未知の要因が複雑に関連するので、過去のデータを数学的な処理をして予測するのは困難です。それでも予測しないと現在の対応ができません。

デルファイ法
デルファイとはギリシャ神話での「神のお告げ」の意味です。専門家へのアンケート調査により予測する方法です。例えば「通信速度がテラビット/秒になるのは何年後か」という予測を行うとします。
 ・予測対象に従って,多数の専門家を回答者として選定します。
 ・「5年後」「10年後」「実現しない」などが、その理由もつけて回答されます。
 ・回答結果から、平均値や偏差などを求め、それぞれの理由を集約したものをフィードバックして、再度同じ質問をします。
 ・回答者は、それを分析して、回答を変えるでしょう。これを繰り返すことにより、ある範囲に収束するでしょう。
シナリオライティング法
複雑な分野での未来予測の一手法です。ある仮説を立てて、それに従い将来起こるだろう情景を、時間とと分野に区分して予測します。複数の仮説に基づく代替案を作成することもあります。定性的ではあるが相互に矛盾のない論理的な予測をするのに適しています。
クロスセクション法
時系列分析とは逆に、ある時点(5年後、10年後のような定期的な設定ではなく、環境が変化する時点のほうがよい)での予測値を、それに影響する他の分野の項目の予測値から求める方法です。
 他の分野の項目のほうが予測しやすいときに有効ですが、実際には影響項目の数値から予測数値を求める数式そのものが変化すると考えらます。その変化を予測するには、シナリオライティング法などの非数学的方法の援用が必要です。