「この商品はどれだけ売れるだろうか」とか「株価は上昇するだろうか、下落するだろうか」など、将来のことは不確定要素があるため、高い精度で確実な予測をすることは困難ですが、それを追求することはビジネスに不可欠です。
予測をするには、商品など対象の特性を考慮すること、市場調査を行うこと、長年の経験を生かすことなど、総合的なアプローチが必要ですが、ここでは統計的手法による時系列予測を取り扱います。
時系列予測の手法を一般化すれば、次の公式で表現できます。
y=ft(yt)+ft-1(yt-1)+・・・+f2(y2)+f1(y1)
ここで、yはt+1期の予測値、yiはi期での実績値です。例えば、
y=y32+6/y2-2y3+3
のような数式で表され、y3=4、y2=3、y3=5ならば、
y=16+2-10+3=11
となります。
このように、時系列手法とは、他の要因をすべて無視して、過去のデータだけを用いて統計的(数学的)処理を行なうのですから、信頼のある予測をするには限界があります。これだけで予測するのではなく、多様な手段のうちの一つとして用いるべきです。
予測の目的は、単に「あたるかどうか」だけではありません。従来とは質的に異なる要因が発生したかどうかを認識することも重要な目的です。統計的手法により過去のデータの延長で予測した値と、実現した値が大きく異なる場合、従来の数式が通用しないことから、何らかの質的変化が生じていることを発見することができます。
よい予測方法とは、次の事項を満たすものだといわれています(曹徳弼「需要,予測,統計手法」より)
需要の不規則な変動を滑らかにする
需要の傾向変化に敏感である
予測誤差のばらつきが小さい
予測方法が簡単である
予測方法のメカニズムが明確である
予測誤差の範囲が明確である
自己回帰とは、例えば過去の売上実績だけを用いて来期の売上を予測するというように、予測するもの自身の過去の実績データだけで予測値を計算することです。。
また、通常のビジネスでは、上のような複雑な式にすることは少なく、次のような一次式を用いるのが一般的です。
y=atyt+at-1yt-1+・・・+a2y2+a1y1+a0
すなわち、過去の実績値yiにaiの重みづけをして予測するのです。さらに通常では、
a0=0
at+at-1+・・・+a2+a1=1
とします。
時系列予測手法は数多くありますが、このような数式において、係数aiをどのように決定すればよいかを求めるものだといえます。
指数平滑法は自己回帰モデルでの係数aiを求める方法の一つです。すべての過去データを用いるが、近い過去の重みを高く、遠い過去の重みを小さくしたものです。
指数平滑法のうち、最も単純なのが一次の指数平滑法です。次のようにして予測します。
t+1期の予測値=a×t期の実績値+ (1-a)×t期の予測値 ・・・A
=t期の予測値+a×(t期の実績値-t期の予測値)
ここで,aは平滑化定数であり,
a=1とすれば:t+1期の予測値=t期の実績値
a=0とすれば:t+1期の予測値=t期の予測値
となります。
直前の実績値と予測値を知っているだけで簡単に予測できる特徴があります。
なぜ「指数」というのかというと、A式を展開すると、
t+1期の予測値(y)
=a(1-a)yt+a(1-a)2yt-1+・・・+a(1-a)ty1
となり、係数が指数になるからです。
すなわち、指数平滑法では、すべての過去データを用い、最近のデータの重みを大にした移動平均法なのです。
詳細:「指数平滑法」
最も単純な予測手法は移動平均法です。
もし、需要に変化がないとするならば、t+1期の予測値はt期の実績値と同じなのですから、
yt+1=yt
となります(これでは予測する必要もないでしょうが)。
「最近の数期の平均を予測値とする」ことがよく行われます。例えば3期の平均とするならば、
yt+1=0.333yt+0.333yt-1+0.333yt-2
となり、5期の平均とするならば、
yt+1=0.2yt+0.2yt-1+0.2yt-2+0.2yt-3+0.2yt-4
となります。
このように、移動平均法では、最近の数期間のデータだけを用い、しかもその係数が同じであるのが特徴です。需要がほぼ横ばいのときならよいのですが、増加や減少の傾向がある場合は、それに追いつけない欠点があります。
ARとMAを組み合わせた手法です。詳しい数学的説明は割愛します。イメージ的には
yt+1 = p*ARの式 + q*MAの式
となり、p=0としたときMA、q=0としたときARになります。
なお、ARMAは予測値が発散しないことを前提とした定常な時系列過程を対象にしており、傾向変動が顕著なときにはARIMA(Auto Regressive Integrated Moving Average)モデルを適用します。
この方法は自己回帰ではありません。毎年の実績データがある式で決定され、その式は予測年度での成立するという仮定で予測します。
過去のi年度の実績値yiは、その年度の変数xiにより決まり、その式は、毎年度同じで
y = a*x + b (a, bは定数)
になるとします。このa, bを決定することが目的です。
過去の実績に適用すると、この式と完全に一致することはないので、誤差εが生じます。
yi = a*xi + b + εi
変形して、
εi = a*xi + b - yi
ここで、xiを年度(1、2、・・・、n)だとすると、
ε1 = 1a+b-y1
ε2 = 2a+b-y2
:
εn = na+b-yn
となります。誤差の平方和
ε12+ε22+・・・+εn2
を最小にするようにaとbを計算で求めます。その手法が最小二乗法です。→詳細:「最小二乗法」
そして,n+1年目の予測値yn+1は,
yn+1 =(n+1)a+b
として求められます。
このように変数xiを年度だとすると、最小二乗法は移動平均法の発展形式(毎年の係数が異なる)の一つになります。計算は省略しますが、例えばn=5のとき
y=0.8yt+0.5yt-1+0.2yt-3-0.1yt-4-0.4yt-5
になります。最近と最初の係数が大きく、負の係数があることが特徴です。
なお、変数iを測定可能な要因(例えばGDPなど)に置き換えることもできます。予測するには予測期のGDPが既知である(売上高よりも信頼性の高い予測値がある)必要があります。
新製品が発表されてから一般に普及し陳腐化するまでの需要は、ゴンペルツ曲線やロジスティック曲線などの成長曲線に従うといわれています。この曲線へのあてはめは、数学的に高度ですので省略します。
詳細:「成長曲線」
夏・冬で需要が異なるとか、12月に需要が大になるなど、需要が月により大きく変化することがよくあります。さらに長期的な長期の時系列データの分析では、景気変動などにより変化します。
それで、各期間のデータを、
Y=T+C+S+I(加法型) Y=T・C・S・I(乗法型)
からなっているものとして、それぞれの要素に分解することが行われます。
T:長期変動
C:循環変動
S:季節変動
I:不規則変動
この代表的な手法に米センサス局によるX-11やX-12-ARIMAがあります。非常に複雑な(緻密な)計算が行われています(省略)。
単に季節変動だけを考慮する場合は、次の手順により予測します。
1 毎年の月間平均実績値=年間実績合計値/12を計算する。
2 n年間の毎月実績値の平均値を計算する。
3 1と2の比である季節指数を計算する。
4 1から最小二乗法などにより,来年の月間平均実績値を計算する。
5 4の予測値に3の季節指数を乗じて,来年の月別予測値を計算する。
上述の統計的手法は一つの系列データでの予測でした。ところが「地球温暖化の将来予測」などでは、人口の増加、省エネの動向、自然エネルギー技術など多様な要素が複雑に影響しています。
個々の要素について、ある時点tと次の時点t+⊿tでの値の変化を、時点tでの他の要素の値で表す定式化を行います(モデル化)。このモデルは微分の数式群になるので、コンピュータ処理により、将来の予測ができます。
しかも、定式や値をいろいろ変化させることにより、「クリーンシティにより省エネルギーが加速されたら」とか「原発廃止の政策が行われTら」などの影響を、机上実験的に調べることができます。
社会や技術の分野では、多様な未知の要因が複雑に関連するので、過去のデータを数学的な処理をして予測するのは困難です。それでも予測しないと現在の対応ができません。