「この商品はどれだけ売れるだろうか」とか「株価は上昇するだろうか、下落するだろうか」など、将来のことは不確定要素があるため、高い精度で確実な予測をすることは困難ですが、それを追求することはビジネスに不可欠です。
予測をするには、商品など対象の特性を考慮すること、市場調査を行うこと、長年の経験を生かすことなど、総合的なアプローチが必要ですが、ここでは統計的手法による時系列予測を取り扱います。
需要予測の手法の分類 過去データからの時系列予測 他の要因との関係による予測 専門家や担当者の知識・経験に基づく予測 市場調査等による予測時系列予測の手法を一般化すれば、次の公式で表現できます。
y=ft(yt)+ft-1(yt-1)+・・・+f2(y2)+f1(y1)
ここで、yはt+1期の予測値、yiはi期での実績値です。例えば、
y=y32+6/y2-2y3+3
のような数式で表され、y3=4、y2=3、y3=5ならば、
y=16+2-10+3=11
となります。
このように、時系列手法とは、他の要因をすべて無視して、過去のデータだけを用いて統計的(数学的)処理を行なうのですから、信頼のある予測をするには限界があります。これだけで予測するのではなく、多様な手段のうちの一つとして用いるべきです。
予測の目的は、単に「あたるかどうか」だけではありません。従来とは質的に異なる要因が発生したかどうかを認識することも重要な目的です。統計的手法により過去のデータの延長で予測した値と、実現した値が大きく異なる場合、従来の数式が通用しないことから、何らかの質的変化が生じていることを発見することができます。
よい予測方法とは、次の事項を満たすものだといわれています(曹徳弼「需要,予測,統計手法」より)
需要の不規則な変動を滑らかにする
需要の傾向変化に敏感である
予測誤差のばらつきが小さい
予測方法が簡単である
予測方法のメカニズムが明確である
予測誤差の範囲が明確である
自己回帰とは、例えば過去の売上実績だけを用いて来期の売上を予測するというように、予測するもの自身の過去の実績データだけで予測値を計算することです。。
また、通常のビジネスでは、上のような複雑な式にすることは少なく、次のような一次式を用いるのが一般的です。
y=atyt+at-1yt-1+・・・+a2y2+a1y1+a0
すなわち、過去の実績値yiにaiの重みづけをして予測するのです。さらに通常では、
a0=0
at+at-1+・・・+a2+a1=1
とします。
時系列予測手法は数多くありますが、このような数式において、係数aiをどのように決定すればよいかを求めるものだといえます。
指数平滑法は自己回帰モデルでの係数aiを求める方法の一つです。すべての過去データを用いるが、近い過去の重みを高く、遠い過去の重みを小さくしたものです。
指数平滑法のうち、最も単純なのが一次の指数平滑法です。次のようにして予測します。
t+1期の予測値=a×t期の実績値+ (1-a)×t期の予測値 ・・・A
=t期の予測値+a×(t期の実績値-t期の予測値)
ここで,aは平滑化定数であり,
a=1とすれば:t+1期の予測値=t期の実績値
a=0とすれば:t+1期の予測値=t期の予測値
となります。
直前の実績値と予測値を知っているだけで簡単に予測できる特徴があります。
なぜ「指数」というのかというと、A式を展開すると、
t+1期の予測値(y)
=a(1-a)yt+a(1-a)2yt-1+・・・+a(1-a)ty1
となり、係数が指数になるからです。
すなわち、指数平滑法では、すべての過去データを用い、最近のデータの重みを大にした移動平均法なのです。
詳細:「指数平滑法」
最も単純な予測手法は移動平均法です。
もし、需要に変化がないとするならば、t+1期の予測値はt期の実績値と同じなのですから、
yt+1=yt
となります(これでは予測する必要もないでしょうが)。
「最近の数期の平均を予測値とする」ことがよく行われます。例えば3期の平均とするならば、
yt+1=0.333yt+0.333yt-1+0.333yt-2
となり、5期の平均とするならば、
yt+1=0.2yt+0.2yt-1+0.2yt-2+0.2yt-3+0.2yt-4
となります。
このように、移動平均法では、最近の数期間のデータだけを用い、しかもその係数が同じであるのが特徴です。需要がほぼ横ばいのときならよいのですが、増加や減少の傾向がある場合は、それに追いつけない欠点があります。
ARとMAを組み合わせた手法です。詳しい数学的説明は割愛します。イメージ的には
yt+1 = p*ARの式 + q*MAの式
となり、p=0としたときMA、q=0としたときARになります。
なお、ARMAは予測値が発散しないことを前提とした定常な時系列過程を対象にしており、傾向変動が顕著なときにはARIMA(Auto Regressive Integrated Moving Average)モデルを適用します。
この方法は自己回帰ではありません。毎年の実績データがある式で決定され、その式は予測年度での成立するという仮定で予測します。
過去のi年度の実績値yiは、その年度の変数xiにより決まり、その式は、毎年度同じで
y = a*x + b (a, bは定数)
になるとします。このa, bを決定することが目的です。
過去の実績に適用すると、この式と完全に一致することはないので、誤差εが生じます。
yi = a*xi + b + εi
変形して、
εi = a*xi + b - yi
ここで、xiを年度(1、2、・・・、n)だとすると、
ε1 = 1a+b-y1
ε2 = 2a+b-y2
:
εn = na+b-yn
となります。誤差の平方和
ε12+ε22+・・・+εn2
を最小にするようにaとbを計算で求めます。その手法が最小二乗法です。→詳細:「最小二乗法」
そして,n+1年目の予測値yn+1は,
yn+1 =(n+1)a+b
として求められます。
このように変数xiを年度だとすると、最小二乗法は移動平均法の発展形式(毎年の係数が異なる)の一つになります。計算は省略しますが、例えばn=5のとき
y=0.8yt+0.5yt-1+0.2yt-3-0.1yt-4-0.4yt-5
になります。最近と最初の係数が大きく、負の係数があることが特徴です。
なお、変数iを測定可能な要因(例えばGDPなど)に置き換えることもできます。予測するには予測期のGDPが既知である(売上高よりも信頼性の高い予測値がある)必要があります。
夏・冬で需要が異なるとか、12月に需要が大になるなど、需要が月により大きく変化することがよくあります。さらに長期的な長期の時系列データの分析では、景気変動などにより変化します。
それで、各期間のデータを、
Y=T+C+S+I(加法型) Y=T・C・S・I(乗法型)
からなっているものとして、それぞれの要素に分解することが行われます。
T:長期変動
C:循環変動
S:季節変動
I:不規則変動
この代表的な手法に米センサス局によるX-11やX-12-ARIMAがあります。非常に複雑な(緻密な)計算が行われています(省略)。
単に季節変動だけを考慮する場合は、次の手順により予測します。
1 毎年の月間平均実績値=年間実績合計値/12を計算する。
2 n年間の毎月実績値の平均値を計算する。
3 1と2の比である季節指数を計算する。
4 1から最小二乗法などにより,来年の月間平均実績値を計算する。
5 4の予測値に3の季節指数を乗じて,来年の月別予測値を計算する。
新製品が発表されてから一般に普及し陳腐化するまでの需要は、ゴンペルツ曲線やロジスティック曲線などの成長曲線に従うといわれています。この曲線へのあてはめは、数学的に高度ですので省略します。
詳細:「成長曲線」
例えば、アイスクリームの需要予測では、単なる時系列予測よりも「天候が高温になるとアイスクリームがよく売れる」というように、他の測定可能な要因を用いて予測するほうが適切なことがあります。それを回帰分析といいます。
説明変数が複数の場合です。例えば、アイスクリームの需要は、温度と晴雨の2つで説明できるとの仮定を設ける場合に使われます。
複雑なので、ここでは省略します。
→参考:重相関と重回帰
検定や回帰などの手法は、被説明変数と説明変数の間の「相関」はわかるが、「因果関係」はわかりません。例えば、新薬の効果を測定するには、
処置群 本当の薬を与えたグループ
対象群 偽薬(プラシーボ)を与えたグループ
に分けて、投与前と投与後の症状改善割合を調べます。
改善割合
.
投与前 投与後 増加分
処置群 15% 30% 15% ─┐
対象群 10% 20% 10% ─┸5%(差分の差分)
どちらも投与後に改善割合が高くなっていますが、それは他の要因(天候や担当医師の交代など?)原因だったのかもしれません。薬の効果は5%だともいえます、
因果推論には、もっと高度な分析手法を用いて、二つの群を均質化して比較する「傾向スコア」などの方法があります。
社会や技術の分野では、多様な未知の要因が複雑に関連するので、過去のデータを数学的な処理をして予測するのは困難です。それでも予測しないと現在の対応ができません。
正確に算出することが極めて難しい数量に対して、把握している情報と論理的な思考プロセスによって概数を求める手法。すなわち、「わからない数値」を「わかっている数値」を組み合わせて推定する手法です。企業の戦略立案やマーケティングなど広く使用されます。
例えば、PCの回収ビジネスを検討するにあたり「日本国内に使われず死蔵しているPCの数」を知りたいとします。これを直接に調査するのはかなり困難です。
これに関連する資料として、
・過去のPC国内販売台数
・OSやCPUなどが大きく変化した時期
・新OSが旧OSに代わる割合(多くの団体の調査結果公表がある)
・自治体委託の回収業者の回収台数
などは比較的入手しやすいでしょう。
PC死蔵数とこれらのデータとの関係を、理論的あるいは経験的に定式化することにより、大まかな数値を推定することができます。
コンビニで明日の「おにぎり」の需要を予測するには、
コンビニの立地、客層
明日の天候
地域のイベント(運動会など)
など多くの(場合によっては百のオーダー?)があるでしょう。
過去の販売実績から、各種要因と需要量のデータをデータウェアハウスなどに整理しておき、OLAPツールなどにより、分析することができます。
近年では、AIが実用化されています。膨大なデータからAI自身が予測方法を見出して予測することができるようになりました。要因データの多くは、自社で用意しなくても、AIがクラウド環境から取得できます、
上述の統計的手法は一つの系列データでの予測でした。ところが「地球温暖化の将来予測」などでは、人口の増加、省エネの動向、自然エネルギー技術など多様な要素が複雑に影響しています。
個々の要素について、ある時点tと次の時点t+⊿tでの値の変化を、時点tでの他の要素の値で表す定式化を行います(モデル化)。このモデルは微分の数式群になるので、コンピュータ処理により、将来の予測ができます。
しかも、定式や値をいろいろ変化させることにより、「クリーンシティにより省エネルギーが加速されたら」とか「原発廃止の政策が行われTら」などの影響を、机上実験的に調べることができます。
外食産業が海外進出を検討するとき、現地の食生活の実態や食文化、嗜好などは国内とはかなりの違いがありましょう。それを調べるには、紙の資料だけでなく、現地で生活してみて見聞を広めることが大切です。
現地調査は、厳密には予測手法とはいえませんが、事業進出にあたって不可欠であり、進出規模の測定という見地では、重要な予測手法であるといえます。