予測手法の概要

「この商品はどれだけ売れるだろうか」とか「株価は上昇するだろうか、下落するだろうか」など、将来のことは不確定要素があるため、高い精度で確実な予測をすることは困難ですが、それを追求することはビジネスに不可欠です。

予測をするには、商品など対象の特性を考慮すること、市場調査を行うこと、長年の経験を生かすことなど、総合的なアプローチが必要ですが、ここでは統計的手法による時系列予測を取り扱います。

需要予測の手法の分類過去データからの時系列予測他の要因との関係による予測専門家や担当者の知識・経験に基づく予測市場調査等による予測

時系列予測

時系列予測の手法を一般化すれば、次の公式で表現できます。
　　　ｙ＝ｆ_t(ｙ_t)＋ｆ_t-1(ｙ_t-1)＋・・・＋ｆ₂(ｙ₂)＋ｆ₁(ｙ₁)
ここで、ｙはｔ＋１期の予測値、ｙ_iはｉ期での実績値です。例えば、
　　　ｙ＝ｙ₃²＋６／ｙ₂－２ｙ₃＋３
のような数式で表され、ｙ₃＝４、ｙ₂＝３、ｙ₃＝５ならば、
　　　ｙ＝１６＋２－１０＋３＝１１
となります。

このように、時系列手法とは、他の要因をすべて無視して、過去のデータだけを用いて統計的（数学的）処理を行なうのですから、信頼のある予測をするには限界があります。これだけで予測するのではなく、多様な手段のうちの一つとして用いるべきです。

予測の目的は、単に「あたるかどうか」だけではありません。従来とは質的に異なる要因が発生したかどうかを認識することも重要な目的です。統計的手法により過去のデータの延長で予測した値と、実現した値が大きく異なる場合、従来の数式が通用しないことから、何らかの質的変化が生じていることを発見することができます。

よい予測方法とは、次の事項を満たすものだといわれています（曹徳弼「需要，予測，統計手法」より）
　　　需要の不規則な変動を滑らかにする
　　　需要の傾向変化に敏感である
　　　予測誤差のばらつきが小さい
　　　予測方法が簡単である
　　　予測方法のメカニズムが明確である
　　　予測誤差の範囲が明確である

自己回帰モデル（ＡＲ：Autoregressive）

自己回帰とは、例えば過去の売上実績だけを用いて来期の売上を予測するというように、予測するもの自身の過去の実績データだけで予測値を計算することです。。
　また、通常のビジネスでは、上のような複雑な式にすることは少なく、次のような一次式を用いるのが一般的です。
　　　ｙ＝ａ_tｙ_t＋ａ_t-1ｙ_t-1＋・・・＋ａ₂ｙ₂＋ａ₁ｙ₁＋ａ₀
すなわち、過去の実績値ｙ_iにａ_iの重みづけをして予測するのです。さらに通常では、
　　　ａ₀＝０
　　　ａ_t＋ａ_t-1＋・・・＋ａ₂＋ａ₁＝１
とします。
　時系列予測手法は数多くありますが、このような数式において、係数ａ_iをどのように決定すればよいかを求めるものだといえます。

指数平滑法（Exponential smoothing）

指数平滑法は自己回帰モデルでの係数ａ_iを求める方法の一つです。すべての過去データを用いるが、近い過去の重みを高く、遠い過去の重みを小さくしたものです。
　指数平滑法のうち、最も単純なのが一次の指数平滑法です。次のようにして予測します。
　　　ｔ＋１期の予測値＝ａ×ｔ期の実績値＋ (１－ａ)×ｔ期の予測値　　　・・・Ａ
　　　　　　　　　　＝ｔ期の予測値＋ａ×(ｔ期の実績値－ｔ期の予測値)
ここで，ａは平滑化定数であり，
　　　ａ＝１とすれば：ｔ＋１期の予測値＝ｔ期の実績値
　　　ａ＝０とすれば：ｔ＋１期の予測値＝ｔ期の予測値
となります。
直前の実績値と予測値を知っているだけで簡単に予測できる特徴があります。

なぜ「指数」というのかというと、Ａ式を展開すると、
　　　ｔ＋１期の予測値（ｙ）　　　　　＝ａ(１－ａ)ｙ_t＋ａ(１－ａ)²ｙ_t-1＋・・・＋ａ(１－ａ)^tｙ₁
となり、係数が指数になるからです。
　すなわち、指数平滑法では、すべての過去データを用い、最近のデータの重みを大にした移動平均法なのです。

詳細：「指数平滑法」

移動平均法（ＭＡ：Moving Average）

最も単純な予測手法は移動平均法です。
　もし、需要に変化がないとするならば、ｔ＋１期の予測値はｔ期の実績値と同じなのですから、
　　　　ｙ_t+1＝ｙ_t
となります（これでは予測する必要もないでしょうが）。
　「最近の数期の平均を予測値とする」ことがよく行われます。例えば３期の平均とするならば、
　　　　ｙ_t+1＝０.３３３ｙ_t＋０.３３３ｙ_t-1＋０.３３３ｙ_t-2
となり、５期の平均とするならば、
　　　　ｙ_t+1＝０.２ｙ_t＋０.２ｙ_t-1＋０.２ｙ_t-2＋０.２ｙ_t-3＋０.２ｙ_t-4
となります。
　このように、移動平均法では、最近の数期間のデータだけを用い、しかもその係数が同じであるのが特徴です。需要がほぼ横ばいのときならよいのですが、増加や減少の傾向がある場合は、それに追いつけない欠点があります。

自己回帰移動平均モデル（ＡＲＭＡ：Autoregressive moving average model）

ＡＲとＭＡを組み合わせた手法です。詳しい数学的説明は割愛します。イメージ的には
　　　　ｙ_t+1 = p*ＡＲの式 + q*ＭＡの式
となり、p=0としたときＭＡ、q=0としたときＡＲになります。

なお、ＡＲＭＡは予測値が発散しないことを前提とした定常な時系列過程を対象にしており、傾向変動が顕著なときにはＡＲＩＭＡ（Auto Regressive Integrated Moving Average）モデルを適用します。

最小二乗法による予測

この方法は自己回帰ではありません。毎年の実績データがある式で決定され、その式は予測年度での成立するという仮定で予測します。

過去のｉ年度の実績値ｙ_iは、その年度の変数ｘ_iにより決まり、その式は、毎年度同じで
　　　y = a*x + b　　（a, bは定数)
になるとします。このa, bを決定することが目的です。

過去の実績に適用すると、この式と完全に一致することはないので、誤差εが生じます。
　　　y_i = a*x_i + b + ε_i
　変形して、
　　　ε_i = a*x_i + b - y_i
　ここで、x_iを年度（１、２、・・・、ｎ）だとすると、
　　　ε_１＝１ａ＋ｂ－ｙ_１
　　　ε_２＝２ａ＋ｂ－ｙ_２
　　　　　：
　　　ε_ｎ＝ｎａ＋ｂ－ｙ_ｎ
となります。誤差の平方和
　　　ε_１^２＋ε_２^２＋・・・＋ε_ｎ^２
を最小にするようにａとｂを計算で求めます。その手法が最小二乗法です。→詳細：「最小二乗法」
そして，ｎ＋１年目の予測値ｙ_ｎ＋１は，
　　　ｙ_ｎ＋１＝（ｎ＋１）ａ＋ｂ
として求められます。

このように変数x_iを年度だとすると、最小二乗法は移動平均法の発展形式（毎年の係数が異なる）の一つになります。計算は省略しますが、例えばｎ＝５のとき
　　　ｙ＝０.８ｙ_t＋０.５ｙ_t-1＋０.２ｙ_t-3－０.１ｙ_t-4－０.４ｙ_t-5
になります。最近と最初の係数が大きく、負の係数があることが特徴です。

なお、変数_iを測定可能な要因（例えばＧＤＰなど）に置き換えることもできます。予測するには予測期のＧＤＰが既知である（売上高よりも信頼性の高い予測値がある）必要があります。

季節調整法

夏・冬で需要が異なるとか、１２月に需要が大になるなど、需要が月により大きく変化することがよくあります。さらに長期的な長期の時系列データの分析では、景気変動などにより変化します。
　それで、各期間のデータを、
　　　Ｙ＝Ｔ＋Ｃ＋Ｓ＋Ｉ（加法型）　　Ｙ＝Ｔ・Ｃ・Ｓ・Ｉ（乗法型）
からなっているものとして、それぞれの要素に分解することが行われます。
　　　Ｔ：長期変動
　　　Ｃ：循環変動
　　　Ｓ：季節変動
　　　Ｉ：不規則変動

この代表的な手法に米センサス局によるＸ－１１やX-12-ARIMAがあります。非常に複雑な（緻密な）計算が行われています（省略）。

単に季節変動だけを考慮する場合は、次の手順により予測します。
　　１　毎年の月間平均実績値＝年間実績合計値／１２を計算する。
　　２　ｎ年間の毎月実績値の平均値を計算する。
　　３　１と２の比である季節指数を計算する。
　　４　１から最小二乗法などにより，来年の月間平均実績値を計算する。
　　５　４の予測値に３の季節指数を乗じて，来年の月別予測値を計算する。

成長曲線

新製品が発表されてから一般に普及し陳腐化するまでの需要は、ゴンペルツ曲線やロジスティック曲線などの成長曲線に従うといわれています。この曲線へのあてはめは、数学的に高度ですので省略します。

詳細：「成長曲線」

他の要因との関係による予測

回帰分析

例えば、アイスクリームの需要予測では、単なる時系列予測よりも「天候が高温になるとアイスクリームがよく売れる」というように、他の測定可能な要因を用いて予測するほうが適切なことがあります。それを回帰分析といいます。

回帰直線による予測: 回帰分析では、被説明変数（アイスクリームの需要）をｙ、説明変数（温度）をｘとして、
　　ｙ＝Ｆ(ｘ) 通常はｙ＝ａｘ＋ｂ
のような関係式を求めます。
ｎ個のデータ
（ｘ_１，ｙ_１），（ｘ_２，ｙ_２），・・・，（ｘ_ｎ，ｙ_ｎ）
において
　　ｙ_１＝a*ｘ_１ + b + ε_１
　　ｙ_２＝a*ｘ_２ + b + ε_２
　　　　：
　　ｙ_ｎ＝a*ｘ_ｎ + b + ε_ｎ
の式を与え、
　　Σε_ｉ^２ → 最小
となるように、最小二乗法により、ａ，ｂを求めます。
これで、ｙ＝ａｘ＋ｂが作れるので、将来の温度ｘを与えれば、アイスクリームの需要が計算できます。
寄与率と相関係数: 詳細は省略しますが、図により相関係数ｒが計算できます。ｒ^２を寄与率といいます。

寄与率は、ｘがｙをどの程度説明できているかの尺度です。
　　寄与率＝１　完全に説明。ｙの値はｘだけで説明でき、他の要因は関係しない
　　寄与率＝０　ｙの値にｘは無関係。他の要因の影響が大きい
相関係数ｒの絶対値も寄与率と同じ意味になります。その正負は、計算からも得られますが、直感的にもわかるでしょう。
　　　１＞ｒ＞０　正の相関、ｘが大になるとｙも大になる
　　－１＜ｒ＜０　負の相関、ｘが大になるとｙは小になる

重回帰

説明変数が複数の場合です。例えば、アイスクリームの需要は、温度と晴雨の２つで説明できるとの仮定を設ける場合に使われます。
　複雑なので、ここでは省略します。 →参考：重相関と重回帰

因果推論（Causal Inference in Statistics）

検定や回帰などの手法は、被説明変数と説明変数の間の「相関」はわかるが、「因果関係」はわかりません。例えば、新薬の効果を測定するには、　　処置群　本当の薬を与えたグループ　　対象群　偽薬（プラシーボ）を与えたグループに分けて、投与前と投与後の症状改善割合を調べます。　改善割合
. 　　　　　　投与前　投与後　増加分
　　処置群　１５％　３０％　１５％　─┐
　　対象群　１０％　２０％　１０％　─┸５％（差分の差分）
　どちらも投与後に改善割合が高くなっていますが、それは他の要因（天候や担当医師の交代など？）原因だったのかもしれません。薬の効果は５％だともいえます、
　因果推論には、もっと高度な分析手法を用いて、二つの群を均質化して比較する「傾向スコア」などの方法があります。

専門家や担当者の知識・経験に基づく予測

社会や技術の分野では、多様な未知の要因が複雑に関連するので、過去のデータを数学的な処理をして予測するのは困難です。それでも予測しないと現在の対応ができません。

直観法

他に有効な手段がない場合は、専門家（経営者なども含む）の主観による予測に頼ることになります。

一点見積
予測値として、一つの値を示します。
三点見積
最尤値、楽観値、悲観値の３つの値を示します。

デルファイ法

デルファイとはギリシャ神話での「神のお告げ」の意味です。専門家へのアンケート調査により予測する方法です。例えば「通信速度がテラビット/秒になるのは何年後か」という予測を行うとします。
　・予測対象に従って，多数の専門家を回答者として選定します。
　・「５年後」「１０年後」「実現しない」などが、その理由もつけて回答されます。
　・回答結果から、平均値や偏差などを求め、それぞれの理由を集約したものをフィードバックして、再度同じ質問をします。
　・回答者は、それを分析して、回答を変えるでしょう。これを繰り返すことにより、ある範囲に収束するでしょう。

クロスインパクト法

予測に関連する変数間の影響度を定量化したマトリックスを基にして、変数間の波及効果をシミュレーションして定量的に示す方法です。将来の技術開発の展開を予測するのに、デルファイ法と組み合わせて用いることが多い。

シナリオライティング法

複雑な分野での未来予測の一手法です。ある仮説を立てて、それに従い将来起こるだろう情景を、時間とと分野に区分して予測します。複数の仮説に基づく代替案を作成することもあります。定性的ではあるが相互に矛盾のない論理的な予測をするのに適しています。

クロスセクション法

時系列分析とは逆に、ある時点（５年後、１０年後のような定期的な設定ではなく、環境が変化する時点のほうがよい）での予測値を、それに影響する他の分野の項目の予測値から求める方法です。
　他の分野の項目のほうが予測しやすいときに有効ですが、実際には影響項目の数値から予測数値を求める数式そのものが変化すると考えらます。その変化を予測するには、シナリオライティング法などの非数学的方法の援用が必要です。

フェルミ推定（Fermi estimate）

正確に算出することが極めて難しい数量に対して、把握している情報と論理的な思考プロセスによって概数を求める手法。すなわち、「わからない数値」を「わかっている数値」を組み合わせて推定する手法です。企業の戦略立案やマーケティングなど広く使用されます。

例えば、ＰＣの回収ビジネスを検討するにあたり「日本国内に使われず死蔵しているＰＣの数」を知りたいとします。これを直接に調査するのはかなり困難です。
　これに関連する資料として、
　・過去のＰＣ国内販売台数
　・ＯＳやＣＰＵなどが大きく変化した時期
　・新ＯＳが旧ＯＳに代わる割合（多くの団体の調査結果公表がある）
　・自治体委託の回収業者の回収台数
などは比較的入手しやすいでしょう。
　ＰＣ死蔵数とこれらのデータとの関係を、理論的あるいは経験的に定式化することにより、大まかな数値を推定することができます。