分散分析

キーワード

分散分析、因子、水準、一元配置分散分析、級間分散、級内分散、分散比、Ｆ検定、二元配置分散分析、交互作用<、繰返し

分散分析とは

分散分析とは、各因子に複数の水準（グループ）があるとき、因子の水準により平均に差があるかどうかを検定する分析方法です。
　例えば作業者Ａ,Ｂ,Ｃが機械Ｐ,Ｑを使用して製品を生産しているとします。このとき、作業者、機械を因子といい、作業者Ａ,Ｂ,Ｃを作業者の水準、機械Ｐ,Ｑを機械の水準といいます。因子数は２で、作業者因子は３水準、機械因子は２水準です。
　分散分析とは、Ａ－Ｐ、Ａ－Ｑ、・・・、Ｂ－Ｐなどの因子の組み合わせについて、いくつかの標本を採取し、作業者や機械により製品の品質に差があるか（平均に有意差があるか）どうかを検定する方法です。

因子数が１のときを一元配置分散分析、因子数が２のときを二元配置分散分析といいます（３以上のときを多元配置分散分析といいますが、複雑ですので省略します）。
　二元配置分散分析は、因子数が２のとき、例えば、品質に影響する因子として、作業者と機械が考えられるようなときに用いられます。この場合、ある特定の作業者と機械の組み合わせのときに品質がよいということが考えられます。このように、因子間での効果を交互作用といいます。
　二元配置分散分析のとき、各因子の水準について、１つのデータしかない場合（「繰返しがない」という）と、複数組のデータがある場合（「繰返しがある」という）があります。前者の場合は、１つのデータだけでは、交互作用を考えることができません。後者では交互作用が重要になります。

一元配置分散分析

一元配置分散分析では、因子が１つの場合です。ここでは、作業者Ａ,Ｂ,Ｃの３人（３水準）により品質に差があるか（平均に有意差があるか）どうかを検定することにします。
　水準数が２のとき、すなわち作業者がＡとＢの２名のときは、２つの母集団の平均の差の検定ですから、ｔ検定が利用できます（参照：「ｔ分布と推定・検定」）。
　ところが、水準数が３以上になると、ｔ検定では、２つずつの検定はできても、全体についての検定はできません。

検定では、帰無仮説を立てて、それが棄却されるかどうかを判定します。分散分析では、次のようになります。

帰無仮説Ｈ₀：Ａ－Ｂ、Ｂ－Ｃ、Ｃ－Ａの３の組み合わせのすべてについて、平均に差があるとはいえない（積極的に差がないというのではなく、「有意水準で差がある」とはいえないという意味）。
対立仮説Ｈ₁：上の組み合わせうち、少なくとも１つは差がある（すべての組み合わせで差があるといっているのではない）。

考え方のイメージ

分散分析で水準Ａも全体の分布も、その母集団は正規分布をしていると仮定します。
　下左図のように、水準Ａの平均μ_aが、全体の平均μ_tと離れていても、ばらつきが大きいときには、差があるとは断定できません。逆に、下右図のように、平均の差が小さいようにみえても、ばらつきがほとんどないときには、差があるといえます。

水準Ａに属する標本について、その値と全体平均μ_tのずれは、水準Ａの平均μ_aがμ_tからずれていること（図では「級間のずれ」と表記）と、標本値がμ_aからずれていること（図では「級間のずれ」と表記）２つに分解することができます。
　級間のずれが大で級内のずれが小さいとき、水準の平均の間に差があるといえます。

統計学的な接近

ばらつきやずれの尺度に平方和や分散があります。平方和Ｓは、
　　　Ｓ＝Σ（標本の値－平均）²
となります。
　全体の平方和は、
　　　全体の平方和＝Ｓ_t＝Σ（全標本－全体の平均μ_t)²
となります。そして、水準Ａの平方和として、
　　　水準Ａの平方和＝Ｓ_a＝水準Ａの標本数×(水準Ａ平均μ_a－μ_t)²
と定義します。同様に、
　　　水準Ａの平方和＝Ｓ_a＝水準Ａの標本数×(水準Ａ平均μ_a－μ_t)²
　　　水準Ａの平方和＝Ｓ_a＝水準Ａの標本数×(水準Ａ平均μ_a－μ_t)²
とし、その合計を
　　　Ｓ_*＝Ｓ_a＋Ｓ_a＋Ｓ_a
とします。また、
となります。そして、
　　　Ｓ_t－Ｓ_*＝Ｓ_e＝残差平方和
と定義します。

平方和は標本の個数に関係しますので、平方和／自由度により調整します。全体の自由度φ_tは、全標本数をｎとすれば、φ_t＝ｎ-１です。Ｓ_*の自由度は、水準数をｍとすると、φ_*＝ｍ－１になります。そして、残差Ｓ_eの自由度φ_eは、φ_e＝φ_t－φ_*＝ｎ－ｍになります。
　　　ｓ_t²＝Ｓ_t／(ｎ－１)　・・・　全変動といいます
　　　ｓ_*²＝Ｓ_*／(ｍ－１)　・・・　級間分散といいます
　　　ｓ_e²＝Ｓ_e／(ｎ－ｍ)　・・・　級内分散といいます
　すると、
　　　(ｎ－１)×全変動＝(ｍ－１)×級間分散＋(ｎ－ｍ)×級内分散
の式が成立します。

ここで、各水準平均と全体平均の差が大きいと級間分散が大になり、級内分散が大きいことは、この因子以外の影響によるばらつきが大きく平均に差があっても有意差とはいえないことを考えると、検定の尺度として、
　　　分散比＝級間分散／級内分散
を用いるのが適切であることがわかります。
　分散比の検定では、Ｆ検定が用いられます。すなわち、上記の計算で求めた分散比Ｆが、有意水準５％の自由度（ｎ－１、ｎ－ｍ）のＦ_0.05より大であれば、帰無仮説Ｈ₀が棄却された（水準間で有意差がある）ことになります（参照：「Ｆ分布と推定・検定」）。

なお、Ｆ分布はχ²分布の比で表されます。自由度（ｐ，ｑ）のＦ分布は、
　　　Ｆ＝（χ²_p/ｐ）／（χ²_q/ｑ）
となります。それで、ｐ＝１のとき、すなわち、因子の水準数ｍが２のときは、Ｆ検定ではなく、χ²検定が用いられます。（参照：「χ²分布と推定・検定」）

数値例

作業者Ａ,Ｂ,Ｃの３人による製品の品質について、次の標本（観測データ）が得られました。

　上述の「統計学的な接近」で示した手順で計算すると、次の結果が得られます。

　結果として、分散比＝３.０７７となります。

Ｆ分布表から、自由度（２、１９）で上側確率０.０５の値をみると、Ｆ＝３.５２２です。
　　　計算による分散比＜表によるＦの値
なので、帰無仮説Ｈ₀が棄却できない、すなわち「Ａ－Ｂ、Ｂ－Ｃ、Ｃ－Ａの３の組み合わせのすべてについて、平均に差があるとはいえない」ことになります。

Excelによる計算

Excelには、分散分析のためのツールがあります。上記の入力データによる結果は次のようになります。

Excelでの用語は、本文での用語と異なるものがあります。「級」を「グループ」、「平方和」を「変動」、「分散比」を「観測された分散比」と表現しています。
　「Ｆ境界値」とは、Ｆ分布表から求めたＦの値のことです。「Ｐ－値」とは、「観測された分散比＝Ｆ境界値」となる有意水準です。すなわち、この結果では、「観測された分散比＝３.０７７＜３.５２２＝Ｆ境界値」なので、有意水準０.０５では棄却できないが、有意水準が０.０７０（Ｐ－値）ならば棄却できることを示しています。
　この数値例では、観測された分散比とＦ境界値の差はわずかであり、５％では棄却できないが７％で棄却できる、すなわち、９５％の信頼度で差があるとはいえないが、９３％の信頼度なら差があるといえることを示しているのです。

繰返しのない二元配置分散分析

二元配置分散分析の特別なケースとして、各水準の組み合わせの標本が１つしかないとき、「繰返しのない」二元配置分散分析といいます。実際に１つのデータしか得られない場合や、平均値しかわからない場合に用いられます。
　この場合は、標本が１つだけなので、分散を計算することができません。それで、交互作用はないとして計算します。一元配置と同様に、全分散を級間変動１、級間変動２、級内変動とに分け、級間変動１／級内変動、級間変動２／級内変動を求めればよいのです。

数値例

因子１を機械（Ｐ,Ｑ）、因子２を作業者（Ａ,Ｂ,Ｃ）として、入力データと計算結果、Excelによる結果を示します。

Excelによる結果

因子１（機械）では、Ｐ－値＝０.２２５という大きな値になっています。すなわち、信頼度を８０％程度に下げても帰無仮説が棄却されないのですから、この場合は「機械による差はない」といってもよいでしょう。このことは、「基本統計量」に時点で、機械の平均差が１.０、平方和が１.５０であり、他の値と比較して小さいことからも想像されます。

繰返しのある二元配置分散分析

機械Ｐと作業者Ａ、機械Ｂと作業者Ｃなど各水準の組合せについて複数のデータがある場合は、交互作用を考えなければならないので、複雑になります。また、ここでは、そのテータ個数がすべて同じ（数値例では５）とします。異なる場合は、さらに複雑になります。

機械Ｐと作業者Ａの組合せの場合、その標本数をｎ_pa、その平均μ_paと全体平均μ_tとの平方和をＳ_paとすると、
　　　Ｓ_pa＝ｎ_pa×(μ_pa－μ_t)²
となります。
　これを、すべての組合せについて行い、それを合計した値を、
　　　Ｓ_*＝Ｓ_pa＋Ｓ_pb＋・・・＋Ｓ_qc
とします。
　これまでの類推から、Ｓ_t－Ｓ_*は、残差の平方和Ｓ_eになります。すなわち、Ｓ_*は、各因子の級間の平方和と交互作用の平方和の合計になります。それで、
　交互作用の平方和Ｓ_１・２＝Ｓ_*－（因子１の平方和Ｓ₁－因子２の平方和Ｓ₂）
になります。
　そして、交互作用の自由度φ_１・２は、因子１の自由度φ₁と因子２の自由度φ₂の積になります（この説明は難解のため省略）。すなわち、
　　　φ_１・２＝φ₁×φ₂＝(ｍ₁－１)×(ｍ₂－１)
となります。

これ以外は、繰返しのない二元配置分散分析と同様の手順で計算できます。

数値例

各水準の組合せでの標本数を５とします。組合せの数は６なので、全体ではｎ_t＝６×５＝３０、因子１水準Ｐでは、因子２の水準数が３なので、ｎ_p＝３×５＝１５、因子２水準Ａでは、因子１の水準数が２なので、ｎ_a＝２×５＝１０などとなります。

Excelによる結果

列（因子２＝作業者）では、分散比＝５.６５２＞３.４０３になり、帰無仮説が棄却され「有意差がある」ことになりました。しかも、Ｐ－１の値が０.０１０になので、０.０１確率すなわち９９％の信頼度で有意差があることになります。
　実は、「繰返しのない二元配置分散分析」の入力データは、本ケースでの平均を与えたのです。このように平均では同じであっても、複数データのときは、水準の組合せによるばらつきにより、交互作用が認められることがあり、それを考慮すると、有意差が明確になることがあるのです。

なお、交互作用の影響をどのように分析するかに関しては、さらに高度な分析方法があります。すべての水準で得られるデータ数が異なる場合を考慮すると、どのような水準を設定して、どのデータを得ればよいかなどの問題に発展します。そのような分野に実験計画法などがあります。