Web教材一覧確率・統計

2×2分割表での検定と区間推定


2×2分割表

アンケートをしたとき,次のような表が得られますが,これを2×2分割表といいます。

 合計
はいa=18b=10a+b=28
いいえc=12d=17c+d=29
合計a+c=30b+d=27a+b+c+d=57

データ入力の手間を考慮すれば,次のように変形することもできます。

 
はいr1=18r2=10
合計n1=30n2=27

ここでは,変形後のデータを入力して,「はい」と答えた比率が,男のほうが女よりも大きいといえるかどうかを統計的な手段で調べます。統計用語でいえば2標本の比率の差の片側検定です。


理論

前提
帰無仮説 H:p=pである。
対立仮説H:p>pである。

2標本比率の差の区間推定

区間推定の定式化

2標本比率の差のχによる検定

2×2分割表のときは,χは次のように計算できます。
χ2の計算式
ここでYatesの補正項の±は( )の値が小さくなるように与えます。
なお,3以下の値があるときは個別に確率計算をするのが適切なのですが,ここではそれを無視しています。

2×2分割表のときは自由度は (2-1)(2-1)=1ですから,上の式で求めたχ値を自由度1のχと比較します。
  χ≧6.63 有意水準1%でHは棄却される。
  χ≧3.84 有意水準5%でHは棄却される。
  χ<3.84 有意水準5%ではHは棄却できない。
となります。

2標本比率の差のZ検定

Z検定の定式化
とおけば,Zが正規分布のαに相当するものです。
それで,
 Z≧2.33 有意水準1%Hは棄却(p>pだといえる)される。
  ≧1.64 有意水準5%Hは棄却される。
  <1.64 有意水準5%ではHは棄却できない。(p>pだとはいい切れない)。
と結論できます。

なお,Zの分子の「0.5~」は,入力データが離散量(整数)なので,それを連続量にするための補正項です。


計算プログラム

層1層2
反応者数 r1= r2=
層別人数 n1= n2=
r1/n1 > r2/n2 となるように,反応者比率
が大きい方を層1側に入れてください。

検定結果の見方

区間推定
入力データはサンプルですから,p-pの値はたまたまそうなったので,1点に絞ることはできずその周辺に真の値があると考えられます。区間推定は真の値が存在する可能性のある範囲を示したものです。その範囲の最小値が0よりも小さくなると「あるいはp≦pかもしれない」ことになります。それでこの計算では,最小値が正になるように確率のほうを調整しています。
「99%の確率でp>pだといえます。」
このようにいい切っても,それが間違いだったという確率が1%以下だということです。統計用語でいえば「有意水準1%で "p=pである" という帰無仮説が棄却される」ことであり,「対立仮説 "p>pである" といえる」ということです。一般に「有意差**」と表示します。
「95%の確率でp>pだといえます。」
99%の信頼度はないが,95%でならばいえるということです。「有意差*」と表示します。
「90%の確率でp>pだといえます。」
95%の信頼度はないが,90%でならばいえるということです。自然科学ではこの程度では「有意差があるとはいえない」のですが,アンケート分析のような厳密性を問わないときには採用することがあります。
「90%確率でp>pだとは断定できません。」
「有意水準10%でも "p=pである" という帰無仮説は棄却されない」ことです。p>pだとは「断定できない」のであり,「p=pである」ということではありません。信頼度を80%,70%と下げればp>pであるといえるのでしょうが,一般にはこのような場合は,有意差があるとはいいません。

●注意:場合によっては,この3通りの結果に矛盾が生じることもあります。それは「どのような考えで検定したのか」による違いです。「どれでなければいけない」ということはないので,「そんなものかな」と理解しておけばよいのです。

データの大きさに注意

=100,p=80(0.80),n=100,p=63(0.63)のときは,99%の有意差があります。でも,n=10,p=8(0.80),n=10,p=6(0.60)のときは,有意差はありません。99%の有意差があるといえるのは,n=10,p=3(0.30)のときです。さらに,n=5だと,p=0(0.00)でやっと99%の有意差になります。

このように,データが大きければ,小さな比率の違いでも有意差がありますが,データが少ないときは,比率がかなり異なっていても有意差があるとはいえないのです。それは,データが少ないと,もし1つがyesからnoに変われば比率が大きく変化するということからも,常識的に理解できましょう。