推定検定(t検定、カイ二乗分布、F検定)の簡単な数値例題を示します。
それとともに、私自作の関数の紹介をします。上掲「参照」も表示しながら学習してください。
平均μ、標準偏差σの正規分布になっている母集団から取り出したn個の標本の平均をμ0、標準偏差をsとすると、
μ0-μ
t=─────
s/√n
は、自由度n-1のt分布に従う。
t値の入手 95%信頼 → 有意水準=0.05 → 片側確率=0.025 n=10 → 自由度=n-1=9 t分布表(9, 0.025)= 2.2622 関数(t分布のt値の計算) t = testTvalue(df, p) = testTvalue(9, 0.025) = 2.262 信頼区間 上式から 区間 = μ0±(t×s/√n) n = 10, μ0 = 170, s = 9, t = 2.262 を代入 下限, 上限 = 170±(2.262×9/√10=170±6.4 =163.6~176.4[cm] 関数(t検定 平均の区間推定) [下限, 上限] = testTvalue(df, p) = testTvalue(9, 0.025) = [ 163.6, 176.4 ]
差の検定 「高いか」→片側確率5% t=|μ0-μ|/(s/√n) = |164-170|/(9/√10 = 2.108 このt値が自由度9、片側確率5%の値 t(9, 0.05) = 1.833 < 2.108 → 有意水準5%で高いといえる。 このt値が自由度9、片側確率1%の値 t(9, 0.01) = 2.821 > 2.108 → 有意水準1%では高いとはいえない。 関数(t検定の標本平均と母集団平均の比較) [t0, tp] = testTtest1(μ, n, μ0, σ, side) = testTtest1(164, 10, 170, 9, "upper") = [2.108, 0.050] t0 = 2.108(計算によるt値) tp=0.050(そのときの有意水準, 0.005, 0.01, 0.25. 0.05 のいずれかで表示)
t値を求める公式 t0 = (μx - μy)/(σ√(1/nx + 1/ny) ただし σ=√[(dfxσx2 + dfyσy2) / (dfx + dfx)]、 dfx、dfyは自由度 nx-1, ny-1 df= dfx+dfy=nx-ny-2=14 σ=√[(dfxσx2 + dfyσy2) / (dfx + dfy)]=3.674 μx-μy=37-32=5 √(1/nx + 1/ny)=0.516 t0 =(μx-μy)/(σ√(1/nx + 1/ny) = 5 /(3.674*0.516) = 2.635 t分布表から、自由度df=nx+ny-2= 14、 有意水準5%の値 t分布表(14, 0.05) = 1.761 < 2.635 → 有意水準5%でXはYより大だといえる 関数(t検定 2変数の平均の比較) [t0, tp] = testTtest2(nx, μx, σx, ny, μy, σy, side) = testTtest2(10, 37, 4, 6, 32, 3, "upper") = [ 2.635, 0.010 ] t値は 2.635 であり、有意差1%でX>Yだといえる
分散σ2の正規分布になっている母集団から取り出したn個の標本の分散をs2とすると、 χ2=(n-1)s2 / σ2 は、自由度n-1のχ2分布に従う。
χ2=(n-1)s2 / σ2 = 9 * 4 / 6 = 6
χ2値の計算 問1と同じ → χ2 = 6 有意水準 p=0.05 とするとき、次の3つのケースがある。 標本のほうが大 上側確率:p = 0.05 標本のほうが小 下側確率:1-p = 0.95 差がある 両側確率:上側= p/2 = 0.025, 下側= 1-p/2 = 0.975 χ2分布表(df, p) から取得 上側確率:χ2(9, 0.05) = 16.920 下側確率:χ2(9, 0.95) = 3.325 両側確率:上側 χ2(9, 0.975) = 2.700, 下側 χ2(9, 0.025) = 19.020 関数(χ2分布の上側確率)による計算 上側確率 = testChi2Value(自由度, 上側確率) = testChi2Value(9, 0.05) = 16.920 下側確率 = testChi2Value(9, 0.95) = 3.325 両側確率上側 = testChi2Value(9, 0.975) = 2.700 両側確率下側 = testChi2Value(9, 0.025) = 19.020 検定結果 上側確率 16.920 > 6 大きいとはいえない 下側確率 3.325 < 6 小さいといえる 両側確率 2.700 < 6 19.020 差があるとはいえない 関数(χ2検定 母分散との比較) p = testChi2Test1(σ2, n, s2) = testChi2Test1(6, 10, 4) = 0.995 有意水準 0.995 で有意差がある (0.995 → 下側確率 → 小さいほうで差がある)
χ2= (n-1)*s2/σ2 → σ2 = (n-1)*s2/χ2 両側確率 → 下側=0.025, 上側=0.975 下限 = (n-1)*s2/χ2(9, 0.025) = 9 * 4 / 19.02 = 1.893 上限 = (n-1)*s2/χ2(9, 0.975) = 9 * 4 / 2.70 = 13.33 関数(χ2検定 母分散の区間推定) [下限, 上限] = testChi2IE(n, s2, p) = testChi2IE(10, 4, 0.05) = [1.893, 13.333]
公式 (ad-bc)2 (a+b+c+d) χ2 = ────────── (a+b)(c+d)(a+c)(b+d) (a~dに10よりも小さい値があるときは、Yatesの補正をするが、ここでは省略)。 公式から χ2 = 34596 * 57 / 657720 = 2.998 χ2分布表 自由度 df=(2-1)(2-1)=1 p = 0.1, 0.05, 0.025, 0.01, 0.005 χ2[1] = 2.706, 3.841, 5.024, 6.635, 7.879 2.706 < 2.998 < 3.841 なので、5%では差があるとはいえないが、10%では差があるといえる。 関数(χ2検定 2×2分割表 Yatesの補正も内蔵) p = testChi2cont2x2(a, b, c, d) = testChi2cont2x2(18, 10, 12, 17) = 0.1
二つの母集団AとBからの標本の個数をna、nb、分散をsa2、sb 2とすると、分散比 F=sa 2/sb 2 は、自由度(na-1、nb-1)のF分布に従う。
通常、F分布表では上側累積確率 P が5%と1%の表が与えられている。 例:F0.05(5, 10) = 4.735 下側累積確率は、 F1-p[横自由度, 縦自由度」= 1/Fp(縦自由度, 横自由度) 例:F0.95(5, 10) = 1/F0.05(10, 5) = 1/4.735 = 0.211 関数(F検定 F分布表)f5:p=0.05, f1: p=0,01 上側累積確率 [f5, f1] = testFvalue(横自由度, 縦自由度) = testFvalue(5, 10) = [3.326, 5.636] 下側累積確率 [f5, f1] = testFvalueLower(横自由度, 縦自由度) = testFvalueLower(5, 10) = [0.211, 0.100]
分散比:F=F=sa2/sb2=6/2=3>1 上側検定なので、F0.05との比較 自由度(横)na-1=9、自由度(縦)nb-1=15 (分散比の分子の側を横(前)、分母の側を縦(後)にする) F0.05分布表(9, 15) = 2.588 < 3 → 工程Aは工程Bよりも分散が大きいといえる 関数(F検定 2変数分散比の検定) p = testFtest2(na, sa2, nb, nb) = testFtest2(10, 6, 16, 2) = 0.05
分散比:F=F=sa2/sb2=2/6=0.333<1 下側検定なので、F0.95との比較 自由度(横)na-1=9、自由度(縦)nb-1=15 F0.95分布表(9, 15) = 1/F0.05分布表(15, 9) = 1/2.588 = 0.386 > 0.333 → 工程A<工程Bといえる 関数(F検定 2変数分散比の検定) 問2と同じ関数 p = testFtest2(na, sa2, nb, nb) = testFtest2(16, 2, 10, 6) = 0.95 (p=0.95 とは下側検定であり、有意水準は 1-p=0.05 であることを示す)