推定検定（ｔ検定、カイ二乗分布、Ｆ検定）例題集

参照：JavaScriptの計算プログラム

推定検定（ｔ検定、カイ二乗分布、Ｆ検定）の簡単な数値例題を示します。
それとともに、私自作の関数の紹介をします。上掲「参照」も表示しながら学習してください。

ｔ分布

平均μ、標準偏差σの正規分布になっている母集団から取り出したｎ個の標本の平均をμ₀、標準偏差をｓとすると、
　　　　　　μ₀－μ
　　　ｔ＝─────
　　　　　ｓ／√ｎ
は、自由度ｎ－１のｔ分布に従う。

問１　平均の区間推定
　　　10人の平均身長が 170cm、標準偏差が 9cmであったとき、
　　　身長平均の９５％信頼でのでの信頼区間を求めよ。

　ｔ値の入手
　　９５％信頼 → 有意水準＝０.０５ → 片側確率＝０.０２５
　　ｎ＝１０ → 自由度＝ｎ－１＝９
　　ｔ分布表（9, 0.025）＝　2.2622

　　関数（ｔ分布のｔ値の計算）
  　　t = testTvalue(df, p) = testTvalue(9, 0.025) = 2.262

　信頼区間
　　上式から　区間 = μ₀±（ｔ×ｓ／√ｎ）
  　　n = 10, μ₀ = 170,  s = 9,  t = 2.262 を代入
　　　下限, 上限 = １７０±（２.２６２×９／√１０＝１７０±６.４
　　　＝１６３.６～１７６.４［ｃｍ］

　　関数（ｔ検定　平均の区間推定）
  　　[下限, 上限] = testTvalue(df, p) = testTvalue(9, 0.025) = [ 163.6, 176.4 ]

問２　母平均との差の検定
　　　問１において、全国での平均身長は μ＝164 cm であるという。
　　　このグループの平均身長は全国平均より高いといえるか。

　差の検定
　　「高いか」→片側確率５％
　　ｔ＝|μ₀－μ|／(ｓ／√ｎ) = |164-170|/(9/√10 = 2.108
　　このｔ値が自由度９、片側確率５％の値 t(9, 0.05) = 1.833 ＜ 2.108 → 有意水準５％で高いといえる。
　　このｔ値が自由度９、片側確率１％の値 t(9, 0.01) = 2.821 ＞ 2.108 → 有意水準１％では高いとはいえない。

　関数（ｔ検定の標本平均と母集団平均の比較）
　　[t0, tp] = testTtest1(μ, n, μ0, σ, side) =  testTtest1(164, 10, 170, 9, "upper") = [2.108, 0.050]
     t0 = 2.108（計算によるｔ値）　tp=0.050（そのときの有意水準, 0.005, 0.01, 0.25. 0.05　のいずれかで表示）

問３　２変数の平均の比較
　　　製品Ｘの標本数(n_x)１０個の特性の平均(μ_x)は３７、標準偏差σ_xは４
　　　製品Ｙの標本数(n_y)　６個の特性の平均(μ_y)は３２、標準偏差σ_yは３
　　　であった。Ｘの特性値ははＹよりも大といえるか。有意水準５％

　ｔ値を求める公式
　　　ｔ0 = (μ_x - μ_y)/(σ√(1/n_x + 1/n_y)　
　　　　ただし σ=√[(df_xσ_x² + df_yσ_y²) / (df_x + df_x)]、
　　　　　　　 df_x、df_yは自由度 n_x-1, n_y-1

　　　df= df_x+df_y=n_x-n_y-2=14
　　　σ=√[(df_xσ_x² + df_yσ_y²) / (df_x + df_y)]=3.674
　　　μ_x-μ_y=37-32=5
　　　√(1/n_x + 1/n_y)=0.516
　　t0 =(μ_x-μ_y)/(σ√(1/n_x + 1/n_y) = 5 /(3.674*0.516) = 2.635
　t分布表から、自由度df=n_x+n_y-2= 14、 有意水準５％の値
　　t分布表(14, 0.05) = 1.761 ＜ 2.635 →　有意水準５％でＸはＹより大だといえる

　関数（ｔ検定　２変数の平均の比較）
　　[t0, tp] = testTtest2(nx, μx, σx, ny, μy, σy, side)
　　　　　　 = testTtest2(10, 37, 4, 6, 32, 3, "upper")
　　　　　　 = [ 2.635, 0.010 ]
　　ｔ値は 2.635 であり、有意差１％でＸ＞Ｙだといえる

カイ二乗検定

分散σ²の正規分布になっている母集団から取り出したｎ個の標本の分散をｓ²とすると、
　　　χ²＝（ｎ－１）ｓ² / σ²
は、自由度ｎ－１のχ²分布に従う。

問１　χ²値の計算
　　　分散 = σ² = 6 の母集団から取り出した標本 n = 10（自由度 df = n-1 = 9）の
　　　分散 = ｓ² = 4 であるとき、χ²値を求めよ。

　　χ²＝（ｎ－１）ｓ² / σ²
　　　　＝ 9 * 4 / 6 = 6

問２　母分散との検定　χ²値の有意水準
　　　標本数ｎ＝１０で分散がｓ² = 4 であるとき、この分散は
　　　母集団の分散 σ² = 6 と差があるかを検定せよ（有意水準 0.05）

χ²値の計算
　　問１と同じ → χ² = 6

有意水準 p=0.05 とするとき、次の３つのケースがある。
　　標本のほうが大　上側確率：p = 0.05
　　標本のほうが小　下側確率：1-p = 0.95
　　差がある　　　　両側確率：上側= p/2 = 0.025, 下側= 1-p/2 = 0.975
　χ²分布表(df, p) から取得
　　上側確率：χ²(9, 0.05) = 16.920
　　下側確率：χ²(9, 0.95) =  3.325
　　両側確率：上側 χ²(9, 0.975) = 2.700, 下側 χ²(9, 0.025) = 19.020
　関数（χ²分布の上側確率）による計算
　　上側確率 = testChi2Value(自由度, 上側確率) = testChi2Value(9, 0.05) = 16.920
　　下側確率 = testChi2Value(9, 0.95) = 3.325
    両側確率上側 = testChi2Value(9, 0.975) = 2.700
    両側確率下側 = testChi2Value(9, 0.025) = 19.020
　検定結果
　　上側確率　16.920 ＞ 6　大きいとはいえない
　　下側確率　 3.325 ＜ 6　小さいといえる
　　両側確率　 2.700 ＜ 6 19.020　差があるとはいえない

　関数（χ²検定　母分散との比較）
　　p = testChi2Test1(σ², n, ｓ²) = testChi2Test1(6, 10, 4) = 0.995
　　有意水準 0.995 で有意差がある
　　（0.995 → 下側確率 → 小さいほうで差がある）

問３　母分散の区間推定
　　　ｎ＝１０，ｓ² = 4 であるとき、母集団の分散σ²の９５％信頼区間を求めよ。

　χ²＝ (n-1)*ｓ²/σ² → σ² = (n-1)*ｓ²/χ²
　　両側確率 → 下側=0.025, 上側=0.975
　　下限 = (n-1)*ｓ²/χ²_{(9, 0.025)} = 9 * 4 / 19.02 = 1.893
　　上限 = (n-1)*ｓ²/χ²_{(9, 0.975)} = 9 * 4 /  2.70 = 13.33

　関数（χ²検定　母分散の区間推定）
　　[下限, 上限] = testChi2IE(n, ｓ², p) = testChi2IE(10, 4, 0.05) = [1.893, 13.333]

問４　２×２分割表
　　　２ｘ２の分割表が与えられたとき、層や特性に差があるかどうかを検定する
　　　　　　　特性Ａ　特性Ｂ
　　　　層Ｘ　a = 18　b = 10
　　　　層Ｙ　c = 12　d = 17

　公式
             (ad-bc)² (a+b+c+d)
    χ^２ = ──────────
            (a+b)(c+d)(a+c)(b+d)
　　（a～ｄに１０よりも小さい値があるときは、Yatesの補正をするが、ここでは省略）。

　公式から
　　χ^２ = 34596 * 57 / 657720 = 2.998
　χ²分布表
　　自由度 df=(2-1)(2-1)=1
　　　p = 　　　0.1,　　0.05,　0.025,　 0.01,　 0.005
　　  χ^２[1] = 2.706,　3.841,　5.024,　6.635,　7.879 
　　 2.706 ＜ 2.998 ＜ 3.841 なので、５％では差があるとはいえないが、１０％では差があるといえる。

　関数（χ²検定　２×２分割表　Yatesの補正も内蔵）
　　p = testChi2cont2x2(a, b, c, d) = testChi2cont2x2(18, 10, 12, 17) = 0.1

Ｆ検定

二つの母集団ＡとＢからの標本の個数をｎ_a、ｎ_b、分散をｓ_a2、ｓ_b2とすると、分散比
　　　F＝ｓ_a2／ｓ_b2
は、自由度（ｎ_a－１、ｎ_b－１）のＦ分布に従う。

問１　Ｆ分布表からの５％点と１％点の検索
　　　Ｆ分布表から横自由度＝５，縦自由度＝１０の５％点と１％点を求めよ。

　通常、Ｆ分布表では上側累積確率 P が５％と１％の表が与えられている。
　　例：Ｆ_0.05(5, 10) = 4.735
　下側累積確率は、
　　Ｆ_1-p[横自由度, 縦自由度」= １／Ｆ_p(縦自由度, 横自由度)
　　例：Ｆ_0.95(5, 10) = １／Ｆ_0.05(10, 5) = 1/4.735 = 0.211

　関数（Ｆ検定　Ｆ分布表）f5:p=0.05,  f1: p=0,01
　　上側累積確率
　　　　[f5, f1] = testFvalue(横自由度, 縦自由度) = testFvalue(5, 10) = [3.326, 5.636]
　　下側累積確率
　　　　[f5, f1] = testFvalueLower(横自由度, 縦自由度) = testFvalueLower(5, 10) = [0.211, 0.100]

問２　分散比の上側検定　工程Ａの分散＞工程Ｂの分散といえるか
　　　工程Ａ　ｎ_a＝１０　　ｓ_a²＝６
　　　工程Ｂ　ｎ_b＝１６　　ｎ_b²＝２

分散比：Ｆ＝Ｆ＝ｓ_a²／ｓ_b²＝６／２＝３＞１
　　上側検定なので、Ｆ_0.05との比較
　　自由度（横）ｎ_a－１＝９、自由度（縦）ｎ_b－１＝１５
　　（分散比の分子の側を横（前）、分母の側を縦（後）にする）
　　Ｆ_0.05分布表(9, 15) = 2.588 ＜ 3 →　工程Ａは工程Ｂよりも分散が大きいといえる

　関数（Ｆ検定　２変数分散比の検定）
    p = testFtest2(ｎ_a, ｓ_a², ｎ_b, ｎ_b) = testFtest2(10, 6, 16, 2) = 0.05

問３　分散比の下側検定　工程Ａの分散＜工程Ｂの分散といえるか
　　　工程Ａ　ｎ_a＝１６　　ｓ_a²＝２
　　　工程Ｂ　ｎ_b＝１０　　ｎ_b²＝６

分散比：Ｆ＝Ｆ＝ｓ_a²／ｓ_b²＝２／６＝０.３３３＜１
　　下側検定なので、Ｆ_0.95との比較
　　自由度（横）ｎ_a－１＝９、自由度（縦）ｎ_b－１＝１５
　　Ｆ_0.95分布表(9, 15) = 1/Ｆ_0.05分布表(15, 9) = 1/2.588 = 0.386 ＞ 0.333 → 工程Ａ＜工程Ｂといえる

　関数（Ｆ検定　２変数分散比の検定） 問２と同じ関数
    p = testFtest2(ｎ_a, ｓ_a², ｎ_b, ｎ_b) = testFtest2(16, 2, 10, 6) = 0.95
　　（p=0.95 とは下側検定であり、有意水準は 1-p=0.05 であることを示す）

推定検定（ｔ検定、カイ二乗分布、Ｆ検定）例題集

参照：JavaScriptの計算プログラム

ｔ分布

問１ 平均の区間推定 10人の平均身長が 170cm、標準偏差が 9cmであったとき、 身長平均の９５％信頼でのでの信頼区間を求めよ。

問２ 母平均との差の検定 問１において、全国での平均身長は μ＝164 cm であるという。 このグループの平均身長は全国平均より高いといえるか。

カイ二乗検定

問１ χ2値の計算 分散 = σ2 = 6 の母集団から取り出した標本 n = 10（自由度 df = n-1 = 9）の 分散 = ｓ2 = 4 であるとき、χ2値を求めよ。

問２ 母分散との検定 χ2値の有意水準 標本数 ｎ＝１０ で分散が ｓ2 = 4 であるとき、この分散は 母集団の分散 σ2 = 6 と差があるかを検定せよ（有意水準 0.05）

問３ 母分散の区間推定 ｎ＝１０，ｓ2 = 4 であるとき、母集団の分散σ2の９５％信頼区間を求めよ。

問４ ２×２分割表 ２ｘ２の分割表が与えられたとき、層や特性に差があるかどうかを検定する 特性Ａ 特性Ｂ 層Ｘ a = 18 b = 10 層Ｙ c = 12 d = 17

Ｆ検定

問１ Ｆ分布表からの５％点と１％点の検索 Ｆ分布表から横自由度＝５，縦自由度＝１０の５％点と１％点を求めよ。

問２ 分散比の上側検定 工程Ａの分散＞工程Ｂの分散 といえるか 工程Ａ ｎa＝１０ ｓa2＝６ 工程Ｂ ｎb＝１６ ｎb2＝２

問３ 分散比の下側検定 工程Ａの分散＜工程Ｂの分散 といえるか 工程Ａ ｎa＝１６ ｓa2＝２ 工程Ｂ ｎb＝１０ ｎb2＝６

問１　平均の区間推定
　　　10人の平均身長が 170cm、標準偏差が 9cmであったとき、
　　　身長平均の９５％信頼でのでの信頼区間を求めよ。

問２　母平均との差の検定
　　　問１において、全国での平均身長は μ＝164 cm であるという。
　　　このグループの平均身長は全国平均より高いといえるか。

問１　χ²値の計算
　　　分散 = σ² = 6 の母集団から取り出した標本 n = 10（自由度 df = n-1 = 9）の
　　　分散 = ｓ² = 4 であるとき、χ²値を求めよ。

問２　母分散との検定　χ²値の有意水準
　　　標本数ｎ＝１０で分散がｓ² = 4 であるとき、この分散は
　　　母集団の分散 σ² = 6 と差があるかを検定せよ（有意水準 0.05）

問３　母分散の区間推定
　　　ｎ＝１０，ｓ² = 4 であるとき、母集団の分散σ²の９５％信頼区間を求めよ。

問４　２×２分割表
　　　２ｘ２の分割表が与えられたとき、層や特性に差があるかどうかを検定する
　　　　　　　特性Ａ　特性Ｂ
　　　　層Ｘ　a = 18　b = 10
　　　　層Ｙ　c = 12　d = 17

問１　Ｆ分布表からの５％点と１％点の検索
　　　Ｆ分布表から横自由度＝５，縦自由度＝１０の５％点と１％点を求めよ。

問２　分散比の上側検定　工程Ａの分散＞工程Ｂの分散といえるか
　　　工程Ａ　ｎ_a＝１０　　ｓ_a²＝６
　　　工程Ｂ　ｎ_b＝１６　　ｎ_b²＝２

問３　分散比の下側検定　工程Ａの分散＜工程Ｂの分散といえるか
　　　工程Ａ　ｎ_a＝１６　　ｓ_a²＝２
　　　工程Ｂ　ｎ_b＝１０　　ｎ_b²＝６