Web教材一覧統計・確率

推定検定(t検定、カイ二乗分布、F検定)例題集

参照:JavaScriptの計算プログラム

推定検定(t検定、カイ二乗分布、F検定)の簡単な数値例題を示します。
それとともに、私自作の関数の紹介をします。上掲「参照」も表示しながら学習してください。


t分布

平均μ、標準偏差σの正規分布になっている母集団から取り出したn個の標本の平均をμ0、標準偏差をsとすると、
      μ0-μ
   t=─────
     s/√
は、自由度n-1のt分布に従う。

問1 平均の区間推定
   10人の平均身長が 170cm、標準偏差が 9cmであったとき、
   身長平均の95%信頼でのでの信頼区間を求めよ。

 t値の入手
  95%信頼 → 有意水準=0.05 → 片側確率=0.025
  n=10 → 自由度=n-1=9
  t分布表(9, 0.025)= 2.2622

  関数(t分布のt値の計算)
    t = testTvalue(df, p) = testTvalue(9, 0.025) = 2.262

 信頼区間
  上式から 区間 = μ0±(t×s/√)
    n = 10, μ0 = 170,  s = 9,  t = 2.262 を代入
   下限, 上限 = 170±(2.262×9/√10=170±6.4
   =163.6~176.4[cm]

  関数(t検定 平均の区間推定)
    [下限, 上限] = testTvalue(df, p) = testTvalue(9, 0.025) = [ 163.6, 176.4 ]

問2 母平均との差の検定
   問1において、全国での平均身長は μ=164 cm であるという。
   このグループの平均身長は全国平均より高いといえるか。

 差の検定
  「高いか」→片側確率5%
  t=|μ0-μ|/(s/√) = |164-170|/(9/√10 = 2.108
  このt値が自由度9、片側確率5%の値 t(9, 0.05) = 1.833 < 2.108 → 有意水準5%で高いといえる。
  このt値が自由度9、片側確率1%の値 t(9, 0.01) = 2.821 > 2.108 → 有意水準1%では高いとはいえない。

 関数(t検定の標本平均と母集団平均の比較)
  [t0, tp] = testTtest1(μ, n, μ0, σ, side) =  testTtest1(164, 10, 170, 9, "upper") = [2.108, 0.050]
     t0 = 2.108(計算によるt値) tp=0.050(そのときの有意水準, 0.005, 0.01, 0.25. 0.05 のいずれかで表示) 

問3 2変数の平均の比較
   製品Xの標本数(nx)10個の特性の平均(μx)は37、標準偏差σxは4
   製品Yの標本数(ny) 6個の特性の平均(μy)は32、標準偏差σyは3
   であった。Xの特性値ははYよりも大といえるか。有意水準5%

 t値を求める公式
   t0 = (μx - μy)/(σ√(1/nx + 1/ny) 
    ただし σ=√[(dfxσx2 + dfyσy2) / (dfx + dfx)]、
        dfx、dfyは自由度 nx-1, ny-1

   df= dfx+dfy=nx-ny-2=14
   σ=√[(dfxσx2 + dfyσy2) / (dfx + dfy)]=3.674
   μxy=37-32=5
   √(1/nx + 1/ny)=0.516
  t0 =(μxy)/(σ√(1/nx + 1/ny) = 5 /(3.674*0.516) = 2.635
 t分布表から、自由度df=nx+ny-2= 14、 有意水準5%の値
  t分布表(14, 0.05) = 1.761 < 2.635 → 有意水準5%でXはYより大だといえる

 関数(t検定 2変数の平均の比較)
  [t0, tp] = testTtest2(nx, μx, σx, ny, μy, σy, side)
       = testTtest2(10, 37, 4, 6, 32, 3, "upper")
       = [ 2.635, 0.010 ]
  t値は 2.635 であり、有意差1%でX>Yだといえる

カイ二乗検定

分散σ2の正規分布になっている母集団から取り出したn個の標本の分散をs2とすると、
   χ2=(n-1)s2 / σ2
は、自由度n-1のχ2分布に従う。

問1 χ2値の計算
   分散 = σ2 = 6 の母集団から取り出した標本 n = 10(自由度 df = n-1 = 9)の
   分散 = s2 = 4 であるとき、χ2値を求めよ。

  χ2=(n-1)s2 / σ2
    = 9 * 4 / 6 = 6

問2 母分散との検定 χ2値の有意水準
   標本数 n=10 で分散が s2 = 4 であるとき、この分散は
   母集団の分散 σ2 = 6 と差があるかを検定せよ(有意水準 0.05)

χ2値の計算
  問1と同じ → χ2 = 6

有意水準 p=0.05 とするとき、次の3つのケースがある。
  標本のほうが大 上側確率:p = 0.05
  標本のほうが小 下側確率:1-p = 0.95
  差がある    両側確率:上側= p/2 = 0.025, 下側= 1-p/2 = 0.975
 χ2分布表(df, p) から取得
  上側確率:χ2(9, 0.05) = 16.920
  下側確率:χ2(9, 0.95) =  3.325
  両側確率:上側 χ2(9, 0.975) = 2.700, 下側 χ2(9, 0.025) = 19.020
 関数(χ2分布の上側確率)による計算
  上側確率 = testChi2Value(自由度, 上側確率) = testChi2Value(9, 0.05) = 16.920
  下側確率 = testChi2Value(9, 0.95) = 3.325
    両側確率上側 = testChi2Value(9, 0.975) = 2.700
    両側確率下側 = testChi2Value(9, 0.025) = 19.020
 検定結果
  上側確率 16.920 > 6 大きいとはいえない
  下側確率  3.325 < 6 小さいといえる
  両側確率  2.700 < 6 19.020 差があるとはいえない

 関数(χ2検定 母分散との比較)
  p = testChi2Test1(σ2, n, s2) = testChi2Test1(6, 10, 4) = 0.995
  有意水準 0.995 で有意差がある
  (0.995 → 下側確率 → 小さいほうで差がある)

問3 母分散の区間推定
   n=10,s2 = 4 であるとき、母集団の分散σ2の95%信頼区間を求めよ。

 χ2= (n-1)*s22 → σ2 = (n-1)*s22
  両側確率 → 下側=0.025, 上側=0.975
  下限 = (n-1)*s22(9, 0.025) = 9 * 4 / 19.02 = 1.893
  上限 = (n-1)*s22(9, 0.975) = 9 * 4 /  2.70 = 13.33

 関数(χ2検定 母分散の区間推定)
  [下限, 上限] = testChi2IE(n, s2, p) = testChi2IE(10, 4, 0.05) = [1.893, 13.333]

問4 2×2分割表
   2x2の分割表が与えられたとき、層や特性に差があるかどうかを検定する
       特性A 特性B
    層X a = 18 b = 10
    層Y c = 12 d = 17

 公式
             (ad-bc)2 (a+b+c+d)
    χ = ──────────
            (a+b)(c+d)(a+c)(b+d)
  (a~dに10よりも小さい値があるときは、Yatesの補正をするが、ここでは省略)。

 公式から
  χ = 34596 * 57 / 657720 = 2.998
 χ2分布表
  自由度 df=(2-1)(2-1)=1
   p =    0.1,  0.05, 0.025,  0.01,  0.005
    χ[1] = 2.706, 3.841, 5.024, 6.635, 7.879 
   2.706 < 2.998 < 3.841 なので、5%では差があるとはいえないが、10%では差があるといえる。

 関数(χ2検定 2×2分割表 Yatesの補正も内蔵)
  p = testChi2cont2x2(a, b, c, d) = testChi2cont2x2(18, 10, 12, 17) = 0.1

F検定

二つの母集団AとBからの標本の個数をna、nb、分散をsa2、sb2とすると、分散比
   F=sa2/sb2
は、自由度(na-1、nb-1)のF分布に従う。

問1 F分布表からの5%点と1%点の検索
   F分布表から横自由度=5,縦自由度=10の5%点と1%点を求めよ。

 通常、F分布表では上側累積確率 P が5%と1%の表が与えられている。
  例:F0.05(5, 10) = 4.735
 下側累積確率は、
  F1-p[横自由度, 縦自由度」= 1/Fp(縦自由度, 横自由度)
  例:F0.95(5, 10) = 1/F0.05(10, 5) = 1/4.735 = 0.211

 関数(F検定 F分布表)f5:p=0.05,  f1: p=0,01
  上側累積確率
    [f5, f1] = testFvalue(横自由度, 縦自由度) = testFvalue(5, 10) = [3.326, 5.636]
  下側累積確率
    [f5, f1] = testFvalueLower(横自由度, 縦自由度) = testFvalueLower(5, 10) = [0.211, 0.100]

問2 分散比の上側検定 工程Aの分散>工程Bの分散 といえるか
   工程A na=10  sa2=6
   工程B nb=16  nb2=2

分散比:F=F=sa2/sb2=6/2=3>1
  上側検定なので、F0.05との比較
  自由度(横)na-1=9、自由度(縦)nb-1=15
  (分散比の分子の側を横(前)、分母の側を縦(後)にする)
  F0.05分布表(9, 15) = 2.588 < 3 → 工程Aは工程Bよりも分散が大きいといえる

 関数(F検定 2変数分散比の検定)
    p = testFtest2(na, sa2, nb, nb) = testFtest2(10, 6, 16, 2) = 0.05

問3 分散比の下側検定 工程Aの分散<工程Bの分散 といえるか
   工程A na=16  sa2=2
   工程B nb=10  nb2=6

分散比:F=F=sa2/sb2=2/6=0.333<1
  下側検定なので、F0.95との比較
  自由度(横)na-1=9、自由度(縦)nb-1=15
  F0.95分布表(9, 15) = 1/F0.05分布表(15, 9) = 1/2.588 = 0.386 > 0.333 → 工程A<工程Bといえる

 関数(F検定 2変数分散比の検定) 問2と同じ関数
    p = testFtest2(na, sa2, nb, nb) = testFtest2(16, 2, 10, 6) = 0.95
  (p=0.95 とは下側検定であり、有意水準は 1-p=0.05 であることを示す)