Web教材一覧>
統計・確率
推測統計学
表示が不十分なときは、□をクリックすると、その部分が別ウインドウに表示されます。
学習のポイント
推定や検定など、推測統計学(推計統計学ともいう)の基礎について学習します。
この分野は、確率・統計の応用分野ですので、「確率・統計」および「確率分布」の知識が前提になります。試験対策では、「多変量解析の基礎」および「2×2分割表」と合わせて学習するとよいでしょう。
キーワード
推測統計学、推定、検定、区間推定、信頼区間、帰無仮説、棄却、正規分布、t分布、χ2分布、F分布
推定と検定の概要□
推定・検定の代表的な例と統計分布
正規分布と推定・検定□
t分布と推定・検定□
χ2と推定・検定□
χ2検定の応用
χ2検定の応用として、観測値(実験値)と理論値(計算値)との間に差があるかどうかを検定することを適合度検定といいます。これに関しては「適合度検定」で取り扱います。
また、2つの因子がそれぞれ2つの水準をもつとき、差があるかどうかをχ2検定で簡単に検定する方法があります。これに関しては「2×2分割表」で取り扱います。
F分布と推定・検定□
分散分析
主としてF検定を応用した分野に分散分析があります。これに関しては別章「分散分析」で取り扱います。
Excelによる統計分布値の計算
Excelには、これらの分布での確率と値を求める関数があります。そのテンプレートがstat-suisoku-keisanにあります。ダウンロードして利用してください。
理解度チェック
第1問
- 全国の成人男性の平均身長を、無作為に選んだサンプルから推定する場合、全国の成人男性のことを元集団といい、選んだサンプルのことを見本という。
☆
× 元集団→母集団、見本→標本
- 全国の成人男性の平均身長を推定する場合、たとえばバレーボールの選手を標本にしても、その標本数が十分に大きければ、かなりよい精度で推定することができる。
☆
× バレーボールの選手は身長が高いので、全国の成人男性を代表していない。
標本を選ぶときには、できるだけ母集団を代表するように選択する→無作為抽出
- 推測統計学では、母集団の特性値を推定する場合、幅をもった区間で推定する。
☆
○
- 区間推定では、標本の標準偏差が大きいと、区間の幅が大きくなる。区間の幅を小さくするためには、標準偏差が小さくなるように標本を選ぶことが大切である。
☆
× 前半は正しい。後半は誤り。無作為ではなくなる。
- 95%信頼区間よりも99%信頼区間のほうが幅が広くなる。
☆
○
- 母集団の特性値が、ある値よりも大きいかどうかを、標本により調べることを検査という。
☆
× 検査→検定
- 検定では、帰無仮説(H0)を仮定して、標本がそれに合致する確率を計算し、その確率が有意水準より小さければ、その仮定が棄却され、対立仮説(H1が成立すると結論する。
☆
○
- 有意水準5%で検定した結果、帰無仮説(H0)が棄却できなかったときは、95%の確率で、帰無仮説が成立すると結論する。
☆
× 95%の確率で帰無仮説を棄却することができなかったということであり、帰無仮説が成立するということではない(グレーゾーンの場合がある)。
- 標本数が決まれば自由度が決まる。
☆
○ 自由度φ=標本数n-1
- 「試行回数×1回の試行による発生確率」が大きいときは、2項分布は正規分布で近似できる。
☆
○
- 母集団の平均を標本から推定するには、F分布表が用いられる。
☆
× F分布表→t分布表
- 二つの母集団から取り出した標本の平均の差の検定を行うときには、χ2分布表が用いられる。
☆
× χ2分布表→t分布表
- 母集団の分散を標本から推定するには、t分布表が用いられる。
☆
× t分布表→χ2分布表
- 二つの母集団から取り出した標本の分散の比の検定を行うときには、F分布表が用いられる。
☆
○
- t分布は左右対称になるが、χ2分布は左右対称ではない。
☆
○
- ある製品の重量は平均μ=20、標準偏差σ=2のように管理されている。重量X=25の製品が見つかった。重量が大きくなるような異常が発生したと考えるべきかどうか、有意水準5%で検定せよ。
☆
例題n・2参照
Z=(X-μ)/σ=(25-20)/2=2.5
正規分布表より、上側5%のZ0.05=1.64
Z>Z0.05 →異常発生
- 100問からなる4択問題がある。全然知識のない人が無作為に解答したとして、30点以上を得る確率は何%になるか。
☆
例題n・3参照
n=100、p=0.25
μ=np=25
σ=√np(1-p)=√100×0.25×0.75=4.33
の正規分布で近似
Z=(X-μ)/σ=(30-25)/4.33=1.154
正規分布表より、1.154に対応する確率は0.125→12.5%
- ある農場から標本を10個選んで重さを測定したところ、平均は120グラムで、標準偏差は20グラムであった。この農場全体での重さの95%信頼区間を求めよ。
☆
例題t・1参照
標本数=10→自由度=9、 95%信頼→片側確率は2.5%
t分布表から、t0.025=2.262
s/√n=20/√10=6.325
μ0±(t0.025×s/√n)=120±14.3
95%信頼区間:105.7~134.3[グラム]
- 2つの農場AとBから標本を採取した。Aのほうが平均が大だといえるか。
標本数 平均 標準偏差
A na=10 μa=120 sa=20
B nb=17 μb=103 sb=10
☆
例題t・3参照
s=√{(na-1)sa2+(nb-1)sb2)}/{(na-1)+(nb-1)}
=√(9×400+16×100)/(9+16)
=14.4
t=(μa-μb)/{s√(1/na)+(1/nb)}
=(120-103)/(14.4√(1/10)+(1/17))
=2.0
自由度=(10-1)+(17-1)=25
t分布表より
t0.05=1.7 →有意水準5%ならば、棄却される
t0.01=2.5 →有意水準1%ならば、棄却されない
- ある部品の寸法は、標準偏差2.2[mm]で管理されているという。ところが、10個の部品を抜取検査をしたところ、その標準偏差は2.5[mm]であった。管理が適切に行われているといえるか。
☆
例題c・2参照
母集団の分散σ2=2.22=4.84
標本の分散s2=2.52=6.25
χ2=(n-1)s2/σ2=9×6.25/4.84=11.62
χ2分布表(自由度=9、上側検定)
有意水準5%:χ20.05=16.91
χ2<χ20.05 →棄却されない
(この程度の標本数、標準偏差の違いでは、管理が不十分だと決めつけることはできない)。
- 取引先A社とB社から納入部品の標本提供を受けた。
標本数 分散
A na=8 sa2=2.2
B nb=6 sb2=2.5
これより、A社のほうが品質管理のレベルが高い(分散が小さい)といえるか。
☆
例題f/2参照(下側検定)
F=sa2/sb2=2.2/2.5=0.88
自由度(5,7)のF0.05=3.971
→自由度(7,5)のF0.95=1/3.971=0.2518
F>F0.95 →棄却されない
(この程度の標本数、分散の違いでは、σa2<σb2だと決めつけることはできない)。
過去問題:
「統計的方法、推計統計学」