Web教材一覧統計・確率

確率分布の例題集

参照:JavaScriptの計算プログラム

確率分布(正規分布、二項分布、二項分布、負の二項分布、幾何分布、超幾何分布、指数分布、ポアソン分布)の簡単な数値例題を示します。
それとともに、私自作の関数の紹介をします。上掲「参照」も表示しながら学習してください。


正規分布

問1 成人男性の身長が平均170cm、標準偏差10cmだとわかっている。身長が180cmである確率は

 Z=(x-μ)/σ は平均0、分散1の標準正規分布に従う
 Z:変位。変位Zのおける確率密度 P(z),  -∞~Zの累積確率 S(z) は、正規分布表などから知ることができる
   Z  P(z)  S(z)
     -3   0.004 0.001 
   -2.58 0.004 0.995  両側1%
   -2.33 0.026 0.99   下側1%
     -2   0.054 0.023 
   -1.96 0.058 0.025  両側5% 
   -1.64 0.104 0.05   下側5%
     -1   0.242 0.159 
      0   0.399 0.5 
   1   0.242 0.841
   1.64 0.104 0.95   上側5%
   1.96 0.058 0.975  両側5% 
      2   0.054 0.977 
   2.33 0.026 0.99   上側1%
   2.58 0.004 0.995  両側1%
      3   0.004 0.999 
 Z=(180-170)/10=1 → P(1) = 0.242 → 24.2%

 関数(正規分布の確率密度関数)P(1) = distNormalDen(x, μ, σ) = distNormalDen(180, 170, 10) → p=0.024

問2 平均170cm、標準偏差10cmであるとき、180cm以上である確率は

 Z=(x-μ)/σ=(180-179)/10=1
 低いほうの累積確率 S(1) = 0.841 → 高いほうの確率 = 1-0.841 = 0.159 ・・・答

 関数(正規分布の累積確率関数)S(1) = distNormalCum(x, μ, σ) = distNormalCum(180, 170, 10) → s=0.841

問3 高いほうの5%は何cm以上か

 上側5% → Z= 1.64
 Z=(x-μ)/σ → x=μ+Zσ = 170 + 1.64*10 = 186.5

 関数(正規分布の確率密度関数の逆関数)上から5%=下から95%
  x = distNormalInv(p, μ, σ) = distNormalDen(0.95, 170, 10) → x = 186.5

問4 全体の90%はどの範囲にあるか

 数表から
  小さいほうの5% → 両側2.5% → Z=-1.96 → xmin=μ+Zσ = 170 - 1.96*10 = 150.4
  大きいほうの5% → 両側2.5% → Z=1.96 → xmax=μ+Zσ = 170 + 1.96*10 = 189.6

 関数から
   関数(正規分布の確率密度関数の逆関数)xmin = distNormalDen(0.025, 170, 10) → xmin = 150.4
   関数(正規分布の確率密度関数の逆関数)xmax = distNormalDen(0.975, 170, 10) → xmax = 189.6

 答 150.4~189.6

問5 最適仕入量(新聞売り子の問題)
   ある商品の需要は、平均100個、標準偏差=10の正規分布に従う。
   品切損失単価=8円/個、 売残損失単価=2円 であるとき、機会損失を最小にする最適仕入量を求めよ。

 機会損失=品切損失  (品切損失単価 * 品切個数、 品切確率=-∞~仕入量の累積確率)
    =売残損失  (売残損失単価 * 売残個数、 売残確率=仕入量~∞の累積確率=1ー品切確率)
 最適仕入量では、品切損失=売残損失
  → 品切損失単価 * 品切確率 = 売残損失単価 * (1-品切確率)  
  → 品切確率 = 売残損失単価 / (売残損失単価 + 品切損失単価)
         = 8 / (8 + 2) = 0.8
 最適仕入量 = 平均 + 累積確率0.6のZ * 標準偏差
       = 100 + 0.84 * 10 = 108.4

 関数(正規分布の累積確率の逆関数)
  最適仕入量 = distNormalInv(p, μ, σ) = distNormalInv(0.6, 100, 10) = 108.4

三角分布
 正規分布では、単純にするため需要量=-∞~∞とするが非現実的
 → 三角分布(xmin = 75, xmax = 125, xmod = 100)とすると(平均 = 100, 標準偏差 = 10.2)

 関数(三角分布の累積確率の逆関数)
  最適仕入量 = distTriInv(s, xmin, xmax, xmod) = distTriInv(0.8, 75, 125, 100) = 109.2

問6 必要標本数
   ある花の10個を調べたら赤い花が4個であった。この花全体で赤い確率が40±10%
   とするには、最低何個の標本を調べる必要があるか(有意水準5%)

中心極限定理:標本数 n が十分にに大きいとき,標本比率 p0 は近似的に正規分布 (p, p(1-p)/n) に従う。
 必要な標本数
  n = (Z/Perr)2 * p(1-p)
    Perr;確率誤差 = | p0 - p | 
    Z;正規分布の変位。 両側有意水準 pt = 0.05 のとき Z = 1.96、 pt = 0.01 のとき Z = 2.58
   問題文 Perr = 0.1、Z = 1.96 を代入
  n = (1.96/0.1)2 * 0.4*(1-0.4) = 93 ・・・答

 関数(中心極限定理による必要標本数)
  [n5, n1] = distCltNmin(p, Perr) = distCltNmin(0.4, 0.1) = [93, 160]
    有意水準 = 0.01 では、最低 160 の標本が必要
 関数(標本数を与えたときの許容確率誤差)
  [Perr5, Perr1] = distCltPerr(0.4, 50) = [0.136, 0.179]
    標本が50のとき有意水準5%では 30±14% になる。

2項分布

問1 硬貨を2回投げて表が1回出る確率

 場合の数による計算
        表  裏
    1回目  〇  ×
   2回目  ×  〇
  全体の場合の数=4、 題意に合致する場合の数=2
  確率=2/4=0,5

 二項分布の密度関数による計算
  ある事象が起こる確率がpの試行をn回行ったとき、その事象がx回起こる確率P(x)
   P(x)=nxx(1-p)n-x
   n=2, x=1, p=0.5 を代入すると、
   P(x)=211/21(1-1/2)1
      =2 * (1/2)2
      = 2/4
      = 0.5 ・・・(答)

 関数(二項分布の確率密度関数)Px = distBinDen(1, 2, 0.5) → Px = 0.5

問2 サイコロを5回投げたとき1の目が3回出る確率は

   P(x)=nxx(1-p)n-x
 に、n=5, x=3, p=1/6 を代入すると、
   P(x)=53(1/6)3(5/6)2
      = 0.161 ・・・(答)
 関数(二項分布の確率密度関数)Px = distBinDen(3, 5, 1/6) → Px = 0.161

問3 硬貨を2回投げて表が1回以上出る確率

 問1で、 表がx枚である確率を計算する。
     確率密度
   x  (x)
   0  0.25 表が0枚 
   1  0.5  表が1枚 ┐
   2  0.25 表が2枚 ┴ 合計 = 0.75 (1-0.25) ・・・答

 関数(二項分布の累積確率関数)s = distBinCum(1, 2, 0.5) → S=0.75

問4 サイコロを5回投げたとき1の目が3回以下の確率は

 問1で、 表がx枚である確率を計算する。
     確率密度 累積確率
   x P(x)  S = ∑P(x)
   0 0.402  0.402 ┐
   1 0.402  0.804 ├ 3回以下の確率
   2 0.161  0.965 │
   3 0.032  0.997 ┘
   4 0.003  1
   5 0.000  1
  「3回以上」ならば、1-2回以下 = 1-0.965 = 0.035

 関数(二項分布の累積確率関数)s = distBinCum(3, 5, 1/6) → S=0.997 3回以下の確率
 「3回以上」ならば、s = 1 - distBinCum(3-1, 5, 1/6) = 0.035

問5 硬貨を投げて表が2枚以上になる確率を90%にするには最低何回投げればよいか
   =硬貨を投げて表が1枚以下になる確率が10%以下になるには最低何回投げればよいか

 nをいろいろ変えて計算してみる
  6回投げたとき
    すべてが裏である確率 (1/2)6
    1枚が裏である確率  6*(1/2)6
    合計 = 7*(1/2)6 = 7/32 = 0.212 > 0.10
  7回投げたとき
    すべてが裏である確率 (1/2)7
    1枚が裏である確率  7*(1/2)7
    合計 = 8*(1/2)7 = 1/16 = 0.063 < 0.10 答は7回

 二項分布の累積確率関数
  1回の試行の発生確率が p のとき、n 回の試行で発生回数が x 回以下の確率は 
      s = distBinCum(x, n, p)
        = distBinCum(1, n, 1/2)
      n   P()  s()
      2   0.5    0.75
      3   0.375  0.5
      4   0.250  0.313
      5   0.156 0.188
      6   0.094 0.109
      7   0.055 0.063 < 0.10

問6 硬貨を3回投げたとき初めて表が出る確率

  数え上げ
  1回目は裏 1-1/2
  2回目は裏 1-1/2
  3回目は表  1/2
   (1-1/2)*(1-1/2)*1/2 = 1/8 = 0.125

 負の二項分布
  ある事象が起こる確率がpのとき、n回投げたときに、その事象がはじめてx回発生する確率P(n)
   P(n)=n-1x-1x(1-p)n-x20(1/2)1(1-1/2)2
           = 1/8  = 0.125

 関数(負の二項分布の確率密度関数)Pn = distBinNegDen(1, 3, 0.5) → Pn = 0.125

問7 サイコロを5回投げたとき、初めて1の目が3回になる確率は

 負の二項分布
   P(n)=n-1x-1x(1-p)n-x42(1/6)3(5/6)2
           = 6 * 52 / 65 = 0.0193

 関数(負の二項分布の確率密度関数)Pn = distBinNegDen(3, 5, 1/6) → Pn = 0.0193

幾何分布

発生確率pの事象がはじめて発生したときの試行回数nの確率分布
  確率密度: Pn = (1-p)n-1*p
  累積確率: s  = 1-(1-p)n
  累積確率の逆関数:n = log(1-s) /log(1-p)

問1 硬貨を投げて3回目で初めて表が出る確率は

 確率の定義から
  2回目まではすべて裏である確率;(1/2)2
    3回目で表になる確率:1/2
    合計: (1/4)*(1/2) = 1/8 = 0.125 ・・・答

 確率密度: Pn = (1-p)n-1*p
                = (1-1/2)3-1*(1/2)
                =  = 1/8 = 0.125

  関数(幾何分布の確率密度関数)Pn = distGeoDen(n, p) = distGeoDen(3, 1/2) = 0.125

問2 サイコロを3回目に投げたときにはじめて1の目が出る確率

 確率密度: Pn = (1-p)n-1*p
                = (5/6)3-1*(1/6)
                =  = 25/216 = 0.116

  関数(幾何分布の確率密度関数)Pn = distGeoDen(n, p) = distGeoDen(3, 1/6) = 0.116

問3 硬貨を投げて初めて表が出るのが3回目から8回目の間である確率

  確率密度 P(3) + P(4) + … + p(8) としてもよいが、
   n P(n)
   3 0.125
   4 0.063 
   5 0.031 
   6 0.016 
   7 0.008 
   8 0.004
    合計 0.286
  累積確率: s(n)  = 1-(1-p)n = 1-(1/2)n
 を用いて、S(8) - S(2) を求めるほうが簡単です。
      S(8) - S(2) = (1/2)2 - (1/2)8
                  = 1/4 - 1/256 = 0.246
 とするほうが簡単です。

  関数(幾何分布の確率密度関数)
   S(8) = distGeoCum(8, 1/2) = 0.996
   S(2) = distGeoCum(2, 1/2) = 0.750
      0.996 - 0.750 =  0.246

問4 硬貨を投げて初めて表が出る確率が90%になるには、何回投げればよいか

 n回投げたときに初めて表が出る確率 P(n),
 n回までに初めて表が出る確率 S(n)
   n P(n)  S(n) 
   1 0.5    0.5
   2 0.25   0.75
   3 0.125  0.875  3回では90%未満
   4 0.063  0.938 4回では90%以上
   5 0.031  0.969

 累積密度の逆関数
      n = log(1-s) /log(1-p) = log(0.1) / log(0.5) = 3.32

  関数(幾何分布の累積密度関数の逆関数)n = distGeoInv(s, p) = distGeoInv(0.9, 0.5) = 3.32

問5 サイコロを投げて初めて1の目が出る確率が50%になるには、何回投げればよいか

 累積密度の逆関数
   n = log(1-s) /log(1-p) = log(0.5) / log(5/6) = -0.301 / --0.0792 = 3.8
    4回投げればよい

  関数(幾何分布の累積密度関数の逆関数)
      n = distGeoInv(s, p) = distGeoInv(0.5, 1/6) = 3.8

超幾何分布

確率密度関数:袋の中にAがa個、Bがb個入っている。α+β個を取り出したとき、Aがα個、Bがβ個である確率
   P(α) = aα * bβa+bα+β
累積密度関数;α=0~αである確率(Aがα以下である確率)
   S(α) = ΣP(α)(α=0~α)

問1 袋の中に赤玉が4個、白玉が3個ある。2個取り出したときに赤玉が1個、白玉が1個である確率は

 場合の数
   全体 7個から2個を取り出す場合の数 = 72 = 21
   赤玉 4個から1個を取り出す場合の数 = 41 = 4
   白玉 3個から1個を取り出す場合の数 = 31 = 3
      確率 = 4 * 3 / 21 = 4/7 =  0.541

 確率密度関数
   P(1) = 41 * 3172
      =  4 * 3 / 21 = 4/7 =  0.541

 関数(超幾何分布の確率密度関数)
   P(1) = distHyperGeoDen(a, b, α, β) = distHyperGeoDen(4, 3, 1, 1) = 0.571

問2 袋の中に赤玉が5個、白玉が4個ある。3個取り出したとき、赤玉が1個以内である確率

 確率密度関数
  赤玉が0個 P(0) = 50 * 4393 = 4/84
  赤玉が1個 P(1) = 51 * 4293 = 30/84
  合計 = 4/84 + 30/84 = 34/84 = 0.405

 関数(超幾何分布の確率密度関数)
    P(0) = distHyperGeoDen(5, 4, 0, 3) = 0.048
    P(1) = distHyperGeoDen(5, 4, 1, 2) = 0.357  合計 = 0.405

 関数(超幾何分布の累積確率関数)
  S(1) = distHyperGeoCum(a, b, α, β) = distHyperGeoCum(5, 4, 1, 2) = 0.405

  赤玉が2個以上である確率 = 1 - 赤玉が1個以内である確率

問3 袋の中に赤玉が5個、白玉が4個ある。赤玉が2個以上出る確率が80%以上にするには最低何個取り出す必要があるか
  =赤玉が1個以下である確率を20%以下にするには、取り出す回数を最大何個に抑える必要があるか
   (1個取り出すときは、必ず赤玉は1個以下、5個取り出せは赤玉が1個、6個ならば赤以上なら赤玉は2個以上になる)

 数え上げ
  2個取り出すとき
   赤 白     (5/9)*(4/8)        = 20/72
   白 赤     (4/9)*(5/8)        = 20/72
   白 白     (4/9)*(3/8)        = 12/72
                            52/72 = 0.722 > 0,2
  3個取り出すとき
   赤 白 白   (5/9)*(4/8)*(3/7)     = 60/504
   白 赤 白   (4/9)*(5/8)*(3/7)     = 60/504 
   白 白 赤   (4/9)*(3/8)*(5/7)     = 60/504 
   白 白 白   (4/9)*(3/8)*(2/7)     = 24/504
                            204/504 = 0.405 > 0.2
  4個取り出すとき
   赤 白 白 白 (5/9)*(4/8)*(3/7)*(2/6) = 120/3024
   白 赤 白 白 (4/9)*(5/8)*(3/7)*(2/6) = 120/3024
   白 白 赤 白 (4/9)*(3/8)*(5/7)*(2/6) = 120/3024
   白 白 白 赤 (4/9)*(3/8)*(2/7)*(5/6) = 120/3024
   白 白 白 白 (4/9)*(3/8)*(2/7)*(1/5) =  24/3024
                        504/3020 = 0.167 < 0.2

 関数(超幾何分布の累積確率関数)
  S(n) = distHyperGeoCum(5, 4, 1, n-1) ≦ 0.2
   n S(n)        1-S(n) 赤が2個以上の確率
   2 0.722 > 0,2   1-0.722 = 0.278 < 0.8
   3 0.405 > 0,2   1-0.405 = 0.595 < 0.8
   4 0.167 < 0.2   1-0.167 = 0.833 > 0.8

 4個取り出すと赤が1以下である確率は20%になる
 4個取り出すと赤が2以上である確率は80%になる

問4 袋の中に9個の玉があるが赤玉・白玉の個数は不明。3個取り出したとき2個が赤玉だった。袋の中の赤玉の個数は

 関数(超幾何分布の確率密度関数)赤玉がx個のときに、取り出した赤玉数が2個である確率
    P(x) = distHyperGeoDen(a, b, α, β) = distHyperGeoDen(x, 9-x, 2, 1)
 関数(超幾何分布の累積確率関数)赤玉がx個のときに、取り出した赤玉数が1個以下である確率
  S(x) = distHyperGeoCum(a, b, α, β) = distHyperGeoCum(x, 9-x, 1, 2)
  (赤玉がx個のときに、取り出した赤玉数が1個以下である確率は 1-S(x) )
   
  x 9-x  P(x)  S(x)   1-S(x)
  2  7  0.083 0.917 0.083
  3  6  0.214 0.774 0.226
  4  5  0.357 0.595 0.405
  5  4  0.476 0.405 0.595
  6  3  0.536 0.226 0.774
  7  2  0.500 0.083 0.917
  8  1  0.333 0.   1. 

 3個取り出したとき2個が赤玉
  P(6) = 0.536   最もありそうなのは袋の中の赤玉が6個のとき
  S(4) = 0.595  袋の中に赤玉が4個以下だと、3個取り出したとき2個が赤玉になる確率は50%以下
  1-S(5) = 0.595 袋の中に赤玉が5個以上あれば、3個取り出したとき2個が赤玉になる確率は50%以上

問5 袋の中に9個の玉があるが赤玉・白玉の個数は不明。取り出した玉は戻さない
   1個ずつ取出し3回目に初めて赤玉が出た。袋の中に赤玉が2個以上ある確率は

 袋の中に赤玉がX個、白玉が9-x個あるとする。
  1回目が白で2回目も白である確率 = (9-x)/9 * (8-x)/8
  さらに3回目が赤である確率 = p(x) = (9-x)/9 * (8-x)/8 * x/7

  x P(x) 
  1 (8/9)*(7/8)*(1/7) = 56/504 = 0.111  赤玉が1個のとき
  2 (7/9)*(6/8)*(2/7) = 84/504 ┐
  3 (6/9)*(5/8)*(3/7) = 90/504 │0.889  赤玉が2個以上のとき
  :     :         │
  7 (2/9)*(1/8)*(7/7) = 14/504 ┘

指数分布

  λ:単位時間中にある事象が発生する平均回数
  確率密度;事象の発生間隔がt単位時間である確率
    P(t) = λ*e(-λ*t)
    累積確率: t=0~t の間に事象が発生する確率
    S(t) = 1-e(-λ*t)
    累積確率の逆関数;累積確率が p となる t の値
    t = -(1/λ)log(1-p)

問1 客の到着頻度は平均1時間にλ=2人(平均間隔=0,5時間/人)だとわかっている。発生間隔が1時間である確率

 P(t)にλ=2、t=1を代入
  P(1) = 2*e(-2) = 2*0.135 = 0.271
 関数(指数分布の確率密度関数)
  p(1) = distExpDen(t, λ) = distExpDen(1, 2) = 0.271

問2 λ=2のとき、客が来てから1時間以内に次の客が来ない確率

 S(t) にλ=2、t=1を代入
  S(1) = 1-e(-λ*t) = 1 - e(-2) = 0.865

 関数(指数分布の累積確率関数)
  S(1) = distExpCum(t, λ) = distExpCum(1, 2) = 0.865

問3 λ=2のとき、90%の確率で「何分以内に客がこない」といえるか

  t にλ=2、p=0.9 を代入
   t = -(1/2)log(0.1) = -(1/2)*(-2.30) = 1.15
 関数(指数分布の累積確率関数の逆関数))
   t = distExpInv(p, λ) = distExpInv(0,9, 2) = 1.15

ポアソン分布

  λ:単位時間中にある事象が発生する平均回数
  確率密度;単位時間中にその事象がx回発生する確率
     P(x) = (λx/x!)*e-λ
    累積確率: 単位時間中に事象の発生がx回以下の確率
    s(x) = s(x-1) + p(x)
    累積確率の逆関数;S(x) ≦ p である最大のx

問1 客の到着頻度は平均1時間にλ=2人(平均間隔=0.5時間/人)だとわかっている。1時間に4人の客が来る確率

 P(x) にλ=2,x=4を代入
  P(4) = (24/4!)*e-2 = 16 / 24 * 0.135 = 0.09
 関数(ポアソン分布の確率密度関数)
    P(4) = distPoissonDen(x,λ) = distPoissonDen(4, 2) = 0.09

問2 λ=2のとき、1時間に来る客が4人以下である確率

  確率密度から計算
  P(0) = 0.135
  P(1) = 0.271
  P(2) = 0.271
  P(3) = 0.180
  P(4) = 0.090
  合計 = 0.947
 関数(ポアソン分布の累積確率関数)
  S(4) = distPoissonCum(x,λ) = distPoissonCum(4, 2) = 0.947

問3 λ=2のとき、90%の確率で1時間に来る客の数

  S(2) = 0.677 2人以下の確率
  S(3) = 0.857 3人以下の確率 < 0.9
  S(4) = 0.947 4人以下の確率 > 0.9

 関数(ポアソン分布の累積確率関数の逆関数)S(x) ≦ p である最大のx
  x = distPoissonInv(s,λ) = distPoissonInv(0.9, 2) = 3
    x = 3 までは S(x) ≦ 0.9   90%を超えるのは x = 4