Web教材一覧>
統計・確率
確率分布の基礎
確率分布関連用語
- 確率変数(Random Variable)
- ある属性について標本がいろいろな値を取り得るとき、各標本に対してそれのとる値を対応させる変数Xを確率変数といいます。
- ヒストグラム(Histogram)
- 確率変数には、サイコロの目のように離散型変数と、身長のように連続型変数があります。離散型変数では X1=1、X2=2のように付番することができます。連続型変数では、150~160、160~170のように範囲に分けて、X1=155、X2=165のように付番できます。このX1、X2、… を、標識あるいは代表値といいます。
左図のように、標本を各標識により区分し、その発生頻度を棒グラフにしたのがヒストグラムです。
- 確率(Probability)
- 全標本数=1として、各発生頻度をその割合とすれば、縦軸は標識が発生する確率(probability)になります。いいかえれば、標本を1つ取り出したとき、それがある標識になる(あることがらがおこる)と期待される程度を数で表したものを、そのことがらの起こるが確率です。
起こりうる場合が全部でn通りあり、どの場合が起こることも同様に確からしいとき、あることがらがおこる場合がa通りあるなら、そのことがらが起こる確率は p=a/n になります。
- 確率分布(Probability Distribution)
- 確率密度関数(probability density function、PDF)
- ダイアグラムで確率変数を連続的変数だとすれば、右図の山形のグラフになります。このとき、ダイアグラムの「確率」は赤い部分の面積になり、連続的変数の1点での高さを確率密度といいます。
数学的にいえば、X=tにおける確率密度は F(t)=pX=t であり、確率密度関数は F(X) となります。
確率分布は、F(X) をグラフにしたものです。
- 累積分布関数(Cumulative-Distribution function、CDF)
- -∞<X<tの確率、すなわち上図の青の面積を縦軸にとったものです。
代表的な確率関数
https://sites.google.com/site/techdmba/distribution
https://statistics.co.jp/reference/Toukeidatakaiseki_Nyumon/datakaiseki_nyumon3.pdf