Web教材一覧統計・確率

確率分布の基礎


確率分布関連用語

確率変数(Random Variable)
ある属性について標本がいろいろな値を取り得るとき、各標本に対してそれのとる値を対応させる変数Xを確率変数といいます。
ヒストグラム(Histogram)
確率変数には、サイコロの目のように離散型変数と、身長のように連続型変数があります。離散型変数では X1=1、X2=2のように付番することができます。連続型変数では、150~160、160~170のように範囲に分けて、X1=155、X2=165のように付番できます。このX1、X2、… を、標識あるいは代表値といいます。
 左図のように、標本を各標識により区分し、その発生頻度を棒グラフにしたのがヒストグラムです。
確率(Probability)
全標本数=1として、各発生頻度をその割合とすれば、縦軸は標識が発生する確率(probability)になります。いいかえれば、標本を1つ取り出したとき、それがある標識になる(あることがらがおこる)と期待される程度を数で表したものを、そのことがらの起こるが確率です。
 起こりうる場合が全部でn通りあり、どの場合が起こることも同様に確からしいとき、あることがらがおこる場合がa通りあるなら、そのことがらが起こる確率は p=a/n になります。
確率分布(Probability Distribution)
確率密度関数(probability density function、PDF)
ダイアグラムで確率変数を連続的変数だとすれば、右図の山形のグラフになります。このとき、ダイアグラムの「確率」は赤い部分の面積になり、連続的変数の1点での高さを確率密度といいます。
数学的にいえば、X=tにおける確率密度は F(t)=pX=t であり、確率密度関数は F(X) となります。
確率分布は、F(X) をグラフにしたものです。
累積分布関数(Cumulative-Distribution function、CDF)
-∞<X<tの確率、すなわち上図の青の面積を縦軸にとったものです。

代表的な確率関数

https://sites.google.com/site/techdmba/distribution https://statistics.co.jp/reference/Toukeidatakaiseki_Nyumon/datakaiseki_nyumon3.pdf