スタートページ>
歴史>
経営数学
統計的手法の歴史
統計的手法の歴史
~1900年 黎明期
「統計」は。古代文明の頃からあったが、その統計は「人口調査」などの分野であった。
ここで対象にする数学的な確率統計は、1800年代からである。1800年代末には初等統計学はほぼ確立していた。
- 確率の概念
1654年 フェルマーとパスカル、賭け金の公平な分配問題について文通
- 誤差理論
1722年 ロジャー・コーツ 誤差の理論の定式的な研究
- 最小二乗法
1805年 ルジャンドルによる発表
- 正規分布
1875年頃 パース、ゴルトン、レキシスの3人が独立に発表
- 標準偏差、相関係数、回帰係数
1888年 フランシス・ゴルトン 概念の導入
1893年から1904年 ピアソン 確立
1900年代前半
1900年代前半に基本的な統計的手法(多変量解析、検定も含む)が確立した。
- 相関分析
1900年前後 ユールら 経済研究に適用
- ピアソンのカイ二乗検定
1900年 ピアソン
- スチューデントのt検定
1908年 ゴセットにより発表/li>
- 実験計画法
1920年代 フィッシャー 農学試験から着想して発展させた
1925年 フィッシャー 『研究者のための統計的方法』出版
1935年 フィッシャー 『実験計画法』出版
- F検定
1934年? スネデカー
- 帰無仮説検定法
1928年 エゴン.ピアソン、ネイマン 帰無仮説と対立仮説
- 判別分析
1936年 フィッシャー 線形判別分析を発表
- 主成分分析
1901年 ピアソンによる導入
1930年代 ホテリング 主成分分析の名称
- 因子分析
1904年 スピアマンにより創案
- 数量化理論
1940年代後半から50年代 林知己夫により開発
1900年代後半
手法の高度化も進んだが、コンピュータの出現と性能向上に伴い、統計等のソフトウェアが急速に普及した。単なる計算処理だけでなく、操作の容易性、出力の視覚化などが進んだ。
- クラスター分析(k-means法)
1957年 ステインハス、発表
1967年 マックウィーン k-meansと命名
- ベイズ理論
1761年にベイズの定理発表。当時はあまり注目されなかった。
1931年、ラムゼイ 主観的確率の考え方の提唱
1954年、サヴェッジ ベイズ確率・ベイズ主義として確立
- FORTRAN
1957年 IBMのバッカス開発 科学技術計算用プログラム言語
1958年以降 統計計算のサブルーチンがアドオン提供進む
- SAS
1962年~1964年 アンソニー・バール 多変量解析ソフトウェア
当初は FORTRAN で記述されたが、その後、多言語に移植され多機能が追加された
- SPSS
1968年にSPSS社による統計解析ソフトウェアの製品群
2009年にIBMに買収され、IBM SPSS Statistics となる
- Python
1990年 ヴァンロッサム Python初版
統計的手法などに適した軽量言語。後に統計型AI利用の代表的言語になる
- アソシエーション分析
1992年、「ウォールストリートジャーナル」が「おむつとビールの関連性」の記事
- R言語
1993年 Ihaka, Gentleman 開発の統計解析用言語でOSSになっている
2000年代以降
- Excel でも多変量解析関数などをまとめた「データ分析」機能が提供され、PCでかなりな計算ができるようになった。
- マーケティング分野(バスケット分析。顧客の層別化。広告の効果測定など)など、広い分野での活用が広また。
- 2010年代でのAIブームにより、統計的手法は、AIの基盤技術として認識されるようになり、「知らずに利用している」状態にまで普及してきた。
(注)ルールベースAI
「モデルの全てのルールを人間が指定し、AIはそのルールに従い処理する」ので、機械学習を伴わないAIである。代表的なモデルは回帰、分類、クラスタリングなど多変量解析とほほ同じ技法になる。
これをあえてAIというのには抵抗があるが、おそらく次のような理由だろう。
上述のソフトウェアは、機械学習やニューラルネットワーク機能ももち次第に比重が大になってきた。あえて、ルールベースの分野と分けるのは面倒だし、古いイメージの「統計的方法」よりもAIブームに乗って「AIの一分野」としたほうがありがたみがある。
実務者としては、技法の体系区別などには興味がない。おそらく提供者側の都合だろう。