スタートページJavaScript他言語Python 目次

scikit learn(sklearn)の紹介


scikit learn(sklearn)

Python は、機械学習など高度な統計処理に広く用いられている言語ですが、scikit learn は代表的なオープンソースの機械学習ライブラリです。scikit learn はライブラリの名称で、PCなどにインストールするときの名称です。Python のコーディングで用いるときは、略称としての sklearn が用いられ、
  from sklearn import xxxx
のように記述します。xxxx は、ライブラリにあるモジュールです。

scikit-learn の機械学習のアルゴリズム体系の紹介(0.24.2)
Choosing the right estimator(https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
拡大表示

次のサイトでは、この紹介およびアルゴリズムの概要、実例などを日本語で説明しています。
Quita「【機械学習初心者向け】scikit-learn「アルゴリズム・チートシート」の全手法を実装・解説してみた」
https://qiita.com/sugulu_Ogawa_ISID/items/e3fc39f2e552f2355209

私には到底理解できません。ここでは「scikit learn には多様な機械学習のツールがある」ことを紹介するだけです。それにより、「Python には科のようなライブラリが存在する」ので、「私たちにも機械学習のモデルを作成することができる」こと、しかし、それには「多様なライブラリの存在を知り、その機能をりかいすることが重要」なことを示したいと思います。

scikit-learn による機械学習の区分

機械学習を目的や入力データで分類すると、次のようになります。
  ・classification(クラス分類、判別)
  ・clustering(クラスタリング、グループ分け、パターン認識)
  ・regression(回帰、相関)
  ・dimensionality reduction(次元圧縮、主成分分析)
上図とはやや異なりますが、教師あり/なしの区分から区分することもあります。
  ・教師あり学習 classification, regression
  ・教師なし学習 clustering, dimensionality reduction

classification(クラス分類)

regression

clustering

dimensionality reduction

主成分分析、因子分析などの分野です。