Web教材一覧ハードウェアとソフトウェア人工知能(AI)

機械学習

キーワード

機械学習、教師あり学習、教師なし学習、強化学習、回帰分析、決定木、ランダムフォレスト、クラスタリング、アソシエーション分析、協調フィルタリング、Q-learning、Deep Q-learning

参照
ニュートラルネットワークやディープラーニング
人工知能とニューロコンピュータの歴史


人工知能の定義と分類

「人工知能」は、AIと呼ばれ広く用いられていますが、学術的な定義や合意はありません。
広くは、
 ・ 人間の知能そのものをもつ機械を作ろうとする立場
 ・ 人間が知能を使ってすることを機械にさせようとする立場
の立場がありますが、一般的には後者の立場です。

また、研究や応用の対象として、
 ・ ロボットや自動運転のようなハードウェア(組込みシステム)
 ・ ソフトウェア(ハードウェアの場合もそれを制御するソフトウェア)
がありますが、ここではソフトウェアを対象にします。

汎用人工知能と特化型人工知能

人工知能は、その目的や技術の観点から、
 ・ 汎用人工知能:多様な用途に応用できるクラスタリングやディープラーニングなどの技術
 ・ 特化型人工知能:将棋や囲碁などの分野、医療分野などの特化した人工知能
           その分野では優れた能力を持つが、他の分野には使えない人工知能
に区分できますが、ここでは汎用人工知能を主にします。

人工知能 ⊃ 機械学習 ⊃ 深層学習(ディープラーニング)

機械学習とは「データから規則性や判断基準を学習し、それに基づき未知のものを予測、判断する技術」であり、主に統計学を応用しています。なお、「機械」とはハードウェアではなく「反復的に処理を実行すること」の意味です(その処理にはコンピュータを用いますが)。
 機械学習に含まれない人工知能の例に(初期の)エキスパートシステムがあります。エキスパートシステムでは「もし…ならば…確率…で…である」という知識ベースから推論をします。この知識ベースは人間が与えたものです。それに対して、機械学習では「大量データから統計解析などによりルールを自動生成」することが特徴です。

深層学習(ディープラーニング)は、人間の神経回路を人工的に真似た「ニュートラルネットワーク」と呼ばれる回路をコンピュータ上に設定したものです。
 深層学習以外の機械学習は、従来の統計的方法を発展させたもので、通常のアーキテクチャのコンピュータで処理するようなものです。

機械学習

機械学習とは、コンピュータに大量の訓練データを与えてコンピュータが自ら学習することにより、未知のデータに対して判断を行えるようにすることです。それにはAIの活用だけでなく、従来からのデータマイニングなどで活用されていた統計的手法も使われます。
 機械学習の方法は、訓練データの与え方により
  教師あり学習(Supervised Learning)
  教師なし学習(Unsupervised Learning)
  強化学習(Reinforcement Learning)
に区分されます。

「教師あり学習」と「教師なし学習」は統計学に基づいた「統計的機械学習」が一般的です。一方、「強化学習」は、概ね統計学とは無関係です。

教師あり学習

教師あり学習ではニュートラルネットワークの利用が一般的です。
 例えば「画像認識」などの「分類」では、猫や犬などの大量の写真を示して、システムにルールを作成させ、その後、写真を見せるとシステムが「猫」や「犬」を判断する仕組みです。

教師あり学習では、
   訓練用データとそのラベル(正解)
   評価用データとそのラベル
を用意します。

次のような事項を人間が与えてモデルの構造を決めます。
   入力層、隠れ層(中間層)の個数、出力層
    (この隠れ層の段数が多いものをディープラーニングといいます)
   それぞれの層におくニューロンの数
そして、ニューロン間を伝播するシナプスの重み付けを計算させるのですが、その最適計算方法がいくつかあり、どの方法を用いるかを指定します。

このモデルに訓練データを入力すると、システムはラベルとの一致度が最大になるような最適な重み付けを求めるのですが、その方法が脳の仕組みを模倣したニュートラルネットワークで行われます。これが「システムがルールを生成する」ということです。

このモデルに評価用データを入力して、その結果と評価用ラベルとを比較して、信頼性を判断します。
 それが不満足のときは、モデルを変更して試行錯誤します。

教師なし学習

教師なし学習では、訓練データとして、ラベル(正解)のないデータを使います。
 この代表的な用途の一つにアソシエーション分析があります。その一つのバスケット分析は、POSで収集した同時購入データから、ある商品を購入する(購入しない)だろうと思われるグループにわける要因を探すといった用途です。人間が気づかないルールを発見することができます。

このよううな利用は以前から多変量解析データマイニングとして利用されていましたが、近年、使いやすいツールが出現したり大規模モデルにも適用できるようにったりして、人工知能の主要な分野になっています。

強化学習

強化学習は主に特化型人工知能に用いられます。
 強化学習では、「最終的なゴール」を設定し、それに向かった最適な答えを導き出すための方法を模索するやり方です。その方法として、試行錯誤を通じて、報酬(評価)が得られる行動や選択を学習します。  例えば将棋に関する強化学習は、敵軍の王将をとることに最大の評価として設定し、システムに将棋を教えるのに、ある手を打ったときに、その結果に対する得点を与えます(教師あり学習)。
 これを反復して学習させることにより、システムは最大の得点を得る(最良の手を打つ)ためのルールを見つけ出します(教師なし学習)。その結果に対して教師は新たな得点を与え、コンピュータはその得点によりルールを修正します。これを繰り返すことにより強くなります。
 かなり複雑なので、一定のレベルに達するまで、かなりの訓練期間がかかります。また、連続手に対する得点の与え方やコンピュータが獲得したルールが合理的であるという保証はありません。


人工知能(AI)へ