ＡＩの概要：体系分類、歴史

ＡＩの定義と分類

ＡＩ（Artificial Intelligence、人工知能）の学術的な定義や合意はありません。
　・人間の脳のメカニズムを模倣した機械を作ろうとする立場
　・人間が知能を使ってすることを機械にさせようとする立場
の立場がありますが、ここでは後者の立場に限定します。

ＡＩの段階（学習、推論）

ＡＩを利用するには、学習と推論の段階に区分されます。

学習

学習とは：事前に与えられたデータ（学習データ）を分析して、何らかの知識（）を得ることです。
例えば、学習データである「ネコ」「イヌ」「トリ」の画像から、それぞれに典型的な特徴の組合せパターン（推論モデル）を作ります。
学習の方式には、個々の写真にあらかじめ人間が「ネコ」「イヌ」などの正解を与えて判断ルールを生成する「教師あり学習」、正解を与えずにＡＩにルールを発見させる「教師なし学習」など、いくつかの方式があります。
画像識別以外では、多様な統計的方法の応用があります。
学習では大量のデータを用いて高度な加工をするので、大規模な計算施設が必要になります。しかし準備段階なので、応答時間はさほど重視されません、
学習は、主にＡＩシステム提供者が関係する分野です。

推論

推論とは、学習によって得た知識をもとに、未知のデータに対して何らかの判断を下すことです、
例えば、ある写真を見せて、推論モデルにより、「ネコ」か否かの判断を出力させます、
推論の方式は、質問の内容や推論モデルの特徴により多様で、それぞれに適したアプリが提供されています。
対話型生成ＡＩでは、人間のようなこなれた文章を生成するなどの工夫が重要になります。
推論処理は、推論に適した形式に整理された学習済データを推論アプリで行うので、比較的小規模な機器で処理できます、しかし、結果を工場の運転や自動運転制御などに用いるときは高速処理が求められます。
推論は、主にＡＩシステム利用者が関係する分野です。

ＡＩの体系分類

適用範囲による分類

　　ＡＩ┬強いＡＩ（汎用型ＡＩ）
　　　　└弱いＡＩ（特化型ＡＩ）

強いＡＩ、汎用型ＡＩ
ＡＧＩ（Artificial General Intelligence）ともいいます。
人間の知能に近い機能またはそれ以上の機能を持ち、総合的な判断や意識を持っているＡＩです。
映画「2010年宇宙の旅」にでてくるコンピュータ HAL9000 のように、人間のように感情を持ち、あらかじめ
プログラムされていないケースへも、柔軟に思考することで自立的に問題を解決できます。
現在では未だＳＦの世界ですが、2045年までにＡＩが人間の知性を超え（シンギュラリティ）、社会に想定されない多くの問題が発生するという「2045年問題」が懸念されています。
弱いＡＩ、特化型ＡＩ
コンピュータ将棋、音声翻訳、自動運転、人型ロボットなど、人間の知能の一部に特化した機能を持つＡＩのこと。現在のＡｉはこのレベルにどどまっており、本シリーズの対象にします。

（注）汎用／特化を目的による区分に用いることがあります。
　・汎用型ＡＩ：回帰分析やクラスタリングなど多様な目的に使えるＡＩ
　・特化型ＡＩ：将棋や顔認識など特定の目的に使うＡＩ

人間介入による区分

　　ＡＩ┬ルールベース
　　　　└機械学習（ニューラルネットワーク）
　　　　　　└深層学習（ディープラーニング）

モデルの作成とは、「何らかの手段」により、
　　　　y = a₀ + a₁x₁ + a₂x₂ + … + a₂x_n
となる係数 a を求めることです。
（ここでは単純に一次式としましたが、複数の変数を組み合わせたハイパーパラメタを変数にすることがあります）。
　ネコとイヌについて、大量のデータを集め、その特性 x₁、x₂、…、x_n を調べて、何らかの手段により a の値を決定し、y　を求めます。そして、y > 0 ならばネコ、y < 0 ならばイヌだと判別します。
　この式のことをモデルといいます。

ここで「何らかの手段」が重要です。「ＡＩはが自分でルールを作る」とはいえ、厳密には人間がかなり関与しています。
　「ヒゲの数」や「目の形」などの特性xを人間が与えるならば、多変量分析の判別分析がそのまま使えてａを求める計算方法も確立しており、プログラムも容易に入手できます、この場合は、ルール全体を人間が与えているので、ルールベースといいます。ルールベースになるモデルは、「人工知能」である必要はありません。本章では対象にしません。

それに対して、「ネコとイヌの画像を見せて～」のようなケースでは、画像から特性を見出し（ｘを決める）て a の値を求める方法、すなわちルールを作る（モデル化する）のはＡＩです。そして、そのルールを作ることを機械学習といいます。
　モデル化にはニューラルネットワークを用いるのが通常です。機械学習の結果はニューラルネットワークの形式になります。それで機械学習≒ニューラルネットワークといえます。

深層学習（ディープラーニング）は、ニューラルネットワークに複数の隠れ層（中間層）をもち、通常の機械学習で得た特徴を中間層で組み合わせて、より少ない数の特徴に特徴の圧縮をします。これにより、より精度の良い解を得ることができます。現在のＡｉの主流になっています。

学習方法による区分

　　機械学習┬教師あり学習（回帰、分類）
　　　　　　└教師なし学習（クラスタリング、次元削減）

ＡＩを単純にいえば、既存のデータで何らかのルールを作成しておき（学習という）、新しいデータをそのルールに適用したら、どのような結果になるか（予測という）を求める技法です。

教師あり学習
多数の画像に「これは犬」「これは猫」の正解（ラベル）付加して、ＡＩに判別ルールを自動生成させ、正解のない画像を与えて犬か猫かを判別させるようなモデルです。
教師なし学習
多数の顧客の特性や購買行動（正解はない）を与えて、似た者集めで、顧客をいくつかのグループに分けるというようなモデルです。

従来のＡＩと生成ＡＩ

　　ＡＩ┬従来のＡＩ（識別ＡＩ）
　　　　└生成ＡＩ
　　　　　　└対話型生成ＡＩ

従来のＡＩ
従来のＡＩは、写真を見せて「犬か猫か判別せよ」とか、スーパーのレシートを大量に与えて、何と何が一緒に買うことが多いか」というように、主に識別する機能を使っていました。そのため、生成ＡＩと区別するために「識別ＡＩ」ということもあります。
生成ＡＩ
利用者の指示に応じて、文章や画像などを「作り出す」機能をもつＡＩです。
例えば、次のようなことができます。
　・「1980年代のＡＩ研究の特徴は？」のような検索エンジン的な利用
　・「木に登っている犬の写真」（存在していないものも生成できる）
　・「この文章を４００字程度に要約して」
対話型生成ＡＩ
指示を上のように自然言語で与えることができます。
しかも、チャットのように追加指定ができます。「木に登っている犬の写真」に続いて
　「それを猫がしたから見ている」
　「イラスト風にする」
とすることにより、求める結果に近づけることができます。

ＡＩの歴史

～１９４０年代：人工知能前史
1940年代中頃までには、多変量解析の代表的技法はすでに確立していた。
人工知能研究の基礎となる研究は１９４０年代に始まった。
１９４３年　マカロック、ピッツ、脳の仕組みを論理的な表現にできることを示した。
１９５０年代後半～１９６０年代　第一次人工知能ブーム
１９５６年　ダートマス会議でマッカージーが「人工知能」という用語が初めて使った。
１９５８年　ローゼンブラットがパーセプトロンを発表した。
自然言語処理、ニューラルネットワークなど人工知能分野での成果が続いた。しかし、この時代は明示的な記号論理を基盤にしたものが多かった。
１９８０年代：エキスパートシステム
エキスパートシステムとは、専門家が持っている知識を「知識ベース」に記録して、「対話方式」で利用者の質問に、知識ベースを参照して「推論」を行うシステム
１９７２年に、初のエキスパートシステム　ＭＹＣＩＮ発表。１９７９年にＥＭＹＣＩＮに発展。伝染性の血液疾患を診断し抗生物質を推奨するシステム。しかし、実験的システムで実用化にはならなかた。
１９８０年代になると、職人の持つ技能ノウハウの伝授とか、複雑な設備のスタートアップ・シャットダウンの手順などに適用された。
１９８０年代：第一次人工知能ブーム
画像・音声認識の基礎確立、バックプロパゲーション技術の発展など、ディープラーニングの基礎技術が生まれた。
１９８２～９２　第五世代コンピュータプロジェクト。人工知能活用を前提
１９８６年　日本人工知能学会の設立
１９９０年代後半　データマイニング
大量のデータを分析することにより、それまで気づかなかった役立つ情報を発見する手法。
バスケット分析（クラスタリング）、クレジット加入審査（判別）など、現在ＡＩの代表的な手法が実用化された。
２０００年代後半～２０１０年代　第三次人工知能ブーム
２００６年　ジェフリー・ヒントンら、ディープラーニングの提唱
ディープラーニングの基礎的な研究は、１９８０年代に行われていた。それが２０００年代後半になると、さらに研究が進み、人工知能分野は急激な発展の時代に入った。
２０１２年　Google、教師なし学習による画像認識「ネコ」
ＡＩの説明でよく使われる「ネコの判別」は、これを題材にしている。
花の写真を入力すると名称を教えてくれるＷｅｂサービスを無料公開するなどにより、ＡＩの大衆化が進んだ。
２０２０年代　生成ＡＩの出現
人間の指示により、ＡＩシステムが文章、画像、音声、動画を生成する生成ＡＩが出現した。さらに２０２２年からは、chatGPT, Copilot など、対話型生成ＡＩに発展した。
生成ＡＩにより、一般の人が無料で簡単に文書や画像を作成することができる。これは、多様な分野でＩＴの活用を劇的に向上させた。反面、ディープフェイクなど反社会的な利用が流布し、社会的に深刻な問題になってきた。

ＡＩに関するトピックス

ＩＢＭのWatson
２０１１年、Watsonは米国のクイズ番組でクイズ王と対戦して勝利。駄じゃれや、俗語・専門用語など、あいまいな表現を含む自然言語で出題される問題に答えられることを示し、人工知能が実用化されたことを実証しました。
現在、ＩＢＭはWatsonをクラウドで利用できるサービスを提供していますし、ＡＰＩを公開しています。すなわち第三者がWatsonを使えるのです。
Googleの猫
ディープラーニングによる教師なし学習による画像認識の例として有名です。２０１２年に発表されました。大量の画像をコンピュータに読み込ませて特徴点を判断する方法で、写真を見せるだけで、それが猫であるか否かを判断できるようになりました。すなわち、猫という概念を自動学習で獲得したのです。
現在、Googleはこの画像認識システムのＡＰＩ（Cloud Vision API）を公開しています。例えば「花の写真をアップロードして花の名前を知る」ようなことが、トライアルでできるし、ＡＰＩを用いて独自のアプリを構築できます。
コンピュータ将棋
チェスは複雑度が低いので、１９８８年にはＩＢＭのディープ・ソート（有名なディープ・ブルーの前身）がグランドマスターに勝ちました。
囲碁は複雑度が高く、２０１５年頃まではアマ四～-六段程度でしたが、２０１５年にはGoogleのアルファ碁（AlphaGo）がプロ棋士相手に勝利しました。しかし、未だ一般のプロ棋士と互角に戦えるレベルになった程度といってよいでしょう。
将棋はチェスと囲碁の間の複雑度です。山本一成が開発したPonanzaが有名で、２０１６年にはディープラーニングを組み込み、第３回将棋電王トーナメントで全勝。２０１７年には、到底人間では勝てないレベルになり「人間とコンピュータが同じルールで真剣勝負をするという歴史的役割は終わった」とまでいわれるようになりました。
シンギュラリティ
その後、ＡＩは広い分野で活用され、日常語にまでなりました。
シンギュラリティ（singularity）とは「特異点」のことですが、ＡＩが人類の知能を超える転換点およびそれによる社会変化を指します。
特に、その特異点は２０４５年頃で、労働人口の約半数がＡＩやロボットで代替可能になり大量の失業者が発生するという研究があり、これをシンギュラリティとか２０４５年問題といっています。
ディープフェイク
生成ＡＩを悪用した偽動画のことです。例えば、ある人がありもしない内容の話をしている動画を生成してＳＮＳなどに投稿してＷｅｂ上にばらまくような行為です。
このときのディープとは「簡単には本物と見分けがつかない」との意味。Ｗｅｂなどから顔写真や音声を取り出し、音声生成技術により偽の内容を生成し、画像生成技術により唇の形や表情を生成します。
選挙や軍事など政治的に利用され、それが拡散されと深刻な影響を与えること、素人でもこのような処理が簡単にできるような不正アプリも普及していることなどが問題になっています。

人工知能（ＡＩ）へ