Web教材一覧>
AI
AIの概要:体系分類、歴史
AIの定義と分類
AI(Artificial Intelligence、人工知能)の学術的な定義や合意はありません。
・人間の脳のメカニズムを模倣した機械を作ろうとする立場
・人間が知能を使ってすることを機械にさせようとする立場
の立場がありますが、ここでは後者の立場に限定します。
AIの体系分類
適用範囲による分類
AI┬強いAI(汎用型AI)
└弱いAI(特化型AI)
- 強いAI、汎用型AI
AGI(Artificial General Intelligence)ともいいます。
人間の知能に近い機能またはそれ以上の機能を持ち、総合的な判断や意識を持っているAIです。
映画「2010年宇宙の旅」にでてくるコンピュータ HAL9000 のように、人間のように感情を持ち、あらかじめ
プログラムされていないケースへも、柔軟に思考することで自立的に問題を解決できます。
現在では未だSFの世界ですが、2045年までにAIが人間の知性を超え(シンギュラリティ)、社会に想定されない多くの問題が発生するという「2045年問題」が懸念されています。
- 弱いAI、特化型AI
コンピュータ将棋、音声翻訳、自動運転、人型ロボットなど、人間の知能の一部に特化した機能を持つAIのこと。現在のAiはこのレベルにどどまっており、本シリーズの対象にします。
(注)汎用/特化を目的による区分に用いることがあります。
・汎用型AI:回帰分析やクラスタリングなど多様な目的に使えるAI
・特化型AI:将棋や顔認識など特定の目的に使うAI
人間介入による区分
AI┬ルールベース
└機械学習(ニューラルネットワーク)
└深層学習(ディープラーニング)
モデルの作成とは、「何らかの手段」により、
y = a0 + a1x1 + a2x2 + … + a2xn
となる係数 a を求めることです。
(ここでは単純に一次式としましたが、複数の変数を組み合わせたハイパーパラメタを変数にすることがあります)。
ネコとイヌについて、大量のデータを集め、その特性 x1、x2、…、xn を調べて、何らかの手段により a の値を決定し、y を求めます。そして、y > 0 ならばネコ、y < 0 ならばイヌだと判別します。
この 式のことをモデルといいます。
ここで「何らかの手段」が重要です。「AIはが自分でルールを作る」とはいえ、厳密には人間がかなり関与しています。
「ヒゲの数」や「目の形」などの特性xを人間が与えるならば、多変量分析の判別分析がそのまま使えてaを求める計算方法も確立しており、プログラムも容易に入手できます、この場合は、ルール全体を人間が与えているので、ルールベースといいます。ルールベースになるモデルは、「人工知能」である必要はありません。本章では対象にしません。
それに対して、「ネコとイヌの画像を見せて~」のようなケースでは、画像から特性を見出し(xを決める)て a の値を求める方法、すなわちルールを作る(モデル化する)のはAIです。そして、そのルールを作ることを機械学習といいます。
モデル化にはニューラルネットワークを用いるのが通常です。機械学習の結果はニューラルネットワークの形式になります。それで機械学習≒ニューラルネットワークといえます。
深層学習(ディープラーニング)は、ニューラルネットワークに複数の隠れ層(中間層)をもち、通常の機械学習で得た特徴を中間層で組み合わせて、より少ない数の特徴に特徴の圧縮をします。これにより、より精度の良い解を得ることができます。現在のAiの主流になっています。
学習方法による区分
機械学習┬教師あり学習(回帰、分類)
└教師なし学習(クラスタリング、次元削減)
AIを単純にいえば、既存のデータで何らかのルールを作成しておき(学習という)、新しいデータをそのルールに適用したら、どのような結果になるか(予測という)を求める技法です。
- 教師あり学習
多数の画像に「これは犬」「これは猫」の正解(ラベル)付加して、AIに判別ルールを自動生成させ、正解のない画像を与えて犬か猫かを判別させるようなモデルです。
- 教師なし学習
多数の顧客の特性や購買行動(正解はない)を与えて、似た者集めで、顧客をいくつかのグループに分けるというようなモデルです。
従来のAIと生成AI
AI┬従来のAI(識別AI)
└生成AI
└対話型生成AI
- 従来のAI
従来のAIは、写真を見せて「犬か猫か判別せよ」とか、スーパーのレシートを大量に与えて、何と何が一緒に買うことが多いか」というように、主に識別する機能を使っていました。そのため、生成AIと区別するために「識別AI」ということもあります。
- 生成AI
利用者の指示に応じて、文章や画像などを「作り出す」機能をもつAIです。
例えば、次のようなことができます。
・「1980年代のAI研究の特徴は?」のような検索エンジン的な利用
・「木に登っている犬の写真」(存在していないものも生成できる)
・「この文章を400字程度に要約して」
- 対話型生成AI
指示を上のように自然言語で与えることができます。
しかも、チャットのように追加指定ができます。「木に登っている犬の写真」に続いて
「それを猫がしたから見ている」
「イラスト風にする」
とすることにより、求める結果に近づけることができます。
AIの歴史
- ~1940年代:人工知能前史
1940年代中頃までには、多変量解析の代表的技法はすでに確立していた。
人工知能研究の基礎となる研究は1940年代に始まった。
1943年 マカロック、ピッツ、脳の仕組みを論理的な表現にできることを示した。
- 1950年代後半~1960年代 第一次人工知能ブーム
1956年 ダートマス会議でマッカージーが「人工知能」という用語が初めて使った。
1958年 ローゼンブラットがパーセプトロンを発表した。
自然言語処理、ニューラルネットワークなど人工知能分野での成果が続いた。しかし、この時代は明示的な記号論理を基盤にしたものが多かった。
- 1980年代:エキスパートシステム
エキスパートシステムとは、専門家が持っている知識を「知識ベース」に記録して、「対話方式」で利用者の質問に、知識ベースを参照して「推論」を行うシステム
1972年に、初のエキスパートシステム MYCIN発表。1979年にEMYCINに発展。伝染性の血液疾患を診断し抗生物質を推奨するシステム。しかし、実験的システムで実用化にはならなかた。
1980年代になると、職人の持つ技能ノウハウの伝授とか、複雑な設備のスタートアップ・シャットダウンの手順などに適用された。
- 1980年代:第一次人工知能ブーム
画像・音声認識の基礎確立、バックプロパゲーション技術の発展など、ディープラーニングの基礎技術が生まれた。
1982~92 第五世代コンピュータプロジェクト。人工知能活用を前提
1986年 日本人工知能学会の設立
- 1990年代後半 データマイニング
大量のデータを分析することにより、それまで気づかなかった役立つ情報を発見する手法。
バスケット分析(クラスタリング)、クレジット加入審査(判別)など、現在AIの代表的な手法が実用化された。
- 2000年代後半~2010年代 第三次人工知能ブーム
2006年 ジェフリー・ヒントンら、ディープラーニングの提唱
ディープラーニングの基礎的な研究は、1980年代に行われていた。それが2000年代後半になると、さらに研究が進み、人工知能分野は急激な発展の時代に入った。
2012年 Google、教師なし学習による画像認識「ネコ」
AIの説明でよく使われる「ネコの判別」は、これを題材にしている。
花の写真を入力すると名称を教えてくれるWebサービスを無料公開するなどにより、AIの大衆化
が進んだ。
- 2020年代 生成AIの出現
人間の指示により、AIシステムが文章、画像、音声、動画を生成する生成AIが出現した。さらに2022年からは、chatGPT, Copilot など、対話型生成AIに発展した。
生成AIにより、一般の人が無料で簡単に文書や画像を作成することができる。これは、多様な分野でITの活用を劇的に向上させた。反面、ディープフェイクなど反社会的な利用が流布し、社会的に深刻な問題になってきた。
AIに関するトピックス
- IBMのWatson
2011年、Watsonは米国のクイズ番組でクイズ王と対戦して勝利。駄じゃれや、俗語・専門用語など、あいまいな表現を含む自然言語で出題される問題に答えられることを示し、人工知能が実用化されたことを実証しました。
現在、IBMはWatsonをクラウドで利用できるサービスを提供していますし、APIを公開しています。すなわち第三者がWatsonを使えるのです。
- Googleの猫
ディープラーニングによる教師なし学習による画像認識の例として有名です。2012年に発表されました。大量の画像をコンピュータに読み込ませて特徴点を判断する方法で、写真を見せるだけで、それが猫であるか否かを判断できるようになりました。すなわち、猫という概念を自動学習で獲得したのです。
現在、Googleはこの画像認識システムのAPI(Cloud Vision API)を公開しています。例えば「花の写真をアップロードして花の名前を知る」ようなことが、トライアルでできるし、APIを用いて独自のアプリを構築できます。
- コンピュータ将棋
チェスは複雑度が低いので、1988年にはIBMのディープ・ソート(有名なディープ・ブルーの前身)がグランドマスターに勝ちました。
囲碁は複雑度が高く、2015年頃まではアマ四~-六段程度でしたが、2015年にはGoogleのアルファ碁(AlphaGo)がプロ棋士相手に勝利しました。しかし、未だ一般のプロ棋士と互角に戦えるレベルになった程度といってよいでしょう。
将棋はチェスと囲碁の間の複雑度です。山本一成が開発したPonanzaが有名で、2016年にはディープラーニングを組み込み、第3回将棋電王トーナメントで全勝。2017年には、到底人間では勝てないレベルになり「人間とコンピュータが同じルールで真剣勝負をするという歴史的役割は終わった」とまでいわれるようになりました。
- シンギュラリティ
その後、AIは広い分野で活用され、日常語にまでなりました。
シンギュラリティ(singularity)とは「特異点」のことですが、AIが人類の知能を超える転換点およびそれによる社会変化を指します。
特に、その特異点は2045年頃で、労働人口の約半数がAIやロボットで代替可能になり大量の失業者が発生するという研究があり、これをシンギュラリティとか2045年問題といっています。
- ディープフェイク
生成AIを悪用した偽動画のことです。例えば、ある人がありもしない内容の話をしている動画を生成してSNSなどに投稿してWeb上にばらまくような行為です。
このときのディープとは「簡単には本物と見分けがつかない」との意味。Webなどから顔写真や音声を取り出し、音声生成技術により偽の内容を生成し、画像生成技術により唇の形や表情を生成します。
選挙や軍事など政治的に利用され、それが拡散されと深刻な影響を与えること、素人でもこのような処理が簡単にできるような不正アプリも普及していることなどが問題になっています。
人工知能(AI)へ