ニューラルネットワークとニューロコンピュータ

ニューラルネットワークの概要

ニューラルネットワークとは、人間の脳の仕組みを模倣した論理モデルのことです。

脳の仕組み（極度な単純化）

脳の仕組みを極度に単純化すると次のようになります。

出典：村上・泉田研究室「生体ニューロンについて」

脳内では、複数の入力ニューロン（細胞体）が軸索端のシナプスで一つの出力ニューロン（細胞体）に接合しています。
入力ニューロンは、外部からの刺激を受けて興奮／抑制し、それに応じた電位の信号をシナプスに送ります。
シナプスの合計が閾値を超えると、出力ニュートンに刺激を与えます。
刺激を受けた出力ニューロンは、自分が入力ニューロンになり、さらに接合されているニューロンに信号を送ります。
このようにして、信号が脳内をめぐることにより、脳内に「知識」が生成されます。

ニューラルネットワーク

上の仕組みを論理モデルにしたものをニューラルネットワークといいます。最も単純なニューラルネットワークが単純パーセプトロンです。

入力ニューロン１には x1（例えば身長）, 入力ニューロン２には x2（例えば体重）が入っています。このとき、出力ニューロンには結果 a が得られます。ａが閾値（０）より大ならば、出力ニューロンに刺激を与え（y=1）、小ならば刺激を与えません（y=1）。うなわち、a ＜ 0 ならｙ＝０（小人）、a ≧　0 ならｙ＝１（大人）を出力します。
重みは「入力の重要度を調整する値」です。身長が大きく影響しているならば W1=0.7, 体重はほどほどの影響度なら W2=0,5 などのように設定します（x1, x2 の単位や大きさに違いがあるなら、適宜正規化していることが必要です。
バイアスは「１を出力する度合を調整するための値」です。最小二乗法での定数項にようなものです。
出力ニューロンの入り口では、シナプスの合計値は
　　ａ = b + x1*W1 + x2*W2
になります。a ＜ 0 なら　ｙ＝０（、a ≧0 ならｙ＝１を出力します。
すなわち、a. w1, w2 を変化させれば、y=0 / 1 が変化します。
ＡＩでの「教師あり学習」とは、訓練データで多数の x1, x2, y(正解) の組を与えることにより、最も正解率の高い a. w1, w2 を計算させることです。

ニューラルネットワークの種類

階層型ニューラルネットワーク

複数のニューロン間の情報伝播を単純化したものが階層型ニューラルネットワークあるいは多層パーセプトロンといいます。
　入力層のニューロンでは信号処理を行わず、受け取った入力信号をそのまま中間層（隠れ層という）のニューロンへ伝えるとする。中間層と出力層は上式により入力→出力の処理をして、出力信号を他のニューロンへ伝える。
　ここでは中間層を一層としたが、通常は多層にしています。人間の脳はもっと複雑なメカニズムになっていますが、５層～１０層程度で近似できるといわれています。

出典：村上・泉田研究室「生体ニューロンについて」（２０１７）（ http://ipr20.cs.ehime-u.ac.jp/column/neural/chapter2.html）

バックプロパゲーション（誤差逆伝播法）

入力層に多様な信号を与えて出力層からの信号を得たとき、それが正しいか誤りであるかを人間が判定します（実際には、正解を付けた入力データを与える）。中間層での重み（ｗ）を変更することにより、正しい結果を得る確率を大にすることができます。その代表的な方法にバックプロパゲーション（誤差逆伝播法）があります。

オートエンコーダ

２００６年にジェフリー・ヒントンらは、オートエンコーダとディープ・ビリーフ・ネットワークを提唱しました。
　オートエンコーダとは、機械学習において、ニューラルネットワークを使用した次元圧縮のためのアルゴリズムです。
　右図において、ｘが動物の写真だとして、ニューラルネットワークが足の数、毛並み、鼻の位置などの特徴を分析して、新しい層ｚを作りだす。このときｘの個数よりもｚの個数のほうが小さい（次元圧縮）のが通常なので、ｘの代わりにｚを使えば、処理量が少なくなります。それをエンコードといいます。逆に、ｚからｘ（ｘ'）に復元することをデコードといいます。
　オートエンコーダは、データを小さな情報量に圧縮する方法をニューラルネットワークに学習する方法です。

ディープ・ビリーフ・ネットワークとは、多層ニューラルネットワークで良い初期解を得る方法です。
　これらにより、４層以上のニューラルネットワークにおいて、単純なバックプロパゲーションよりも、効果的な学習ができるようになります。

ディープラーニング

オートエンコーダとディープ・ビリーフ・ネットワークにより、人工知能は急速に発展し、２０１０年代にはディープラーニングへといわれるようになりました。深層学習と訳されますが、この深層（ディープ）とは多層に近い意味です。

ディープラーニングでは、例えば画像のデータを与えた場合、コンピュータは与えられた画像のデータの一部を消して、「消えた部分を残った部分から推測せよ」という問題に変更して自分自身に質問するのです。これにより、画像を１つ与えるだけで、多数のの擬似的問題を作ることができます。また、推測の過程で特徴の分析など次元圧縮が行われます。

ディープラーニングでは、教師なし学習が取り入れられています。例えば、人の顔を識別するとき、識別の特徴を人間が指定すると、髪や眼の色、顔の輪郭など観念的な項目になりがちです。コンピュータが自動的に行うのであれば、大量データから統計的に人間が気づかない識別特徴を見つけることがあります。しかも、人間よりも細部にまで調べることができます。そのため、特定の人を探すポイントが多くなります。

ＣＮＮ

ＣＮＮ(convolutional neural network, 畳み込みニューラルネットワーク)は主に画像認識の分野で用いられるディープラーニングの方法です。

ＣＮＮの構造は、通常のディープラーニングと似ています。
　　中間層（隠れ層）に相当するのが、畳み込み層とプーリング層のペアです。
　　出力層は、全結合層と出力層になります。
　畳み込み層は、単純型細胞のような役割で、画像の１点の情報を持ちます。また、入力画像とは別にカーネルという重み行列を用意します。カーネルの移動間隔をストライドと呼びます。
　プーリング層は、複雑型細胞フィルタのような役割で、画像内のある領域毎に画像のサンプリング操作を行います。空間的な位置のずれを吸収し、同一の特徴であるとみなす。
　全領域でのプーリング層をまとめて全結合層にします。これで画像全体の特徴が得られることになります。

ハッシュ関数による効率化

ハッシュ関数とは、入力されたデータに一定の手順で計算を行い、入力値の長さによらずあらかじめ決められた固定長の出力データを得る関数のことで、配列の検索や暗号通信などに広く用いられてきました。近年ビッグデータや画像など超大規模データを対象とするディープラーニングの分野で、ハッシュ関数による効率化が注目されています。
　これらのデータは、元データが巨大であり、それらの要素の組合せの数も巨大になるが実際に起こる組合せは少ないという内在的希薄性があります。それに着眼して、ハッシュ関数を用いることにより、計算量を劇的に小さくすることができるといわれています。

ニューロコンピュータ

ニューロコンピュータとは

ニューロコンピュータとは、ニューロンやシナプスの構造や情報処理メカニズムを基礎とし、脳を模倣した回路をもつチップから構成され、脳の持つ情報処理を人工的に実現させることを目的としたコンピュータです。通常は、多層ニューラルネットを持ち、バックプロパゲーションによる学習の仕組みを実装しています。
　エキスパートシステムなどの実装はノイマン型コンピュータで可能です。「ニューラルネットワーク」などもプログラムや学習システムの構造を意味する概念で、ハードウェアとしての回路などを示すものではなく、ノイマン型コンピュータでソフトウェアによりシミュレートすることができます。これはニューロコンピュータとはいいません。

ニューロコンピュータの実用化

ニューロコンピュータは、１９９０年頃までは、人工知能理論実証のために実験的なハードウェアが試作されたことはあるが、実務用途にはなりませんでした。１９９０年代には、産業用ロボットなどの機器の制御に小規模なニューロ的なチップが組み込まれるようになりましたが、特定用途に特化したものでした。実務的なニューロコンピュータが注目されるようになったのは２０１０年代に入ってからです。

ニューロコンピュータを構成しているのはニューロチップです。それをSyNAPSEチップということもあります。この分野ではＩＢＭがリーダ的存在です。
　２０１１年に、ＩＢＭはコグニティブ・コンピューティング・チップを開発しました。コグニティブとは認知という意味。ニューロコンピューティングに特化したSyNAPSEチップです。２０１４年には、これを発展させてTrueNorthを開発しました。郵便切手サイズのチップ１個内に１００万個相当のニューロン、２.５６億個相当のシナプスをもっていました。
　人間の脳のニューロンは１０００億個、シナプスは１５０兆個程度だとされているので、到底比較にはなりませんが、このチップ１個だけでもゴキブリ程度ですし、１０００個並べれば猫程度になるのですから、特定の分野に限定すれば実用化の時代になったといえるでしょう。

ＩＢＭは、AIを「Artificial Intelligence（人工知能）」ではなく、「Augmented Intelligence （拡張知能）」として人間の知識を拡張し増強するものと定義しています。それにならったのか、ニューロコンピュータをブレインコンピュータということもあります。

ニューロコンピュータの特徴

超並列プロセッサ
ニューロコンピュータを構成するニューロチップは多数のコアプロセッサからなる超並列プロセッサだといえます。それぞれのコアが演算回路、メモリー、コア間通信用のルーターなどを備え、ニューロン間の結合の強さなどのパラメータは、すべてコア内のメモリーに保存され、プログラムに相当する情報が、コアの中に封じ込められています。
低消費電力
各コアは非同期的に通信を行い、処理を行わないコアはアイドル状態（電力不要）になります。しかも、ニューロコンピュータの周波数は１kHzと非常に小さい（脳は10Hz、ノイマン型は5GHz）。そのため、消費電力が圧倒的に低い特徴があります。
ノイマン型コンピュータとの連携
組込みシステム以外では、ニューロコンピュータを単独でシステム構築するのではなく、外部とのインタフェースや学習機能など全体を制御するために、ノイマン型コンピュータと連携させるのが通常です。大規模なシステムではスーパーコンピュータと連携させている。
用途
ニューロコンピュータは並列分散情報処理能力を持つため、音声や画像のパターン認識、意思決定などの最適化問題への適用、ロボットや複雑なシステムの最適制御などへの応用が注目されています。

人工知能（ＡＩ）へ