ディープラーニングに欠かせない「ニューラルネットワーク」の仕組みとは？

人工知能（AI）の発展において、今やディープラーニングは欠かせない役割を果たす技術です。しかし、具体的にディープラーニングがどのようにAIへ貢献しているのかについては、まだまだ情報共有が進んでいないところです。

現在のディープラーニングの核となっているのが、「ニューラルネットワーク」と呼ばれる技術です。人間の知性を模して生まれたというこの仕組みはどのように機能し、ディープラーニングとAIを支えているのでしょうか？今回は、そんなニューラルネットワークの概要について、わかりやすく説明します。

ディープラーニングとは

まずは、ディープラーニングという技術について簡単に確認しておきましょう。ディープラーニングは、現在のAI研究における最先端を行くテクノロジーで、日本語では「深層学習」とも呼称されています。

従来の機械学習よりもはるかに高度な判断能力を持てるため、多くの研究者がディープラーニングの活用を進めています。

ディープラーニングの仕組み

ディープラーニングは、特定の事象におけるあらゆる要素を階層構造に関連させることで、AIに学習を促すという方法です。日本語で「深層学習」という訳語が当てはめられているのは、要素を多層化させることにより、深い層まで事象を理解させ、高い精度で判断ができるようになるためです。

ニューラルネットワークという技術は、このように多層化された事象を噛み砕くために用いられているというわけです。

機械学習・ディープラーニングとの違い

ディープラーニングとよく比較されるのが、「機械学習」と呼ばれる人工知能学習です。端的に言えば、機械学習とディープラーニングは別個のものではなく、ディープラーニングは機械学習という学習形態の一種であると言えます。

どちらも最終的にはAIが自ら判断して法則を自動化できるようにすることが目的ですが、ディープラーニングの方がより複雑な判断能力を身につけられるポテンシャルを備えています。

機械学習の場合、人間があらかじめ基準となる特徴をAIに伝える必要があります。いわゆる「教師あり学習」と呼ばれるもので、傷のあるりんご、傷のないりんごのデータを与え、それぞれの違いを理解してもらおうと働きかけます。

一方の、ディープラーニングにおいては、人間が基準となる特徴を伝える必要はありません。「傷の有無をAIに判定して欲しい」というリクエストに応えられるようAIを設計し、大量のりんごの画像を読み込ませるだけで、いつの間にか独自に判断できるようになっています。

人間が答えを教える必要がないアプローチは「教師なし学習」と呼ばれており、優れたAIの判断能力を必要とします。ディープラーニングは、このような教師なし学習にも対応しているため、AIの活用可能性をさらに高めてくれるというわけです。

ディープラーニングの「教師なし学習」とは？教師あり・強化学習との違いと活用事例

ニューラルネットワークとは

そんなディープラーニングの技術を支えているのが、「ニューラルネットワーク」と呼ばれる技術です。従来の機械学習においては持ち得なかった学習能力は、どのようにして生み出されているのでしょうか？

人の知性を模した数式モデル

ニューラルネットワークとは、その名前からも推察できるように、元々は人間の脳神経の細胞であるニューロンの機能を元にして生み出されたネットワーク構造です。人間は日々の生活において、非常に多くの判断と頭の回転が求められていますが、ここで発生しているのが神経細胞を通じた電気信号の伝達です。

神経細胞の間には、それらをつなぐための接合部が存在しています。いわゆるシナプスと呼ばれるものですが、ニューロン同士がどれくらいの強度のシナプスによって結び付けられているのかによって、伝達の精度も変わります。

ニューラルネットワークにおいてもこのような仕組みを採用しており、人工的に数式で表現することに成功しています。人間の知性の根幹をなす神経回路網を人工的に作り上げることで、AIはより人間に近い知能を有することになったのです。

ディープラーニングに欠かせない技術の一つ

一見すると複雑な技術のように見えるニューラルネットワークですが、今やディープラーニング開発の現場では当たり前のように採用されています。

元々、ディープラーニングはニューラルネットワークとイコールの関係ではなく、ディープラーニングの実現にはさまざまなアプローチが研究されてきました。中でも最も確度が高く、実践的な信頼に足るとして注目されているのが、ニューラルネットワークなのです。

ニューラルネットワークは人間の脳の構造研究の一環として生まれた技術ですが、ディープラーニングはそれ以外のアプローチでも実現可能であるとして、今も研究が続けられています。

ニューラルネットワークの歴史

ここで、ニューラルネットワークの歴史について振り返り、その誕生の軌跡を確認しておきましょう。

形式ニューロンの発表

ニューラルネットワークは、元々神経生理学から発展した技術の一つです。その元祖は1943年に発表された「形式ニューロン」と呼ばれるもので、人工的に初めてニューロンをモデル化することに成功しました。

まだコンピューターも実用化して日が短いという時期でもありましたが、後の人工知能開発における第一歩として注目されることとなります。

パーセプトロンの登場と失敗

形式ニューロンの考え方に着想を得て、1957年に発表されたのが「パーセプトロン」です。パーセプトロンは、人間が持つ視覚と脳の働きを模したモデルの一種で、複数の層を通じて情報の入力を行い、各層から得られた答えから多数決で意思決定を実施するという仕組みを持ちます。

複数の形式ニューロンを結びつけて多層化している点においては、現代のニューラルネットワークに通じる仕組みと言えるでしょう。

この発表が登場した当時は、シナプスの仕組みが同じ時期に改名されたこともあり、「人工的に脳が作れる」と世界が大きく湧いていました。

しかし、パーセプトロンには大きな欠点があることも後に指摘されます。パーセプトロンは二択で答えられる問い（線形分離可能な問い）にしか活用ができず、その汎用性は人間の脳にはるかに劣るということがわかったのです。

このことが判明して以降、第一次ニューラルネットワークブームも下火となり、AIも冬の時代を迎えることとなります。

2010年代の実用化に至るまで

再びニューラルネットワークの活用に世間の注目が集まったのは、2000年代以降です。90年代には多層パーセプトロンの登場により、パーセプトロンの課題を解消することに成功していたものの、コンピューターのスペック不足などが原因で、技術の実現は二の足を踏んでいました。

2006年、イギリスのジェフリー・ヒントンらが開発したオートエンコーダは、データが持つ情報量を圧縮し、特徴量の獲得を促進してくれるニューラルネットワークの一種です。この結果、ニューラルネットワークはさらなる要素の多層化・深層化を進めることに成功し、パーセプトロン時代よりもはるかに複雑な学習を進められるようになりました。

多層構造を持ったニューラルネットワークは、2010年代以降「ディープラーニング」という技術で知られるようになり、現在のAI開発における最前線の研究として注目されています。

ニューラルネットワークの仕組み

このように、ニューラルネットワークに関する技術の歴史は半世紀以上に渡りますが、現在のニューラルネットワークは次の要素にまとめることができます。

主な機能は特徴量の抽出

ニューラルネットワークの目的は、特定の事象に関する特徴量の抽出です。例えば、私たちがりんごとみかんを区別する場合、感覚的な判断の裏側には、多くの情報のインプットと状況判断が行われています。

「Aは皮が赤いからりんご」「Bは皮が柔らかいからみかん」など、実際にそれぞれの違いを言語化してみると、実に多くの「特徴」に基づいて判断をしていることがわかるでしょう。

ニューラルネットワークもまた、このような人間が感じる物事の特徴を見出すための働きをしてくれます。ニューラルネットワークが感知する特徴を数値化したものは「特徴量」と呼ばれ、これの多い少ないによって、AIは自律的な判断を下します。

ニューラルネットワークが特徴を得るための外部機器はさまざまです。人間は手足や目、鼻、耳などを使って五感をフル活用しますが、人工知能の場合は搭載しているハードウェアに依存します。

高性能なセンサーやカメラが用いられることが一般的ですが、そこから得た情報をニューラルネットワークが読み込み、人工知能の判断に役立てているという仕組みです。

3層構造を軸とする技術

ニューラルネットワークの特徴量抽出は、主に3つの層をを通じて行われます。まず、入力層では実際に送られてきたデータを読み込みます。最後に出力層によって結果をアウトプットするわけですが、その中間に位置するのが中間層（隠れ層）です。

種類としては上記の3種類ですが、中間層を複数にすることで、より複雑で精度の高い計算が行えるようになるため、特徴量の抽出量も増えてきます。近年ではこの3層構造に厚みを持たせられるようになったことで、優れたニューラルネットワークの形成と、人工知能の実現が可能になりました。

ニューラルネットワークが注目された背景

このような段階的な進化を遂げたニューラルネットワークが、近年急速に普及して至ったのには理由があります。

普及を決定的にした実績

まず、ニューラルネットワークの可能性を世界的に証明したのが、2012年のILSVRCです。これは、各国から研究チームが集い、人工知能の物体の認識率を競う世界大会の一種です。

このときに抜群の結果を残し優勝したのが、オートエンコーダを開発したジェフリー・ヒントンが率いるトロント大学のチームです。ディープラーニングを活用して参加したこのチームでは、他のチームがエラー率26％前後をマークしている中、エラー率を17％弱に抑えるという驚異的な結果を残したことで、世界中の注目を集めました。

参考：ケータイWatch「第714回：ディープラーニングとは」

これ以降、ディープラーニングは確かなパフォーマンスを発揮するということで、AI研究に携わる人々は一斉にニューラルネットワークの運用を進めていったとされています。

ディープラーニングの技術的発展

ニューラルネットワークが注目される上でもう一つ重要だったのは、ディープラーニングにはさまざまな活用機会が存在しており、あらゆる分野に応用ができるという汎用性の高さです。

これまでのAI研究というのは、簡単な画像認識や計算処理の高速化など、テクノロジー分野との関連性が高い業界にしか興味を持てない技術でした。20世紀後半に登場したパーセプトロンブームも、実は汎用性が非常に低いことから下火になったことからもわかるとおり、従来のAIというのは専門的すぎた技術だったのです。

しかし、2012年以降、ニューラルネットワークを用いたディープラーニングが多様な目的に利用できる上、非常に高いパフォーマンスを発揮することがわかって以降、多くの企業がAI研究へとシフトし始めています。ハードウェアの性能が向上したことも理由の一つですが、何より「AIを使えばなんでもできる」ということが多くの人に共有されたことも、背景としては大きいでしょう。

畳み込みニューラルネットワークの登場

現在、ニューラルネットワークには複数の種類がありますが、今最も多く使われているのが「畳み込みニューラルネットワーク（CNN）」と呼ばれるものです。人間の視覚認識の仕組みを応用したネットワーク構造で、入力層と出力層の間に畳み込み層とプーリング層を保有することから、このような名前がつけられました。

畳み込み層において、画像データの特徴量を抽出し、プーリング層で特徴量の判別を行うというプロセスを採用したことで、ディープラーニングに驚異的な精度をもたらしてくれたのです。

【2022】ディープラーニングの「CNN」とは？仕組みとできることをわかりやすく解説

2012年のILSVRCにおいて、ジェフリー・ヒントンらのチームが採用したのもこのニューラルネットワークで、現代の画像認識AIにおける標準的なシステムとなっています。

【詳細】ディープラーニングと画像認識の関係性は？仕組み・今後の展望と活用事例

画像認識に活躍する畳み込みニューラルネットワークですが、汎用性が高く、画像以外にも音声や自然言語処理にも応用が可能です。そのためディープラーニングといえば、畳み込みニューラルネットワークの実現を目指すのが一般的です。

ディープラーニングで実現可能なテクノロジー

ニューラルネットワークを活用したディープラーニングによって、非常に多くの分野における活躍が見込まれています。すでに実現しているテクノロジーについて、例を紹介しましょうす。

自動運転

自動運転の実現は、AI研究における一つのマイルストーンとして、世界中の研究者が目指している分野です。車の運転は、人間の場合ならいとも簡単に行われる日常的な活動ですが、コンピューターに運転をさせるとなると話は変わります。

単純なハンドル操作であっても、実際には多くの判断を人間は一瞬のうちにこなしています。現在の速度は何キロか、前方に障害物や走行車両はないか、道の状態はどうかなど、とても家庭用コンピューターでは対処できないほどの情報量です。

しかし、このような複雑な処理を実現しようとしているのが、ディープラーニングです。ニューラルネットワークを活用した、高度なリアルタイム映像認識により、人間と同様の視覚と情報インプット能力が手に入るようになったためです。

情報のインプットが正確かつ高速に行えるようになれば、あとはそれに合わせて自動車をコントロールするだけです。

通常の写真認識とは異なり、運転中は刻一刻と映像の状況が変化するため、一瞬の判断の精度を高めることが必要ですが、将来的には人間よりもはるかに精度の高い運転技術が獲得できる予定です。

高速を走る輸送トラックや、バスの運転など、まずは流通や公共交通機関への導入から普及が進むと考えられます。

製造業のオートメーション

製造業の自動化（オートメーション）においても、ディープラーニングは活躍が期待されています。現在、日本を初め世界ではスマートファクトリーの実現が急務とされています。

IT産業の成長による工業の需要低下、そして労働人口の不足が進んでいることから、製造分野における業務効率化と生産性の向上は、喫緊の課題です。

スマートファクトリーは、工場の完全無人化を目指すべく、積極的なICTの導入を進めるものです。生産ラインの無人化のためには、人間が担っていた業務の自動化を進める必要がありますが、それには複雑な判断能力が求められます。

ディープラーニングの活用により、従来のロボットが対応できなかった複雑な業務や、検品作業のオートメーション、そして工場の管理をAIに任せられるようになるでしょう。優れたセンシングとIoTとの連携により、ディープラーニングで向上のパフォーマンスを常に評価し、改善を進められるような体制も構築可能です。

AIプラットフォームを提供するABEJAは、すでに製造業におけるディープラーニングの導入を進めています。デンソーをはじめとする大手企業の生産ラインの評価システム改善、検査自動化を進め、スマートファクトリーの実現に近づきつつあります。

参考：ロボスタ「製造業のコストはAIで劇的に削減できる」ABEJAが導入事例とAIモデル作成を披露「NVIDIA ディープラーニングセミナー次世代の製造現場へ提案」

自然言語翻訳

日本語を英語に訳したり、中国語をスペイン語に訳したりといった自然言語翻訳は、AIの活躍が著しい分野でもあります。これまでも、Google翻訳やエキサイト翻訳を筆頭に、コンピューターを用いた翻訳システムはさまざまなソフトが開発されてきました。

ただし、従来のアルゴリズムでは単語の翻訳ができても、文脈の翻訳ができなかったこともあり、あくまでも単語を直訳するにとどまるサービスにとどまってきたのです。ところが、ディープラーニングの登場により、文脈を伴う翻訳も実現しつつあります。

ドイツのLingueeが開発したDeep Lは、ディープラーニングを活用して驚異的な精度で言語を翻訳するサービスを展開しています。これまでに世界中の単語や文章を集積し、AIに読み込ませてきたことによって、単語の意味を理解するだけでなく、文脈に応じた最適の文章の生成も行えるようになりました。

外国語に訳するのが難しいとされる日本語の翻訳も、人間が訳したのかと思うほどスムーズに行ってくれます。現在もユーザーの利用を通じて情報のインプットは継続的に行われており、今後のさらなる発展が期待されています。

【2022】ディープラーニングによる自然言語処理とは？仕組み・利用される理由と活用例

ニューラルネットワークの実用化に貢献してきたGPU

このような幅広いディープラーニングとニューラルネットワークの活躍を支えてきたのが、優れたハードウェアの存在です。90年代はハードの性能が理論に追いつかなかったこともあり、研究が停滞していたことを考えると、その進化は侮れないものがあります。

中でも、GPUの活用は、近年のAI研究において注目されているポイントです。

GPUは並列処理を得意とする

GPUがニューラルネットワークの活用に優れていると言われるのは、並列処理能力の高さにあります。本来、GPUはコンピューターのグラフィック処理を担うパーツで、3Dの映像やモデリングなど、大きな3Dデータを扱う現場においては高性能なGPUが不可欠です。

そして、通常の計算処理とグラフィックの処理が決定的に異なるのは、グラフィックは同じような計算が大量に発生する点にあります。通常のCPUでは、必要な処理にさまざまな計算が発生するため、一つずつの計算スピードを高速に行うことに優れています。

対して、グラフィックの処理には同じような計算が大量に発生するので、同時に複数の計算に優れるプロセッサを必要とします。それがGPUの役割というわけです。

GPUはスムーズなグラフィックを実現するため、同じ計算を一度に大量に処理する能力に長けています。そして、ニューラルネットワークもまた同じ計算を大量に行うため、GPUの特性がAIに最適なのです。

AI研究においてGPUが欠かせないと言われているのは、こういった理由からです。

クラウドGPUによるさらなる活躍にも期待

一般的に、ディープラーニングは優れた性能を持つハードであればあるほど、その計算能力にもキャパシティが生まれ、素早くAIの学習を進めていくことができます。しかし、GPUは高スペックのものだと価格が高く、大量に導入することは予算の都合から難しいものです。

そこで活用したいのが、当社が提供するクラウドGPU「M:CPP」です。クラウドで利用可能なこのGPUは、ライセンス契約で必要なときにだけGPUを仮想的に拡張できるため、オンプレミスで導入するよりもはるかに安価で環境を整備できます。

また、M:CPPではハイエンドなAMD製のGPUを採用しているため、ニューラルネットワークの活用といった、先端研究にも最適の環境です。自社でGPUを管理するよりもはるかにコストパフォーマンスが高く、大手GPUクラウドと比べても最大半分程度にまで抑えることが可能です。

価格を抑えて優れた環境を整備したいと考えている場合に、M:CPPでは最適なサービスを提供できます。お気軽にご相談ください。

M:CPP公式サイト

まとめ

ニューラルネットワークは、現代の人工知能を支える重要な技術です。その歴史は半世紀以上に登り、現在も新しいアプローチと、さらなる活用方法の研究が進められています。

ニューラルネットワークの発展により、ディープラーニングの活躍の幅は広がっています。今後もこれらの技術の活躍の場は増えていき、街中で体感することも増えてくるでしょう。

優れたニューラルネットワークの実現には優れたGPUも欠かせません。クラウドGPUの活用も視野に入れながら、導入を進めていくことをおすすめします。