【2021】ディープラーニングの種類は?5つの違いとそれぞれの特徴・活用事例

ディープラーニングは、今日の人工知能開発において多大な貢献を続けている技術です。それだけに、ディープラーニングの汎用性が高いとも言えるのですが、実はこの技術にもさまざまな種類が存在します。

ディープラーニングは用途に合わせて形を変え、多様な目的において活躍しています。また、その運用方法についても常に進化しており、さまざまな運用アプローチが登場しています。

今回は、そんなディープラーニングの多様な種類について理解し、目的に合わせたディープラーニングの活用へとつなげられるよう、知識を身につけましょう。

ディープラーニングの仕組み

そもそも、ディープラーニングは通常の「機械学習」とは異なり、優れた学習能力を有しているということで話題になった技術です。ディープラーニングの有用性を決定づけているのが、一つに特徴量抽出に長けていること。そして、二つめにニューラルネットワークを採用し、高いレベルの学習能力を獲得している点です。

特徴量抽出に長けている

ディープラーニングが通常の機械学習よりも優れている点としてあげられるのが、特徴量の抽出能力です。一般的に、私たちが物事を判断する際、それらの特徴を経験や知識から導き出し、それについて思考したり判断を行ったりしています。

例えば、りんごとみかんの違いを見分けるケースを考えてみます。この2つの果物が同一ではないことは明らかですが、何が違うのかをあえて言語化してみても、視覚情報だけで多くの要素が挙げられます。りんごは赤く、みかんはオレンジ色である点や、りんごは比較的縦長の球体であるのに対し、みかんは平たい球であるなど、特徴を挙げ始めるとキリがありません。

人工知能もまた、人間と同じようにオブジェクトの特徴を抽出し、判断能力に活用しています。人間は物事に違いを設ける際、その特徴を自然言語化することが一般的ですが、コンピューターはこれらを数値化します。これを、「特徴量」と呼んでいます。

ディープラーニングは、そんな特徴量を数多く見つけることができる人工知能です。人間でもわかるような特徴はもちろんのこと、人間の五感では捉えきれない特徴に気付くこともでき、人智を超えたアルゴリズムの発見にも役立ちます。ディープラーニングの高い学習能力は、ここから生まれているというわけです。

ニューラルネットワークを活用している

ディープラーニングの優れた特徴量検出能力は、「ニューラルネットワーク」と呼ばれる仕組みを用いて実現しています。ニューラルネットワークとは、人間の脳の神経細胞(ニューロン)から着想を得て誕生したネットワーク構造で、人工知能に知性を与える仕組みとして大いに注目されてきました。

ニューラルネットワークの基本構造となっているのが「入力層」と「出力層」、そしてそれらの間にある「隠れ層」と呼ばれる三層構造です。これらは互いに結びつきあっており、結びつきの強度がどれくらいなのかを計算することで、適切な答えを見出せるよう設計されています。

人間の脳もまた、神経細胞を結びつけるシナプスの強度に応じて情報伝達を行なっています。ディープラーニングの仕組みと脳の仕組みが持つ共通点と言えます。

ディープラーニングには複数の種類がある

コンピューターに、初めて優れた知性を与えた技術として注目されるディープラーニングですが、蓋を開けてみれば、この技術にはいくつものアプローチに枝分かれてしていることがわかります。ここからは、DNN、CNN、RNN、LSTM、GANというポピュラーなディープラーニングのアプローチについて紹介します。

それぞれの方法に応じて、最適な活用方法は異なります。特徴を理解し、効果的なディープラーニングの活用へつなげましょう。

種類①:DNN(ディープニューラルネットワーク)

まず初めに紹介しなければならないのが、DNN(Deep Neural Network)です。DNNは今日のディープラーニング活用における基礎となる技術で、後述で紹介するディープラーニング技術の大カテゴリとなります。

DNNの概要・仕組み

DNNの最大の特徴は、4層以上の多層ニューラルネットワークを備えている点にあります。ニューラルネットワークの理論は、すでに90年代には確立されていたものの、コンピューターの性能が理論に追いついていなかったことなどから、実用化には至りませんでした。

また、ニューラルネットワークは三層構造を軸にしているとは言え、本当に三層だけで活用するには至らない点も多く、実用化は叶わなかったのです。

そこで誕生したのが、層の数を増やして弱点を補うという多層構造の技術です。隠れ層の部分を2層以上に増やすことで、従来のニューラルネットワークの弱点であった汎用性の低さを補い、幅広いディープラーニングの可能性を実現しました。

これが、DNNの技術というわけです。近年は優れたGPUの登場やビッグデータ活用の機運が高まったことで、その活躍の幅は着実に広がっています。

DNNの活用事例

DNNはディープラーニング活用の現場であれば、必ずと言って良いほど採用されている技術です。高度な技術を要する医療の現場も例外ではなく、医用画像処理のような繊細なタスクにも活用されています。

名古屋工業大学が紹介している医療におけるDNN活用の事例として、「病変検出」というタスクが存在します。従来の手法においても画像から特徴量を検出し、病変であるかどうかを確認してきたのですが、こちらは特徴量の決定と識別に大きな手間がかかり、その特定は困難なものでした。

一方、DNNを採用した病変検出システムの場合、特徴量の発見と識別のプロセスが大きく簡略化されるだけでなく、学習を自動的に進めてくれるため、精度向上および業務プロセスの効率化を実現しました。

参考:本谷 秀堅「ディープニューラルネットワークの医用画像処理分野から見た研究動向

DNNの活用事例は、これに限らずあらゆるディープラーニングの運用に当てはまります。さまざまな運用事例を参考にし、その可能性について考えてみると良いでしょう。

種類②:CNN(畳み込みニューラルネットワーク)

ディープラーニングの数ある手法の中でも、現在多くの事例において活躍しているのがCNN(Convolutional Neural Network)です。

CNNの概要・仕組み

CNNは、畳み込み層(Convolution Layer)とプーリング層(Pooling Layer)と呼ばれるレイヤーを有していることが特徴です。複数の層を通じて対象となるデータの特徴を各層で別個に処理し、特徴量を決定づけるというプロセスで分析を進めます。

CNNが主に活躍しているのは、画像認識の現場においてです。画像認識の技術は映像分析や顔認証など、さまざまな分野への応用ができるため、AI活用においても注目を集めていますが、その際活躍しているのはCNNです。

CNNが従来の画像分析に比べて圧倒的に優れているのが、画像から特徴を抽出して、そこから意思決定ができるという点です。

従来の画像認識技術というのは、非常にシンプルな仕組みを用いていました。正解の画像を一つ用意して、それにぴったり合う画像を正、それ以外が誤りという設計です。

この仕組みは、QRコードの読み取りやID認証の際には用いられる技術ですが、汎用性においては致命的な欠点を備えています。Aという人物を見分けるためには、ソースとなっている写真とまったく同じ写真をコンピューターに証明する必要があり、それ以外は受け付けない仕組みとなってしまうためです。

たとえ同じ人物が写っている写真でも、あらかじめコンピューターが正しいとしている画像以外は受け付けられないため、顔認証などに活用することはできませんでした。

しかし、CNNが登場したことによって、顔認証技術は大幅な進化を遂げます。CNNの最大の特徴は、画像全体正誤判定を行うのではなく、画像における特徴から正誤判定を行います。

人間はたとえ写真が違っても、鮮明にその人物の顔が写っていれば、2つは同一人物かそうでないかを判断できます。CNNは、このような判断能力をAIに与えることに成功しました。今では税関やスマホのロック画面など、あらゆる場面において活躍している技術となっています。

CNNの活用事例

実際にCNNを活用して画像解析を行なっている事例としては、こちらの記事がわかりやすいでしょう。ここでは衛生写真に雲が写っているかどうかを自動で判定できるAIの開発を一から行なっており、どのようなプロセスでCNNを運用しているかがよくわかります。

参考:宙畑「CNNを使って衛星データに雲が映っているか否か画像分類してみた」

雲が写真に写っているかどうかがわかれば、天気予報AIの開発など、新しいアプリケーションやソフトの開発に結びつきます。ここの記事を参考にしながら、運用方法を検討してみるのも良いでしょう。

種類③:RNN(再帰型ニューラルネットワーク)

RNN(Recurrent Neural Network)は、時系列データを扱う際に用いられることの多いディープラーニングです。こちらもCNNと同じくらいに汎用性が高く、様々なシーンで活躍しています。

RNNの概要・仕組み

過去のデータから未来を予測するというのは統計解析などでよく使われる言い回しですが、RNNはまさにそのようなタスクに特化した能力を持っています。毎日の売り上げデータやホームページへの訪問者数、さらには刻一刻と変わる株価の動きや温度変化のデータを取得し、次にどのように数字が変化していくかということを予測するのがRNNです。

RNNの主な仕組みは、過去のデータをパターン化する能力が肝になっています。どのようなタイミングで、どのような条件で数値が変動しているかをRNNで分析し、「このパターンならこう変化するだろう」と予測を立て、高い確度で未来を予測することができます。

株価予測の手法は、人間が行うぶんにもさまざまなアプローチで確立されています。RNNはこれらの手法をすべて学習させた上、より包括的な判断を行えるのが優れている点です。

また、RNNは一般的に数値化されづらい分野にも応用して活用することができます。例えば、自然言語翻訳や音声認識の分野です。自然言語の翻訳も、言い換えればパターンの連続であることがわかります。

人が話す言葉は複雑とされていますが、毎日使う言葉ですから、ある程度のパターンや法則がそこには存在します。RNNは大量の文章や会話のデータからこれらのパターンを分析し、AIでも流暢な翻訳が行えるよう進化を促しました。

音声認識のいても同様です。人間の話し方の癖やアクセントを無数のデータによって学ばせることで、どんな話し方でも正確に文字へ起こせるよう、認識能力を高められました。このように、RNNもまた活躍の幅が広く、今後のAI研究を支える技術として注目されています。

RNNの弱点

汎用性の高さが長所のRNNですが、その一方で注意しておくべき弱点も存在します。RNNは時系列データを扱うディープラーニングですが、あまりにも長過ぎるデータを与えてしまうと、演算量が大きくなってしまい、処理が追いつかなくなることがあります。

ディープラーニングはデータを階層化して学習効果を得る手法ですが、データの長さが一定量を超えてしまうと、処理が深くなりすぎてしまい、伝達情報に漏れが生まれる懸念があります。比較的短いデータでなければ、RNNをそのまま使うことはできないというのが現状です。

種類④:LSTM(長・短期記憶)

このようなRNNの弱点の改善を求めて、新たに考案されたのがLSTM(Long short-term memory)と呼ばれる手法です。

LSTMの概要・仕組み

LSTMは、RNNでは対応しきれなかった長いデータを、確実に読み込めるよう設計されたディープラーニングです。RNNとの違いは、隠れ層の仕組みにあります。

RNNの隠れ層とは異なり、LSTMの隠れ層はLSTM blockと呼ばれるメモリ、そして3つのゲートを持つブロックが採用されています。これにより、長期の時系列データであっても、問題なく処理を行えるようになりました。

この結果、RNNよりも高い実用性を獲得し、LSTMは気象予報や株価の予測など、あらゆる予測の分析に採用されています。

LSTMの活用事例

LSTMの活用事例として、最も有名なのがGoogleの機械翻訳です。Googleは自社の翻訳アルゴリズムにおいて、LSTMを採用していることについて言及しており、この技術の有用性の高さが実際に証明されています。

参考:NVIDIAが解説するディープラーニングの基礎(後編)

種類⑤:GAN(敵対的生成ネットワーク)

GAN(Generative Adversarial Network)は、ユニークな仕組みを備えていながら、その活用機会が幅広いディープラーニングの一種です。

GANの概要・仕組み

GANは生成ネットワーク(Generator)と識別ネットワーク(Discriminator)という、2つのネットワークを組み合わせて学習を進めます。通常のディープラーニングであれば、有しているニューラルネットワークは一つと決まっているものですが、GANは二つのネットワークを競わせることでアウトプットへとつなげます。

生成ネットワークは、正解となるデータを参考にしながら、それに近い思われるデータを生成します。対する識別ネットワークは、正解のデータと生成ネットワークから送られてくるデータを比較し、その正誤判定を行います。

前者はより精巧な偽のデータを、後者は偽のデータと本物のデータの判別を確実にすべく切磋琢磨することで、驚異的な精度のデータ生成を実現するという仕組みです。モノクロ写真のフルカラー化や、精巧なグラフィックデザインの生成など、目的に応じてさまざまな役割を担えるのも、この技術の優れた利点です。

GANの活用事例

GANの活用事例として話題となったのが、名作ゲーム「パックマン」の完全再現です。NVIDIAの研究チームは、GANにパックマンのプレイデータを読み込ませることで、ゼロからパックマンのゲームを完全に再現することを実現しました。

参考:NVIDIA「誕生 40 周年を迎えるパックマンを、NVIDIA の研究者たちが AI で再現」

ゲームエンジンも使わず、AIにゲーム内容を読み込ませるだけで作品を再現した例は他になく、GANという技術のポテンシャルの高さが浮き彫りとなったケースです。

ビジネスにおけるディープラーニングの活用事例

最後に、実際のビジネスシーンにおけるディープラーニングの活用事例についても、有名な例を確認していきましょう。

事例①:キヤノンの群集認識AI

高性能カメラやレンズでお馴染みのキヤノンは、ディープラーニングを活用してカメラで捉えた群集の数を、正確に把握する技術を開発しました。数千人規模の群衆であっても、わずか数秒で正確な人数を把握できるだけでなく、誤差もわずかな人数に抑えているということで、今後の警備体制の強化やマーケティングへの活用が期待されています。

参考:ニュースイッチ「6000人以上を数秒で!キヤノンの群衆を見るAIの進化が止まらない」

事例②:プリファードの胸部X線診断AI

AIベンチャーのプリファードネットワークスは、AIで胸部X線画像の診断を補助するツールを開発しました。肺ガンの特徴が現れた際、ディープラーニングを活用することで肉眼での見落としを防ぎ、診断精度を高めることが目的です。

一人の医師が日々大量の患者の診断を迫られる中、このような業務の効率化と精度向上をまとめて進められる技術の登場は、重要な意味を持ちます。

参考:Sankeibiz「異常部を着色表示し誤診防ぐ プリファード、胸部X線診断AI開発

事例③:プロ野球選手の姿勢推定に活躍「Deep Nine」

AIベンチャーであるACESは、AIを用いた人間の行動や感情の変化を測定する「ヒューマンセンシング」に特化した強みを有しています。この領域への強みを生かし彼らが開発したのが「Deep Nine」と呼ばれるシステムです。

姿勢推定技術や行動認識技術を用いて、カメラ映像から選手の身体情報を抽出し、Deep Nineに分析させます。すると、身体の細かい位置や角度、速度情報などの定量化が実現し、詳細なフィードバックが行えるようになります。

これまではセンスの一言で片付けられていたスポーツの能力も、ディープラーニングによって数値化することで、さらなるポテンシャルの向上が見込めるようになりました。

参考:DIAMOND SIGNAL「プロ野球選手の姿勢推定やテレ東のDXも支援、東大発AIスタートアップが放つ“アルゴリズムの力”」

まとめ

ディープラーニングの種類は実に豊富で、多くの事業に活用できるテクノロジーであることが証明されています。しかし、優れた技術には相応のハードウェアがなければ、実用的な運用が難しいのも事実です。

そこで活用をおすすめしめたいのが、当社のクラウドGPU「M:CPP」です。クラウド経由でハイエンドなGPUを好きなだけ契約できるだけでなく、オンプレミスよりもはるかに安価な導入コストを実現します。

MCPP

大手クラウドと比べても、M:CPPのサービスはリーズナブルで、抜群のコストパフォーマンスを発揮します。GPUの増設をお考えの場合には、ぜひM:CPPのクラウドGPUの運用も検討してみてください。