【2021】ディープラーニングのサーバーの選び方は?GPUが注目されている理由

ディープラーニング向けサーバー

ディープラーニングの運用は、専用のGPUサーバーを用意することでさらに効果的な計算処理が実現します。一言で「サーバー」とは言っても、さまざまな種類があるため、何を基準にして選べば良いのかわからなくなることもあります。

今回は、ディープラーニングにGPUサーバーが活躍する理由や、最適なサーバーの選び方について紹介します。

GPUサーバーとは

GPUサーバーとは

GPUサーバーは、ユーザーが使用しているPCとは別に、外部リソースとしてGPUを提供するサーバーのことです。GPU特化のハードウェアであるため、自前のPCでは出せないようなパフォーマンスをGPUサーバーでは発揮できます。

GPUはGraphic Processing Unitの略称で、基本的にはその名のとおりグラフィック部門の計算処理を行うことに特化したユニットです。

通常、コンピューターにおける計算処理はCPUが司っています。あらゆる挙動や入出力の作業がCPUによって行われていますが、グラフィックだけは別です。

グラフィックの描写には他の処理とは異なり、膨大な計算処理が短時間の間に必要とされます。そのため、GPUというグラフィック専門のプロセッサを備えることにより、CPUに負荷がかかるのを防ぎます。

近年の高画質動画の再生や質の高い3Dグラフィックを実現したのは、GPUの性能が進化したこともその理由として挙げられます。

GPUサーバーがディープラーニングで活躍する理由

さて、このようなグラフィックに特化したGPUは、人工知能の分野、特にディープラーニングの開発において、大いに注目されるようになりました。グラフィックとAIは領域の異なる分野であるため、GPUが双方で活躍しているイメージは沸きにくいものです。

しかし、両者には共通点もあります。それは、GPU特有の「並列処理」が大いに役立つタスクを有している点です。

グラフィックの描写には膨大な計算処理が発生しますが、ここで必要としているのは単調な計算処理をいかに素早くこなすかという能力です。

CPUのように、GPUはコンピューターの多様な計算処理をこなす必要がないため、一つのタスクを効率良く処理する機能を備えています。それが並列処理と呼ばれるもので、似通ったタスクを同時に複数こなすことができるという機能です。

GPUの性能は、この並列処理において一度に幾つのタスクをこなせるかという器用さに依存すると言っても過言ではありません。

そして、並列処理を必要とするのはグラフィックだけではありません。実は、AI分野におけるディープラーニングもまた、並列処理を必要とするタスクが発生します。

大量のデータを一度に処理できればできるほど、コンピューターの学習速度は向上します。そのため、GPUの性能はAIのパフォーマンスに直結しているわけです。

このような理由から、ディープラーニングの分野においてもGPUが活用されることとなったのです。

主なGPUサーバーの種類

主なGPUサーバーの種類

GPUサーバーは、大きく分けて「オンプレミス」と「クラウド」の2種類に分けられます。両者の特徴について解説しましょう。

オンプレミス

オンプレミスのGPUサーバーは、いわゆる典型的な設置型のサーバーです。社用としてサーバーを購入、あるいはレンタルし、自前でサーバーのカスタマイズ、そして保守管理を行います。

オンプレミスのサーバーは、用意した分を好きなだけ活用することができます。必要な分より多めのリソースを確保すれば、それだけ余剰が生まれるため、繁忙期がきた場合でも安心して計算処理を行えます。

逆に、ギリギリのリソースでやりくりしようとすると、いざ繁忙期になった際にパフォーマンスが低下してしまう可能性があります。与えられているキャパシティには限界があるため、カツカツの状態では満足のいくGPU活用がかなわない可能性もあります。

そのため、オンプレミスでサーバーを用意する場合には、あらかじめ余裕を持ってリソースを確保することが大切です。サーバーの増設もリクエストからすぐに実現するわけではないため、すぐ必要なときにGPUをフル稼働できない可能性があります。

ただ、サーバーを増設すればその分運用コストも大きくなります。繁忙期は増設した分をフル活用できるので気になりませんが、GPUサーバーをあまり必要としないフェースにおいては維持費だけがかかってしまい、その分のコスト負担は無駄になってしまいます。

クラウド

一方のクラウド型GPUサーバーですが、オンラインのクラウド経由でGPUのリソースを確保できるというものです。オンプレミスではオフラインでの利用が前提でしたが、クラウドではオンライン環境が前提の運用環境となります。

ただし、導入に際してはサーバーを物理的に設置する必要がないため、オンプレミスのときに発生していた設置作業やスペースの圧迫は発生しないことが特徴です。

インターネット経由でリソースが提供されるため、業務環境がオフィスなどの特定の場所に依存しないことも特徴です。必要があればリモート環境でも活用できるため、働き方改革の推進にも役立つでしょう。

GPUクラウドに注目が集まる理由

GPUクラウドに注目が集まる理由

このように、クラウド型のGPUサーバーは従来のオンプレミスサーバーとは異なる性質を持っているため、さまざまなメリットが期待されています。GPUクラウドに注目が集まっている理由について、もう少し詳しく解説しましょう。

高いコストパフォーマンス

GPUクラウド運用の最大のメリットは、高いコストパフォーマンスにあります。

オンプレミスのサーバーの場合、ネックとなるのが初期費用です。サーバーを丸ごと買い込むとなると、その導入予算は数百万円にのぼることも珍しくなく、おいそれと購入することは難しいものです。

また、GPUは定期的にバージョンアップが繰り返されるため、可能であれば買い替えもおこなうことが良いとされています。しかし、GPUサーバーのように高価なハードとなると、買い替えも手軽に行えるものではありません。

そのため、パフォーマンスが低下しているのにもかかわらず、旧式のGPUを使い続けるなんてこともあり得るのですが、クラウドではればその心配はありません。クラウドは、あくまでもベンダーの提供するGPUのライセンスを購入するだけなので、自らGPUを管理する業務は発生しません。

豊富なプランから最適なGPUを選べるだけでなく、最新のGPUも積極的に導入が進んでいます。これらは手頃な価格で利用できるようになるでしょう。

また、サーバーの保守運用にかかる費用もベンダー側で負担されるので、ユーザーは月々の利用料を払うだけで余計な負担は発生しません。借りたいときに借りて、使わない時は契約を解除するという使い方ができるので、維持費が必要以上に生まれる心配がないのが嬉しいところです。

柔軟な導入プロセス

GPUサーバーをクラウドで利用する場合、早ければ当日中にはスタートできるというスムーズさも魅力です。

オンプレミスであれば申し込みからサーバーが到着するまで、数週間かかることもあります。しかし、クラウドであれば、短期間ですぐに利用環境を整えられるだけでなく、設置作業も発生しないため、業務の遂行を速やかに行えます。

サーバー移行時にはある程度業務効率が低下することも考えられますが、この影響を最小限に留められるのはクラウドならではの利点です。

BCP対策

日本は地震や津波、台風など自然災害の多い環境であるため、常に不足の事態に備えたリスクマネジメントは必要です。いわゆるBCP対策と呼ばれるものですが、クラウド型GPUサーバーの活用は、BCP対策(事業継続対策)にも有効です。

クラウド型のサーバーの場合、会社にサーバーを設置することはありません。そのため、会社が何らかの被害を受けたり、出社ができない状況になったりしても、問題なくGPUを活用し業務の続行が可能です。

また、クラウドサーバーを提供しているベンダーはバックアップのサーバーも用意しているため、いきなり作業が停止してしまったり、データが消えてしまったりする心配はありません。少なくとも会社の都合に左右されることなく、安定したパフォーマンスを提供してくれるという強みを備えています。

ディープラーニングに最適なGPUサーバーの選び方

ディープラーニングに最適なGPUサーバーの選び方

次に、ディープラーニングに最適なGPUサーバーの選び方も確認しましょう。大きな負荷が発生するディープラーニングなので、サーバー選びは丁寧に行う必要があります。

冷却・排熱設計の良し悪し

一つ目は、GPUサーバーの温度管理が適切に行えるかどうかです。GPUサーバーは、処理が大きくなればなるほど高温になっていくため、常温を維持するための冷却システムや、外気を取り込む吸排気機構を備えている必要があります。

排熱がうまくいかずサーバーが高温になると、パフォーマンスが急に重くなり、本来の速度で処理を行うことができなくなります。

そのため、高負荷をかけても常温を維持できるよう、優れた冷却システムを備えていることは、ディープラーニング活用において重要になります。

消費電力の少なさ

2つ目は、消費電力の小さなサーバーを選ぶことです。

当たり前ですが、GPUサーバーは電力の負担が大きいため、短時間の利用であっても莫大なエネルギーを消費します。そのため、規模の大きなサーバーとなれば電気料金も馬鹿にならず、その維持費が無視できない負担となるケースもあります。

そのため、少しでも電力消費の効率が良くエコロジカルなモデルを選ぶことも重要です。多少高額であっても、維持にかかる光熱費が小さくなることで、長期間の利用でお得になることが期待できるためです。

GPUとCPUの接続方法を選べるかどうか

GPUを使ったディープラーニングの活用方法には、実は複数のアプローチが存在します。GPUとCPUの使用比率がアプローチによって異なるケースがあるため、快適な運用にはこの点にも配慮しなければなりません。

GPUサーバーは、モデルによってはGPUとCPUの接続方法を選べるものも存在します。接続方法を選べることで、ディープラーニングに最適なハードウェア環境を構築することができます。

柔軟な接続方法を確保できるモデルを選び、AIを最大限活用しましょう。

主要なGPUサーバーを比較

最後に、国内で主要なGPUサーバーレンタルサービスについても紹介しておきます。以下の表は、料金や導入スペックを簡単に表にしたものです。

サービス名 導入GPU メモリ容量(VRAM) 初期費用 1時間当たりの料金
さくらインターネット NVIDIA P40 24GB 要問い合わせ 349円〜
HGA NVIDIA V100S 32GB 無料 335円〜
カゴヤ NVIDIA Tesla P40 24GB 無料 347円〜

さくらインターネット

オンプレミスのレンタルサーバーとクラウドのサーバーの両方を提供するさくらインターネットでは、ディープラーニングなどの負荷の大きな業務に最適なプラン、「高火力シリーズ」を用意しています。

NVIDIA のデータセンター向け GPUである、NVIDIA P40、または P100を備えているだけでなく、最新のGPUであり、AI特化の機能であるTensorコアを導入した NVIDIA V100も選べます。初心者向けのディープラーニング環境はもちろん、ハイエンドな環境も構築ができるため、長期間にわたって活躍が期待できるサービスです。

課金方式は月額課金と時間単位での課金の両方から選ぶことができ、短期間での利用を検討している場合には時間単位での申し込みが便利です。

HGA

HIGHRESO GPU ADVANCE、通称HGAは、日本最大級のGPUデータセンターから、ローコストで運用できるGPUを提供するクラウドサービスです。データセンターの設計・施工・運用代行、そして自社データセンター運用までを手掛けているHGAでは、開発から運用・保守までを一貫して自社で担うことにより、リーズナブルな価格を実現しています。

また、サーバールームにはエアコンを必要としないエアフロー設計を導入することで、5,500枚ものGPUを安定稼働させています。維持費を最低限に抑え、それでいて安定性を確保できるシステムを構築しているため、高いコストパフォーマンスでの運用が可能となっています。

GPUにはレンダリング用の「Radeon™ ProRender」がプリインストールされています。TensorFlowやPytorchなど、ディープラーニングやAI向けのフレームワークも備わっているため、導入後すぐAI開発を進めていくことが可能です。

カゴヤ・ジャパン

カゴヤ・ジャパンのGPUサーバーは、NVIDIA社のデータセンター向けGPUである「Tesla P100」「Tesla P40」を搭載したベアメタルサーバーを提供しているのが特徴です。ディープラーニングのような高負荷を要求するタスクに対しても、安定したハイパフォーマンスを実現してくれます。

性能とは相反する価格設定も魅力で、1時間あたり347円から利用ができることも特徴です。最低利用期間が設定されていないため、短期間・長期間を問わず、好きなだけGPUサーバーを活用できます。

まとめ

GPUサーバーは、ディープラーニングをフル活用する上では欠かせないハードウェアです。オンプレミス型とクラウド型から選んで利用できますが、柔軟な活用方法を重視するならクラウド型で、近年は多くの企業が後者を選択するようになってきました。

クラウドでのGPUサーバーは面倒な手続きが必要なく、コストパフォーマンスや災害対策にも優れているため、多くのメリットを享受できます。時間単位でサーバーを利用できるサービスも増えており、時間制限もないため、ニーズに応じた柔軟な利用方法を実現できます。

これからGPUサーバーの拡張を考えているという方は、まずクラウドでその性能を試し、効率的な運用方法を検討していくと良いでしょう。