NVIDIA、HGX-2を発表、HPCとAIコンピューティングを単一のアーキテクチャーに融合

MotorFan / 2018年5月31日 19時55分

NVIDIAは　5月31日、コンピューティングプラットフォームNVIDIAHGX-2を発表した。これは、人工知能（AI）とハイパフォーマンスコンピューティング（HPC）の両方に向けた単一のコンピューティングプラットフォームとして初となる製品である。

　混合精度の計算能力を備えたクラウドサーバープラットフォームHGX-2は、比類のない柔軟性を提供し、コンピューティングの未来を後押しします。HGX-2により、科学技術計算およびシミュレーションに向けた、倍精度浮動小数点（FP64）や単精度浮動小数点（FP32）での高精度な演算が可能となる。また、AIのトレーニングや推論のためには、半精度浮動小数点（FP16）や整数（Int8）を用いることもできる。HPCとAIを組み合わせたアプリケーションが増加の一途をたどっている状況だが、HGX-2のかつてない多用途性により、こうしたアプリケーションからの要求も満たすことができるようになる。

　NVIDIAHGX-2プラットフォームベースのシステムを市場に導入するため、今日の業界をリードする数多くのコンピューターメーカーが、互いに連携しながら計画を立てた。

　NVIDIAの創業者兼CEOであるジェンスン・フアン氏 (Jensen Huang)は、5月31日から開催されているGPUテクノロジーカンファレンスTaiwanで講演を行ない、そのなかで次のように述べている。

「コンピューティングの世界は変わりました。CPUのスケーリングが減速しているにもかかわらず、今やコンピューティングへの需要はとどまるところを知らないのです。TensorコアGPUを備えたNVIDIAのHGX-2は、この業界に強力で多用途のコンピューティングプラットフォームを提供します。このプラットフォームは、HPCとAIを融合し、世界における重要課題を解決するものです」

　HPCとAIに向けた最先端のシステムを作り上げるメーカーにとって、HGX-2は「構成要素」の役割を果たすものだ。HGX-2はAIのトレーニングに関するベンチマークResNet-50において、1秒あたり15500点の画像速度を実現し、トレーニングにおける記録を打ち立てた。またHGX-2は、CPUのみで構成されたサーバーであれば300台まで置き換えることが可能だ。

　HGX-2にはインターコネクトファブリックであるNVIDIA NV Switchなどの画期的な機能を搭載している。この機能は、16基のNVIDIA Tesla V100 TensorコアGPUをシームレスにつなぎ合わせ、2ペタフロップスのAIパフォーマンスを実現するひとつの巨大なGPUとして動作させるというものだ。HGX-2を用いて作られた初のシステムが、先日発表されたNVIDIA DGX-2である。

　HGX-2は、元となったNVIDIA HGX-1がComputex 2017に出展されてから1年を経て発表された。リファレンスアーキテクチャHGX-1は世界有数のサーバーメーカーや、大規模なデータセンターを運用している企業に広く採用された。こういった企業の中には、Amazon Web Services、Facebook、Microsoftが含まれている。

OEM、ODMによるシステムも年内に予定

　業界をリードするサーバーメーカーであるLenovo、QCT、Supermicro、Wiwynnの4社は、HGX-2をベースにした自社製のシステムを、年内に上市する計画を発表している。

　さらに、世界トップレベルのODMメーカーであるFoxconn、Inventec、Quanta、Wistronの4社がHGX-2ベースのシステムを設計中だ。これらもやはり年内上市が予定されており、世界最大級のクラウドデータセンターでの利用が、その目的とされている。

NVIDIA の GPU アクセラレーテッドサーバープラットフォーム製品群

　HGX-2はNVIDIAGPUアクセラレーテッドサーバープラットフォーム製品群のひとつ。このエコシステムは、AI、HPC、アクセラレーテッドコンピューティングによる広範なワークロードを最適なパフォーマンスで処理できる条件を満たした、サーバークラスの製品によって構成されている。

　大手サーバーメーカーからのサポートを受けたこのプラットフォームは、GPUとCPUの最適な混合および相互接続を提供することで、データセンターのサーバーエコシステムと協調する。これによって、多様なトレーニング (HGX-T2)、推論 (HGX-I2)、スーパーコンピューティング (SCX) といったアプリケーションが実現する。顧客は、サーバープラットフォームを個別に選択することで、アクセラレーテッドコンピューティングによる複合的なワークロードに対応し、クラス内最高レベルのパフォーマンスを達成できるようになる。

広範な産業をサポート

　トップクラスのOEMおよびODMメーカーが、HGX-2への強力な支持を表明している。

「Foxconnは長年、ハイパースケールコンピューティングソリューションへの注力を続けており、お客様からの評価も獲得することができました。Foxconnは、NVIDIAと共同でHGX-2プロジェクトに取り組めることを嬉しく思っています。HGX-2は、人工知能／ディープラーニングに対する爆発的な需要を満たすソリューションの中で、もっとも期待できるものであると言えるでしょう」
—エド・ウー氏 (Ed Wu)、Foxconn社コーポレートエグゼクティブバイスプレジデント兼Ingrasys社会長

「Inventecには、高いパフォーマンスとスケーラビリティを兼ね備えた、堅牢で革新的な設計のサーバーを、世界有数のデータセンターを運用するお客様に提供してきたという確かな実績があります。Inventecは、今後の製品設計へHGX-2を早急に組み込むことで、世界中の企業が利用できる最も強力なAIソリューションを、自社の製品ラインナップに取り入れることになるでしょう」
—エヴァン・チェン氏 (Evan Chien)、IEC White Box Product Center代表兼Inventec社中国事業部門ディレクター

「NVIDIAのHGX-2は、AIやHPCに集中したワークロードに対し2ペタフロップスものパフォーマンスを提供可能にする設計により、この分野で超えねばならないハードルを上げました。規模を拡大しパフォーマンスも最高にしたいというお客様からのニーズは高まっていますが、サーバーの構成要素であるHGX-2を用いれば、こういったニーズを満たすことができる新システムも迅速に開発可能となるでしょう」
—ポール・ジュ氏 (Paul Ju)、Lenovo DCGバイスプレジデント兼ゼネラルマネージャー

「クラウドの実現におけるリーダー的企業として、Quantaは様々な革新的ユースケースに向けた次世代クラウドソリューションの開発に力を入れています。AIアプリケーションの大幅な増加を受け、QuantaはNVIDIAと緊密に連携し、お客様が最新かつ最高のGPUテクノロジから利益を得られることを保証しています。HGX-2発売時のパートナーとして、AIクラウドを実現するこの重要な企業と共同でGPU演算製品ラインナップを拡大できることに、私たちは興奮を覚えているところです」
—マイク・ヤン氏 (Mike Yang)、Quanta Computer社バイスプレジデント兼QCT社社長

「AIモデルのサイズは急速に拡大中であり、トレーニングのために数週間を要することもあります。こうした状況への対応に役立てるため、SupermicroはHGX-2プラットフォームをベースにしたクラウドサーバーを開発中です。HGX-2システムにより、複雑なモデルのトレーニングでも効率的にできるようになるでしょう」
—チャールズ・リアン氏 (Charles Liang)、Supermicro社社長兼CEO

「NVIDIAのパートナーとして共に働けることを、大変光栄に思います。今日、最新のテクノロジ環境において、AIクラウドコンピューティングへの需要が台頭しています。HGX-2システムの高いパフォーマンスとモジュール方式による柔軟性は、研究目的、科学用途から政府による利用まで、様々なコンピューティング領域に間違いなく大きく貢献するでしょう。」
—ジェフ・リン氏 (Jeff Lin)、Wistron社Enterprise Business Group代表

「Wiwynnはハイパースケールデータセンターとクラウドインフラストラクチャソリューションの提供を専門とする企業です。NVIDIA、そしてサーバー構成要素であるHGX-2とのコラボレーションにより、AIやHPCによる計算能力集約型のワークロードに向けた、2ペタフロップスのコンピューティングをお客様に提供できるでしょう」
—スティーブン・リュー氏 (Steven Lu)、Wiwynn社バイスプレジデント