NVIDIA、HGX-2を発表、HPCとAIコンピューティングを単一のアーキテクチャーに融合
MotorFan / 2018年5月31日 19時55分
NVIDIAは 5月31日、コンピューティングプラットフォームNVIDIAHGX-2を発表した。これは、人工知能(AI)とハイパフォーマンスコンピューティング(HPC)の両方に向けた単一のコンピューティングプラットフォームとして初となる製品である。
混合精度の計算能力を備えたクラウドサーバープラットフォームHGX-2は、比類のない柔軟性を提供し、コンピューティングの未来を後押しします。HGX-2により、科学技術計算およびシミュレーションに向けた、倍精度浮動小数点(FP64)や単精度浮動小数点(FP32)での高精度な演算が可能となる。また、AIのトレーニングや推論のためには、半精度浮動小数点(FP16)や整数(Int8)を用いることもできる。HPCとAIを組み合わせたアプリケーションが増加の一途をたどっている状況だが、HGX-2のかつてない多用途性により、こうしたアプリケーションからの要求も満たすことができるようになる。
NVIDIAHGX-2プラットフォームベースのシステムを市場に導入するため、今日の業界をリードする数多くのコンピューターメーカーが、互いに連携しながら計画を立てた。
NVIDIAの創業者兼CEOであるジェンスン・フアン氏 (Jensen Huang)は、5月31日から開催されているGPUテクノロジーカンファレンスTaiwanで講演を行ない、そのなかで次のように述べている。
「コンピューティングの世界は変わりました。CPUのスケーリングが減速しているにもかかわらず、今やコンピューティングへの需要はとどまるところを知らないのです。TensorコアGPUを備えたNVIDIAのHGX-2は、この業界に強力で多用途のコンピューティングプラットフォームを提供します。このプラットフォームは、HPCとAIを融合し、世界における重要課題を解決するものです」
HPCとAIに向けた最先端のシステムを作り上げるメーカーにとって、HGX-2は「構成要素」の役割を果たすものだ。HGX-2はAIのトレーニングに関するベンチマークResNet-50において、1秒あたり15500点の画像速度を実現し、トレーニングにおける記録を打ち立てた。またHGX-2は、CPUのみで構成されたサーバーであれば300台まで置き換えることが可能だ。
HGX-2にはインターコネクトファブリックであるNVIDIA NV Switchなどの画期的な機能を搭載している。この機能は、16基のNVIDIA Tesla V100 TensorコアGPUをシームレスにつなぎ合わせ、2ペタフロップスのAIパフォーマンスを実現するひとつの巨大なGPUとして動作させるというものだ。HGX-2を用いて作られた初のシステムが、先日発表されたNVIDIA DGX-2である。
HGX-2は、元となったNVIDIA HGX-1がComputex 2017に出展されてから1年を経て発表された。リファレンスアーキテクチャHGX-1は世界有数のサーバーメーカーや、大規模なデータセンターを運用している企業に広く採用された。こういった企業の中には、Amazon Web Services、Facebook、Microsoftが含まれている。
OEM、ODMによるシステムも年内に予定
業界をリードするサーバーメーカーであるLenovo、QCT、Supermicro、Wiwynnの4社は、HGX-2をベースにした自社製のシステムを、年内に上市する計画を発表している。
さらに、世界トップレベルのODMメーカーであるFoxconn、Inventec、Quanta、Wistronの4社がHGX-2ベースのシステムを設計中だ。これらもやはり年内上市が予定されており、世界最大級のクラウドデータセンターでの利用が、その目的とされている。
NVIDIA の GPU アクセラレーテッド サーバー プラットフォーム製品群
HGX-2はNVIDIAGPUアクセラレーテッドサーバープラットフォーム製品群のひとつ。このエコシステムは、AI、HPC、アクセラレーテッドコンピューティングによる広範なワークロードを最適なパフォーマンスで処理できる条件を満たした、サーバークラスの製品によって構成されている。
大手サーバーメーカーからのサポートを受けたこのプラットフォームは、GPUとCPUの最適な混合および相互接続を提供することで、データセンターのサーバーエコシステムと協調する。これによって、多様なトレーニング (HGX-T2)、推論 (HGX-I2)、スーパーコンピューティング (SCX) といったアプリケーションが実現する。顧客は、サーバープラットフォームを個別に選択することで、アクセラレーテッドコンピューティングによる複合的なワークロードに対応し、クラス内最高レベルのパフォーマンスを達成できるようになる。
広範な産業をサポート
トップクラスのOEMおよびODMメーカーが、HGX-2への強力な支持を表明している。
「Foxconnは長年、ハイパースケールコンピューティングソリューションへの注力を続けており、お客様からの評価も獲得することができました。Foxconnは、NVIDIAと共同でHGX-2プロジェクトに取り組めることを嬉しく思っています。HGX-2は、人工知能/ディープラーニングに対する爆発的な需要を満たすソリューションの中で、もっとも期待できるものであると言えるでしょう」
—エド・ウー氏 (Ed Wu)、Foxconn社コーポレートエグゼクティブバイスプレジデント兼Ingrasys社会長
「Inventecには、高いパフォーマンスとスケーラビリティを兼ね備えた、堅牢で革新的な設計のサーバーを、世界有数のデータセンターを運用するお客様に提供してきたという確かな実績があります。Inventecは、今後の製品設計へHGX-2を早急に組み込むことで、世界中の企業が利用できる最も強力なAIソリューションを、自社の製品ラインナップに取り入れることになるでしょう」
—エヴァン・チェン氏 (Evan Chien)、IEC White Box Product Center代表兼Inventec社中国事業部門ディレクター
「NVIDIAのHGX-2は、AIやHPCに集中したワークロードに対し2ペタフロップスものパフォーマンスを提供可能にする設計により、この分野で超えねばならないハードルを上げました。規模を拡大しパフォーマンスも最高にしたいというお客様からのニーズは高まっていますが、サーバーの構成要素であるHGX-2を用いれば、こういったニーズを満たすことができる新システムも迅速に開発可能となるでしょう」
—ポール・ジュ氏 (Paul Ju)、Lenovo DCGバイスプレジデント兼ゼネラルマネージャー
「クラウドの実現におけるリーダー的企業として、Quantaは様々な革新的ユースケースに向けた次世代クラウドソリューションの開発に力を入れています。AIアプリケーションの大幅な増加を受け、QuantaはNVIDIAと緊密に連携し、お客様が最新かつ最高のGPUテクノロジから利益を得られることを保証しています。HGX-2発売時のパートナーとして、AIクラウドを実現するこの重要な企業と共同でGPU演算製品ラインナップを拡大できることに、私たちは興奮を覚えているところです」
—マイク・ヤン氏 (Mike Yang)、Quanta Computer社バイスプレジデント兼QCT社社長
「AIモデルのサイズは急速に拡大中であり、トレーニングのために数週間を要することもあります。こうした状況への対応に役立てるため、SupermicroはHGX-2プラットフォームをベースにしたクラウドサーバーを開発中です。HGX-2システムにより、複雑なモデルのトレーニングでも効率的にできるようになるでしょう」
—チャールズ・リアン氏 (Charles Liang)、Supermicro社 社長兼CEO
「NVIDIAのパートナーとして共に働けることを、大変光栄に思います。今日、最新のテクノロジ環境において、AIクラウドコンピューティングへの需要が台頭しています。HGX-2システムの高いパフォーマンスとモジュール方式による柔軟性は、研究目的、科学用途から政府による利用まで、様々なコンピューティング領域に間違いなく大きく貢献するでしょう。」
—ジェフ・リン氏 (Jeff Lin)、Wistron社Enterprise Business Group代表
「Wiwynnはハイパースケールデータセンターとクラウドインフラストラクチャソリューションの提供を専門とする企業です。NVIDIA、そしてサーバー構成要素であるHGX-2とのコラボレーションにより、AIやHPCによる計算能力集約型のワークロードに向けた、2ペタフロップスのコンピューティングをお客様に提供できるでしょう」
—スティーブン・リュー氏 (Steven Lu)、Wiwynn社バイスプレジデント
外部リンク
この記事に関連するニュース
-
Supermicro、インテル® Xeon® 6 プロセッサー に対応する 次期 X14 サーバー製品ファミリーの予告と、アーリーアクセスプログラムを発表
共同通信PRワイヤー / 2024年4月15日 18時34分
-
AnsysとNVIDIA、コンピュータ支援エンジニアリングの新時代を切り拓く~協業拡大が推進するアクセラレーテッドコンピューティングとジェネレーティブAIがもたらすシミュレーションの未来
Digital PR Platform / 2024年4月11日 10時1分
-
HPE、生成AIのエンド・ツー・エンドを網羅するAIネイティブなポートフォリオを発表
PR TIMES / 2024年4月2日 2時40分
-
ASUSがGTC 2024でMGX搭載データセンターソリューションを展示
PR TIMES / 2024年3月28日 12時15分
-
AetinaがEmbedded World 2024で新しいAIトレーニングワークステーションのAIP-FR68を発表
共同通信PRワイヤー / 2024年3月27日 13時52分
ランキング
-
1ゲームプログラミング入門書、横浜の15歳が完成 「ないなら自分で書く」制作経験盛り込んだ380ページ
カナロコ by 神奈川新聞 / 2024年4月22日 11時30分
-
2札幌市、長谷川岳参院議員と職員との面談はすべて録音へ 威圧的な言動を抑止
産経ニュース / 2024年4月23日 16時28分
-
3迷惑おじさんキャンパーの“ある行動”のせいで家族キャンプが台無し。注意するとまさかの反応
女子SPA! / 2024年4月14日 8時47分
-
4【SBK第3戦オランダ】代役出場のニコラス・スピネッリがレース1、ラズガットリオグルがレース2を制覇
バイクのニュース / 2024年4月22日 17時10分
-
52ストロークエンジン車は、なぜあまり見かけなくなったのか?
バイクのニュース / 2024年4月22日 9時10分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください