1. トップ
  2. 新着ニュース
  3. IT
  4. パソコン

Intelの「Gaudi 3」って何? AIアクセラレーターとGPUは何が違う? NVIDIAやAMDに勝てる? 徹底解説!

ITmedia PC USER / 2024年7月5日 17時5分

459TFLOPS÷(128要素×128要素×2FLOPS×8基)≒1.75GHz(※1)

(※1)「256byte×256byte」は、FP16(16bit=2byte)を収納すると128要素×128要素となる

 一応、検算のためにFP8の理論性能値を使って計算すると、以下の通りとなる。

256要素×256要素×2FLOPS×8基×1.75GHz=1835TFLOPS

 スペック表と一致することが確認できた。

メモリ回りとインタフェース回りも増強

 Gadui 3の搭載メモリは、Gaudi 2と同じHBM2Eだが、動作クロックが3.2GHzから3.6GHzへと引き上げられている。メモリのバス幅も6144bit(1024bit×6チャンネル)から8192bit(1024bit×8チャンネル)に引き上げられている。そのため、メモリのアクセススピードは毎秒3.7TBと脅威的な値になっている。

 スペック表における「Networking」の項目は、別ノードのGaudi 3と連動動作をするためのインタフェース帯域のこと。先代では、200Gbpsイーサネットポートが12基搭載されていたが、Gaudi 3ではこれが24ポートになったので「200Gbps×24ポート÷8=毎秒600GB(片方向)」という通信速度だ。双方向なら倍の毎秒1200GBということになる。

 なお、ホストシステムとの接続に用いられるPCI Expressバスは、時代に合わせてPCI Express 3.0からPCI Express 5.0に変更されている。

●Gaudi 3のアーキテクチャをもうちょっと深掘り

 先述の通り、Gaudi 3には全く同一機能を備えた2つの中核的なダイ「ダイ0」と「ダイ1」をつなぎ合わせて、1つのプロセッサとして仕上げている。

 それぞれのダイは、「MME×2基」「TPC(Tensor Processor Cores)×16基」「24MBのキャッシュメモリ」の塊を2セット備えている。Intelではこの塊を「DCORE(Deep Learning Core)」と呼んでおり、Gaudi 3では4セットのDCOREが備わることになる。

 DCOREは、NVIDIAのGPUでいうところの「GPC(Graphics Processing Cluster)」に相当するものだと考えればよい。

 左右外辺にあるHBM2Eの16GBのメモリクラスターは、Gaudi 3からは16GB×8=128GBのまとまったメモリ空間として扱える。それぞれDCOREから見て「近い」「遠い」といった概念もない。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください