Xeon 6は倍速通信できるMRDIMMとCXL 2.0をサポート、Gaudi 3は価格が判明 インテル CPUロードマップ
ASCII.jp / 2024年8月26日 12時0分
前回でXeon 6についての解説はおおむね終了しているが、2つほど細かい話が抜けているのでその補足をしつつ、最後にGaudi 3の情報アップデートについて説明する。
Xeon 6向けのMRDIMMが出荷開始
連載785回にもあるが、Xeon 6世代ではDDR5で最大6400MT/秒をサポートするのに加え、MCR DIMMのサポートがあり最大8800MT/秒に対応するとされる。
この説明はCOMPUTEXのタイミングなので6月第1週だったが、6月16日にMicronはXeon 6向けにMRDIMMのサンプル出荷を開始した。量産出荷は今年後半を予定していることも発表された。
MRDIMM、あるいはMCR DIMMと呼ばれるものの仕組みは連載723回で説明している。連載736回で示した下のスライドの方がわかりやすいかもしれないが、従来Registered DIMMと呼ばれていたものはクロック信号、Address/Command、データという3種類の信号すべてについてDIMM上に置かれたレジスター(要するにバッファである)を介することで、信号の波形の乱れをレジスターで補正できるため、安定してDRAMチップとの通信が可能になるというものである。
このレジスターを改良というか魔改造(?)し、ホストとの間を倍速で通信できるようにするとともに、Rank 0/Rank 1の両方のDRAMチップに対してインターリーブ的に通信できるようにしたのがMRDIMMである。最初のMRDIMMは8800MT/秒となっているが、これはホストとレジスターの間の速度であり、レジスターとRank-0 DRAMあるいはRank-1 DRAMの間は4400MT/秒となる。
これにより、転送速度が従来のDDR5-4400の倍になるほか、1枚のDIMMに搭載できるRankの数を倍増できるので、DIMMあたりの容量も大きくできる(その分DIMMも大型化するが)。ただし現状でもDDR5で複数枚のDIMMを装着すると転送速度が4400MT/秒あたりに落ちる。というより、これを超えると安定して動作しないため、MRDIMMを利用する場合も当然1chあたり1枚となる。
実質的には従来2枚のRegistered DDR5 DIMMを1枚のMRDIMMに置き換えることになるため、トータルでの容量そのものは増えないかもしれない。
なおMCR DIMM(Multiplexer Combined Ranks DIMM)と称しているのはインテルだけで、他社はすべてMRDIMM(Multi-Capacity Rank DIMM)と称しており、内容は変わらない。したがって以下はMRDIMMで統一する。
さてこのMRDIMMだが、実は主要なFCLGA4677対応のサーバー向けマザーボードは半分くらいは1 DIMMスロット/チャンネル構成になっている。ただ残りの半分は2 DIMMスロット/チャンネルである。例えばSuperMicroのHyper SuperServer SYS-221H-TNRの場合、Socket 1つあたり16本のDIMMスロットが装備されている。
ところがMRDIMMの場合、仮に使っていなくても空きのDIMMスロットが配線上にあるだけで信号波形の乱れにつながるためか、基本1 DIMMスロット/チャンネルでないときちんと動かないらしい。今回ソケットをFCLGA 4677からFCLGA 4710に変更した理由は、既存のFCLGA 4677のままでは2 DIMMスロット/チャンネルのマザーボードでMRDIMMがきちんと動かないから、というあたりもあるのではないかと筆者は疑っている。
下の画像についてもう1つ話がある。Mem Channelの所を見ると、通常のRegistered DIMMに関しては6400MT/秒までであるが、問題はMRDIMMについてである。
そもそもMRDIMMをサポートするのはPコアのXeon 6のみ。つまりGranite Rapidsのみとされている。これはXeon 6700、すなわちFCLGA4710だけでなくFCLGA 7529(と言われている巨大なソケット)のXeon 6900も同じであり、要するにSierra Forest用のコンピュート・タイルに搭載されたDDR5のメモリーコントローラーはMRDIMMのサポートが省かれているらしい。
これは正直理解できない話で、いくらPコアに比べて性能が低めといっても、Xeon 6900の方のSierra Forestは最大288コア/576スレッドであることがすでに発表されている。
Xeon 6900だから12chのDDR5 I/Fを持つが、DDR5-6400のピーク値でも最大で614.4GB/秒。コアあたりで言えば2.1GB/秒程度、スレッドあたりで言えば1GB/秒そこそこでしかない。こういう比較が正しいかどうかわからないが、例えばAtomベースのIntel N100ですら4コアに対してDDR5-4800が提供されるから、コアあたりの帯域は9.6GB/秒はある計算で、本当にこれで十分な帯域なのか? は正直理解できない。
MRDIMMをサポートしたとしてもコアあたり2.93GB/秒程度、Threadあたりで1.5GB/秒弱でしかないから、サポートしてもたいして性能改善につながらない、という考え方もあるのかもしれないが。
また6700シリーズのPコアは最大で8000MT/秒というあたり、おそらくLCCのコアに搭載されたメモリーコントローラーは8000MT/秒止まりで、8800MT/秒はHCC/XCCコアのみのサポートだろう。技術的な問題というよりは、製品グレードによる差別化が主な目的であるように思われる。
PCIeを進化させた次世代インターコネクト規格CXL 2.0をサポート
Sapphire Rapids/Emerald Rapidsでは1.1止まりだったCXLのサポートであるが、Xeon 6ではやっと2.0になり、ちゃんとType 3 Device(CXLメモリー)がサポートされるようになった。
CXLに関してはコンピュート・チップレットではなくIOチップレット側に機能が搭載されているので、これはPコア/Eコア関係なく動作する。なのだが、Eコアにはよくわからない制限が付いた。Type 3のメモリーモデルには、以下の3つをサポートする。
このうち、かつてサポートしていたOptane Persistent Memoryを利用した構図は一番右のFlat memory Modeに近い。特定アプリケーション向けにOptane Persistent Memoryを利用していたユーザーは、あとはそのアプリケーションベンダーがCXL Memoryに対応してさえくれれば移行できることになる。
それはいいのだが、CXL Hetero Interleaveに関してはなぜかPコアのみでEコアのXeon 6ではサポートされないことになっている。どうしてこういう不思議な制約が付いたのか疑問だが、ここからするとEコアのコンピュート・チップレットに内蔵されたメモリーコントローラーはだいぶ制約があるというか、少なくともPコアに搭載されているものとはまったく素性が違うようだ。
なにかしらEコアでは配慮すべき技術的な課題があり、その結果がこの制約なのか、単に製品グレードによる差別化に起因するものなのか、判断が付かない。
AI アクセラレーターGaudi 3の価格はOAM1枚当たり230万円少々
最後にGaudi 3の話になるのだが、実は連載768回からのアップデートはほとんどない。技術的な説明も新しい情報はほぼ皆無である。強いて言えば、連載768回の最後で4096 OAMがほぼGaudi 3の最大構成に近いのではないか? と書いたが、今回8192 OAM(1024ノード)の例が示されたというくらいである。
ビジネス回りでは、価格が公開された。昨今NVIDIAのH100 80GBが500万円前後(一時期は700万円と言われていたが、最近少し下がったようだ)に比べると半値以下である。この価格の安さとアプリケーションによってはH100以上の性能を出せるということで、性能価格比の高さを前面に押し出してビジネスを進めていきたいようだ。
ただ現状Gaudi 3の導入を検討している所に理由を聞くと「H100のリードタイムが長すぎて待てないので、H100の導入までのつなぎ」というケースがけっこうあるのだそうで、どこまで今後のビジネスにつながるか、やや疑問ではある。
また連載768回の最後にも書いたが、Gaudi 3の後継はFalcon Shoreで、これはXeベースになることを考えると、Gaudi 3からXeへの移行ツールなどでどこまでソフトウェアがそのまま利用できるのか未知数である。
そのFalcon Shoreのロードマップも怪しい(現在インテルの社内ではすべての製品のロードマップ見直しがかけられているという話で、Falcon Shoreが絶対に生き残るという保証もないらしい)のだが、だからと言ってGaudi 4が出るという話にもならないだろう。このあたり、年末までにもう少しクリアになるといいのだが……。
この記事に関連するニュース
-
Microsoft 365 CopilotがNPUによるローカル処理に対応/「Google ドライブ」のArm版Windows 11ネイティブアプリ登場
ITmedia PC USER / 2024年11月24日 6時5分
-
スーパーマイクロ、スーパーコンピューティング2024にてHPCに最適化されたマルチノードシステムの最大規模のポートフォリオを発表
共同通信PRワイヤー / 2024年11月22日 9時44分
-
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU
ASCII.jp / 2024年11月18日 12時0分
-
Kingston、2023年も引き続きDRAMモジュール市場で首位を維持
PR TIMES / 2024年11月15日 14時40分
-
AMD、CXL 3.1/PCIe Gen6/LPDDR5に対応するアダプティブSoC「Versal Premium Series Gen 2」を発表
マイナビニュース / 2024年11月13日 6時45分
ランキング
-
1【セール価格記載】今買うべきお得な「PC用メモリー」はこれだ!
ASCII.jp / 2024年11月30日 7時0分
-
2PCで「Windowsキー+左右矢印キー」を押すと? アッと驚く隠れた便利機能に「スゲー便利」「知らなかった」
ねとらぼ / 2024年11月30日 11時0分
-
3「もう一度家を好きになりたいけど、増えるモノで埋まっていく」→プロに助けを求め9時間後…… 感動の景色に「やっぱ凄い」「素敵なお家」
ねとらぼ / 2024年11月30日 10時45分
-
4DLsiteの“スケベメルマガ”、実は若手女性社員率いるチームが書いていた “怪文書”作成のプロフェッショナルな作業風景
ITmedia NEWS / 2024年11月30日 12時0分
-
5ローン・クレカ審査可否の背景が分かる 信用スコア開示サービスがきょうスタート
ITmedia NEWS / 2024年11月28日 13時59分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください