Xeon 6は倍速通信できるMRDIMMとCXL 2.0をサポート、Gaudi 3は価格が判明 インテル CPUロードマップ
ASCII.jp / 2024年8月26日 12時0分
前回でXeon 6についての解説はおおむね終了しているが、2つほど細かい話が抜けているのでその補足をしつつ、最後にGaudi 3の情報アップデートについて説明する。
Xeon 6向けのMRDIMMが出荷開始
連載785回にもあるが、Xeon 6世代ではDDR5で最大6400MT/秒をサポートするのに加え、MCR DIMMのサポートがあり最大8800MT/秒に対応するとされる。
この説明はCOMPUTEXのタイミングなので6月第1週だったが、6月16日にMicronはXeon 6向けにMRDIMMのサンプル出荷を開始した。量産出荷は今年後半を予定していることも発表された。
MRDIMM、あるいはMCR DIMMと呼ばれるものの仕組みは連載723回で説明している。連載736回で示した下のスライドの方がわかりやすいかもしれないが、従来Registered DIMMと呼ばれていたものはクロック信号、Address/Command、データという3種類の信号すべてについてDIMM上に置かれたレジスター(要するにバッファである)を介することで、信号の波形の乱れをレジスターで補正できるため、安定してDRAMチップとの通信が可能になるというものである。
このレジスターを改良というか魔改造(?)し、ホストとの間を倍速で通信できるようにするとともに、Rank 0/Rank 1の両方のDRAMチップに対してインターリーブ的に通信できるようにしたのがMRDIMMである。最初のMRDIMMは8800MT/秒となっているが、これはホストとレジスターの間の速度であり、レジスターとRank-0 DRAMあるいはRank-1 DRAMの間は4400MT/秒となる。
これにより、転送速度が従来のDDR5-4400の倍になるほか、1枚のDIMMに搭載できるRankの数を倍増できるので、DIMMあたりの容量も大きくできる(その分DIMMも大型化するが)。ただし現状でもDDR5で複数枚のDIMMを装着すると転送速度が4400MT/秒あたりに落ちる。というより、これを超えると安定して動作しないため、MRDIMMを利用する場合も当然1chあたり1枚となる。
実質的には従来2枚のRegistered DDR5 DIMMを1枚のMRDIMMに置き換えることになるため、トータルでの容量そのものは増えないかもしれない。
なおMCR DIMM(Multiplexer Combined Ranks DIMM)と称しているのはインテルだけで、他社はすべてMRDIMM(Multi-Capacity Rank DIMM)と称しており、内容は変わらない。したがって以下はMRDIMMで統一する。
さてこのMRDIMMだが、実は主要なFCLGA4677対応のサーバー向けマザーボードは半分くらいは1 DIMMスロット/チャンネル構成になっている。ただ残りの半分は2 DIMMスロット/チャンネルである。例えばSuperMicroのHyper SuperServer SYS-221H-TNRの場合、Socket 1つあたり16本のDIMMスロットが装備されている。
ところがMRDIMMの場合、仮に使っていなくても空きのDIMMスロットが配線上にあるだけで信号波形の乱れにつながるためか、基本1 DIMMスロット/チャンネルでないときちんと動かないらしい。今回ソケットをFCLGA 4677からFCLGA 4710に変更した理由は、既存のFCLGA 4677のままでは2 DIMMスロット/チャンネルのマザーボードでMRDIMMがきちんと動かないから、というあたりもあるのではないかと筆者は疑っている。
下の画像についてもう1つ話がある。Mem Channelの所を見ると、通常のRegistered DIMMに関しては6400MT/秒までであるが、問題はMRDIMMについてである。
そもそもMRDIMMをサポートするのはPコアのXeon 6のみ。つまりGranite Rapidsのみとされている。これはXeon 6700、すなわちFCLGA4710だけでなくFCLGA 7529(と言われている巨大なソケット)のXeon 6900も同じであり、要するにSierra Forest用のコンピュート・タイルに搭載されたDDR5のメモリーコントローラーはMRDIMMのサポートが省かれているらしい。
これは正直理解できない話で、いくらPコアに比べて性能が低めといっても、Xeon 6900の方のSierra Forestは最大288コア/576スレッドであることがすでに発表されている。
Xeon 6900だから12chのDDR5 I/Fを持つが、DDR5-6400のピーク値でも最大で614.4GB/秒。コアあたりで言えば2.1GB/秒程度、スレッドあたりで言えば1GB/秒そこそこでしかない。こういう比較が正しいかどうかわからないが、例えばAtomベースのIntel N100ですら4コアに対してDDR5-4800が提供されるから、コアあたりの帯域は9.6GB/秒はある計算で、本当にこれで十分な帯域なのか? は正直理解できない。
MRDIMMをサポートしたとしてもコアあたり2.93GB/秒程度、Threadあたりで1.5GB/秒弱でしかないから、サポートしてもたいして性能改善につながらない、という考え方もあるのかもしれないが。
また6700シリーズのPコアは最大で8000MT/秒というあたり、おそらくLCCのコアに搭載されたメモリーコントローラーは8000MT/秒止まりで、8800MT/秒はHCC/XCCコアのみのサポートだろう。技術的な問題というよりは、製品グレードによる差別化が主な目的であるように思われる。
PCIeを進化させた次世代インターコネクト規格CXL 2.0をサポート
Sapphire Rapids/Emerald Rapidsでは1.1止まりだったCXLのサポートであるが、Xeon 6ではやっと2.0になり、ちゃんとType 3 Device(CXLメモリー)がサポートされるようになった。
CXLに関してはコンピュート・チップレットではなくIOチップレット側に機能が搭載されているので、これはPコア/Eコア関係なく動作する。なのだが、Eコアにはよくわからない制限が付いた。Type 3のメモリーモデルには、以下の3つをサポートする。
このうち、かつてサポートしていたOptane Persistent Memoryを利用した構図は一番右のFlat memory Modeに近い。特定アプリケーション向けにOptane Persistent Memoryを利用していたユーザーは、あとはそのアプリケーションベンダーがCXL Memoryに対応してさえくれれば移行できることになる。
それはいいのだが、CXL Hetero Interleaveに関してはなぜかPコアのみでEコアのXeon 6ではサポートされないことになっている。どうしてこういう不思議な制約が付いたのか疑問だが、ここからするとEコアのコンピュート・チップレットに内蔵されたメモリーコントローラーはだいぶ制約があるというか、少なくともPコアに搭載されているものとはまったく素性が違うようだ。
なにかしらEコアでは配慮すべき技術的な課題があり、その結果がこの制約なのか、単に製品グレードによる差別化に起因するものなのか、判断が付かない。
AI アクセラレーターGaudi 3の価格はOAM1枚当たり230万円少々
最後にGaudi 3の話になるのだが、実は連載768回からのアップデートはほとんどない。技術的な説明も新しい情報はほぼ皆無である。強いて言えば、連載768回の最後で4096 OAMがほぼGaudi 3の最大構成に近いのではないか? と書いたが、今回8192 OAM(1024ノード)の例が示されたというくらいである。
ビジネス回りでは、価格が公開された。昨今NVIDIAのH100 80GBが500万円前後(一時期は700万円と言われていたが、最近少し下がったようだ)に比べると半値以下である。この価格の安さとアプリケーションによってはH100以上の性能を出せるということで、性能価格比の高さを前面に押し出してビジネスを進めていきたいようだ。
ただ現状Gaudi 3の導入を検討している所に理由を聞くと「H100のリードタイムが長すぎて待てないので、H100の導入までのつなぎ」というケースがけっこうあるのだそうで、どこまで今後のビジネスにつながるか、やや疑問ではある。
また連載768回の最後にも書いたが、Gaudi 3の後継はFalcon Shoreで、これはXeベースになることを考えると、Gaudi 3からXeへの移行ツールなどでどこまでソフトウェアがそのまま利用できるのか未知数である。
そのFalcon Shoreのロードマップも怪しい(現在インテルの社内ではすべての製品のロードマップ見直しがかけられているという話で、Falcon Shoreが絶対に生き残るという保証もないらしい)のだが、だからと言ってGaudi 4が出るという話にもならないだろう。このあたり、年末までにもう少しクリアになるといいのだが……。
この記事に関連するニュース
-
イノディスク、エッジAIと生成AI用途に対応したDDR5 6400 64GB DRAMシリーズを発表
共同通信PRワイヤー / 2024年10月31日 15時24分
-
マイクロン、Crucial DDR5 Proシリーズにゲーマー向けの高速ゲーミングメモリを新たに追加
PR TIMES / 2024年10月30日 15時15分
-
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ
ASCII.jp / 2024年10月28日 13時0分
-
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ
ASCII.jp / 2024年10月21日 12時0分
-
ASUS、革新的なインテル Xeon 6 プロセッサー搭載サーバーを発表
PR TIMES / 2024年10月10日 12時15分
ランキング
-
1甘えベタな猫、飼い主の“ひざ”を見つめ思い悩んだ末…… 涙が出るラストに「可愛げの権化!」「なんて奥ゆかしいの」と100万表示
ねとらぼ / 2024年11月8日 7時0分
-
2「むりだろww」「笑いました」 ニトリでソファ購入 → 愛車の前でぼうぜん…… “まさかの悲劇”が1000万表示
ねとらぼ / 2024年11月8日 7時40分
-
3電気代が安い「暖房器具」って何ですか? FPが主な暖房器具の電気代を比較して回答
Fav-Log by ITmedia / 2024年11月7日 9時50分
-
4知らなかった……シャープとカシオでは電卓のキー配列が全然違うらしい
ASCII.jp / 2024年11月8日 8時30分
-
5シャオミ「Redmi 14C」レビュー - 5つのポイントでお値段以上のエントリーモデル!
マイナビニュース / 2024年11月7日 23時45分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください