Lunar LakeはWindows 12の要件である40TOPSを超えるNPU性能 インテル CPUロードマップ
ASCII.jp / 2024年4月15日 12時0分
米国時間の4月9日、インテルはアリゾナ州フェニックスでIntel Vision 2024を開催した。このIntel Visionの基調講演の模様はインテルのウェブサイトから視聴可能である。
さて、Intel Vision 2024はほぼすべてがAIにまつわる話題となった。これに絡んで、新しいハードウェア絡みの話がいくつか出てきたので、これを解説しよう。といっても冒頭の話は、昨年12月に開催されたAI Everywhereのものとそれほど変わらない。では今回のアップデートはなにか? という話になる。
Core Ultraの生産が予想より順調 増産できるかはFab 34次第
まずインテルがクライアント/エッジ/データセンターのすべての領域に製品を展開しているのは繰り返すまでもないわけだが、エンタープライズ&エッジとデータセンターは後述するとして、まずはAI PC Nodeについてだ。
昨年末にCore Ultraが正式に発表され、同日製品出荷が始まったわけだが、すでに4月の時点で500万台以上が出荷されており、年末までには4000万台が出荷される予定であることが明らかにされた。
以前連載734回で、かなり悲観的に見積もっても月産36万個は固い、という数字を説明したが、実際にはもっと生産量が多かったかたちだ。
歩留まりを80%程度と見積もるとウェハー1枚あたりCPUタイルが580個程取れる計算になる。キリが良いから500個として、4ヵ月ほどで500万個の出荷ということはこの4ヵ月でIntel 4のウェハーを1万枚ほど生産できていることになる。
月産あたり2500枚という数字になるわけで、これは予想よりかなり順調である。とはいえ、連載734回の予測は最悪値に近いものなので、上回っていないとビジネスとして成立しにくいのだが。
そして今年末までに4000万台を出荷ということなので、8ヵ月程度で3500万個のコンピュートタイルを製造する必要がある。ウェハーにすれば35万枚で、毎月4万枚強の量産が必要になる。これが実現できるかどうか、はFab 34がどこまで迅速にIntel 4の量産をスタートできるかどうかにかかっている。
Fab 34は昨年9月に量産開始のアナウンスがあったが、これはまだMeteor Lakeのシリコンではなくテスト用のものだし、量産工程を全部回せるようになったというだけで、大量生産には至っていない。
現状の月産2500枚という数字は、規模からいってオレゴンのD1での製造がメインで、Fab 34の分があったとしてもそれほど多くはないと考えられる。まずはこのFab 34の立ち上げがどこまで迅速に行なえるかが、このスライドの数字を実現できるかどうかの鍵になりそうだ。
Lunar LakeはWindows 12の要件である 40TOPSを超えるNPU性能
さて、現在のMeteor Lakeの後継(?)として開発中なのがLunar Lakeである。「後継(?)」というのは、Meteor LakeのすべてのSKUをカバーできないためだ。
Meteor Lakeは2種類のコンピュートタイルがあり、高性能な方は6×Pコア+8×Eコア、省電力な方は2×2コア+8×Eコアという構成になっている。実際の製品で言えばMeteor LakeのU-SKUが省電力版のコンピュートタイル、その他が高性能版のコンピュートタイルを使っているわけだが、Lunar LakeはこのU-SKU側の後継製品として位置づけられており、通常版のSKUの方は「現在聞いている限りでは」Meteor Lakeが引き続き投入されることになっているはず(これが更新されるのは、さらにその次のArrow Lake世代)である。
ただここに来て、次世代のWindows 12が40TOPS以上のNPU性能を必要とする、という報道が出ているのはご存じのとおり。これはまだ正式なものではない(現実問題としてこれを厳密に適用すると、現在市場に出ているすべてのPCがWindows 12に移行できなくなる)のだが、1つの目安になっているのは確かである。
Meteor LakeのNPUは10TOPS程度の性能に過ぎないのだが、Lunar Lakeではプラットフォーム全体で100TOPS以上になるとされ、NPU単体でも45TOPSであることが今回公開された。
つまりLunar LakeはWindows 12の要件である40TOPSを超えるNPU性能を発揮するわけだが、となるとLunar Lakeの出荷が開始されると、U SKUの省電力ノートはWindows 12対応なのに、よりパワフルなH SKUはWindows 12に対応できない、という逆転現象が起きてしまうことになる。
このあたりをどういう形で解決するのか、今のところはっきりしていない。あるいは、この時期にNPUをLunar Lakeのものに入れ替えた、Meteor Lake Refreshが出てくるのだろうか? この場合、SoCタイルの入れ替えだけで済むのでチップ全体の作り直しよりは簡単で、SoCタイルとパッケージで済むだろう。
第6世代Xeon ScalableがXeon 6に名称変更
次はXeonの話。現在出荷中のEmerald Rapidsに続き、EコアのみのSierra Forestと、PコアのみのGranite Rapidsが現在開発中という話は連載736回で報じたわけだが、そのSierra ForestとGranite Rapidsが"6th Gen Xeon Scalable"ではなく、Xeon 6というブランドになることが今回発表された。
基調講演ではそのSierra ForestのウェハーとGranite Rapidsのウェハーも披露された。
いつものように無理やり歪みを取って比率の補正をしたのが下の画像で、300mmウェハーで11.5×13.2個ほど。ダイの寸法は26.1×22.7mmといった感じで、写真からの推定面積は592mm2前後。実際には600mm2前後というあたりと想像される。
まだGranite Rapidsのタイル構成などは不明だが、おそらく2つということはなく、XCC構成ではまた4 タイルになりそうである。
さて、今回はまだそのXeon 6のSKUや性能の詳細など細かい話は一切開示されていない。Eコア、つまりSierra Forestであるが、こちらは性能/消費電力比が2.4倍、ラックあたりの性能で言えば2.7倍になるという説明があった。
このラック当たりの性能ということで出てきた説明が下の画像で、200サーバーラックの第2世代インテルXeonプロセッサーと、72サーバーラックのEコアベースのXeon 6が同等の性能で、しかも消費電力が1MW少ない、としている。
比較対象が第2世代Xeon、つまりCascade Lake世代である。この世代の場合、Xeon 9200という例外(MCM構造で2ダイを無理やり1パッケージ化したもので、プラットフォームの互換性はない)を別にすると、コア数は最大28コアになっている。一方Sierra Forestは最大288コアなので、コア数は10倍になっている。
さて、サーバーラックに何台のサーバーが搭載されているか? が明示されていないので単純に比較できないが、一般に企業向けのサーバーラックは供給電力がだいたい12KW程度とされる。3U構成の2 ソケットサーバーが700~800W程度(最近は1KWを超えるのが当たり前で、ラックあたりの供給電力も20KWを超えるものが増えてきたが、これはおいておく)で、台数で言えば12~14台程度となる。
とりあえず14台と想定すると、200サーバーラックの第2世代Xeonのコア数は200×14×2×28=15万6800コアとなる。同様の想定で72サーバーラックのSierra Forestの方は72×14×2×288=58万608個。要するにコア数そのものはSierra Forestの方が3.7倍も多い計算になる。逆に言えばコアあたりの性能はCascade Lakeの約4分の1でしかない。Cascade Lakeということは、基本的な部分はSkylakeと同じで、VNNIが追加された程度の差しかないことになる。
連載737回で説明したように、Sierra ForestのコアはほぼGracemontと同等であるが、その元となるTremontコアはSkylakeと比較して、同一消費電力なら40%高速、同一速度なら40%省電力という説明がIntel Architecture Day 2021であった。
もっとも今回の場合はシングルスレッド性能というよりもマルチスレッド性能であって、比較のグラフは下の画像が適切なのかもしれないが、Skylakeの2倍のコア数なら同一消費電力で動作周波数が80%高い、あるいは同一周波数で消費電力が80%低いことになる。が、今回の性能を見るとコア数が3.7倍で同等になる。
また消費電力についても、Cascade LakeからSierra Forestにすることで128ラックを削減でき、これが1MWという計算になるので、ラック当たりで言えば7.8KWほどになるが、これは正しくない。例えばCascade Lakeの世代ではラックあたり12KWで、200ラックで2.4MW。対してSierra Forestではラック当たり20KWで72ラックで1.44MW。差引0.96MWの削減といった感じの計算になるだろう。
つまりサーバー1台あたりの消費電力で言えば、おそらくSierra Forestの方が多いだろう。といっても、コアあたりの消費電力は確かに大幅に小さくなっていると想像されるが。
性能が伸びない理由だが、1つ考えられるのはメモリー帯域不足だろうか? Cascade Lake世代は28コアに対してDDR4-2933×6chで140.784GB/秒なので、コアあたりのメモリー帯域は5GB/秒ほど。対してSierra ForestベースのXeon 6は、まだMRDIMMに未対応なので288コアに対してDDR5-5600×12で、537.6GB/秒。コアあたりのメモリー帯域は1.87GB/秒と半分未満である。
もっとも、多くのコアがメモリー待ちになる=コアの動作周波数がそれほど高くならない(高くしてもメモリー待ちが長くなるだけなので、結局下がる)=性能/消費電力比が向上する、ということなのかもしれない。
Sierra Forestは一般的用途からスケールアウト/高密度向けという話は以前もあったので、この性格そのものはこれで問題ないのかもしれないが、メモリー負荷が高いアプリケーションには向かない感じが見て取れる。
Granite RapidsはSapphire Rapidsより2.1倍高速 Emerald Rapidsと比較しても1.78倍高速
一方Granite Rapidsの方であるが、今回基調講演ではパラメーター数70億個のLLMを実行させ、その際のレスポンスを比較したところ、第4世代Xeon Scalable(つまりSapphire Rapids)と比較して2.1倍、第5世代Xeon Scalable(つまりEmerald Rapids)と比較しても1.78倍高速というデモが行なわれた。
ただ肝心のGranite Rapidsのコア数や動作周波数などは不明なままなので、なんと評したものか、という感じになっている。
Sierra ForestベースのXeon 6は今四半期中に出荷開始というアナウンスもあった(これは以前からも同じ)が、Sapphire Rapidsの時にはエンジニアサンプルの出荷を"Start Shipping(出荷開始)"と強弁していたこともあるだけに、この出荷なるものが製品なのかエンジニアサンプルなのか、今一つ判断できない。
なんとなく通例だと単なるエンジニアサンプルの出荷であり、そこから検証がスタートして、量産出荷は今年第4四半期になりそうなのだが、そのあたりはまだ不明である。
次回はもう1つの目玉であるGaudi 3について解説したい。
この記事に関連するニュース
-
QualcommがWindows PCの新世代CPU「Snapdragon X」のラインアップを公開 = 最上位と下位の性能差は1.3倍!
ASCII.jp / 2024年4月26日 9時0分
-
Intelが発表した「Gaudi 3」と「Xeon 6」とは - Intel Vision 2024レポート
マイナビニュース / 2024年4月12日 0時3分
-
IntelがXeonをリブランド、次世代のEコア構成Xeonを「Xeon 6プロセッサ」と命名
マイナビニュース / 2024年4月10日 21時35分
-
インテル、エンタープライズAIを拡大する、インテル Gaudi 3 AI アクセラレーター、オープンなAIシステム戦略、顧客企業での新たな採用を発表
PR TIMES / 2024年4月10日 18時45分
-
Sierra Forest/Granite Rapidsは「Xeon 6プロセッサ」に――IntelがXeonプロセッサをリブランド
ITmedia PC USER / 2024年4月10日 0時40分
ランキング
-
1iPhoneの天気アプリ、文京区で「大雪」とウソつく 気象庁のサイトで“正しい情報”を確認する方法は?
ITmedia Mobile / 2024年5月2日 18時50分
-
2ジョージア大使、松屋にポーランド風ハンバーグ登場で心配「国際情勢に影響しかねない熾烈な戦いになりそう」
iza(イザ!) / 2024年5月1日 13時55分
-
3「そっち使うの?!」「これは天才」 さびだらけの鉄くぎをぐつぐつ煮込むと……? DIYに役立つ“まさかの使い道”が200万再生
ねとらぼ / 2024年5月2日 12時15分
-
4パイオニアの車載スマートデバイス「NP1」を試して感じたイイところ、ムムムなところ 音声操作前提のドラレコ&カーナビ
ITmedia Mobile / 2024年5月2日 6時5分
-
5「非常識過ぎ」「論外」 消防局が「救急車は映えスポットではありません!」と喚起 “信じられない実話再現”が話題に
ねとらぼ / 2024年5月2日 19時30分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください