1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

Meteor Lakeで省電力なのはSoCタイルのEコアのみ インテル CPUロードマップ

ASCII.jp / 2023年10月2日 12時0分

 前回に引き続き、Intel Innovation 2023からMeteor Lakeの話を解説したい。まず基調講演における説明からスタートしたい。

Meteor Lakeが12月14日に発売

 今回Meteor Lakeの発売に先立ち、AIPCと呼ばれる概念(?)が公開された。概念なのか、それともキャンペーンの名称なのか、そのあたりは今ひとつはっきりしないのだが、かつてWi-Fiの搭載を必須にしたことで、Wi-Fiの普及が急速に進んだCentrinoを引き合いに出して説明したあたりは、あるいはキャンペーンの名称にするつもりなのかもしれない。

なんとなくQualcommのACPC(Always Connected PC)に似ていることもあって、キャンペーンタイトルとするには弱い気がする。もっと思い切った名前の方が良いのでは?

 ただ現時点ではそういう明確なキャンペーンが打たれるかどうかははっきりしていないが、とりあえずインテルやパートナー企業がAIPCと呼ぶものがある、という話である。

 このAIPCの中身は、Myriad Xの延長にあるVPUを搭載するCPUである。連載686回で説明したが、Raptor Lakeには“AI M.2 Module”なるものが提供され、これはアプリケーション開発のためのプラットフォームとなり、それがプロセッサー内に統合されるのがMeteor Lake世代である。

 ということで、おそらくはMeteor Lakeを搭載したノートPCにAIPCの名前が冠される(AIPCと呼んでいい)ことになるだろう。逆に言えばRaptor Lake世代のノートにAI M.2 Moduleを搭載しても、それはAIPCの基準を満たさなそうである。

 そのAIPCの基準となるMeteor Lakeであるが、Core Ultraのブランドで今年12月14日に発売されることが公式に発表された。

Meteor Lakeが12月14日に発売。Core Ultraブランドの詳細は発表記事にまとまっている。要するにCoreの上位にあたるSKUである

 当然ながら現時点では細かいSKUなどは公開されていない。このあたりは発売日まで未公表のままだろう。Core Ultraも「第x世代Core Ultra」になるのだろうか? とりあえずMeteor Lakeが初代なので、Meteor Lakeの世代には「第x世代」は付かないと思われる。そのCore Ultraの特徴が下の画像だが、新情報そのものはあまりない。

Core Ultraの特徴。当たり前だがまだThunderbolt 4止まり。Thunderbolt 5は早くてArrow Lake世代、統合されるのはPanther Lake世代だろうか?

 この連載ではIntel 4とFoverosの話しか説明していないので、この後残った話を順次説明していく予定だ。

 ちなみに連載686回のスライドでも、いくつかのアプリケーションベンダーがこのVPUをサポートするアプリケーションを開発していく(そもそもRaptor Lake+AI M.2 Moduleの組み合わせが、そのアプリケーション開発のためのプラットフォームと位置付けられていた)と発表されていたが、実際にマイクロソフトのCopliotがこのVPUの最初のアプリケーションになるようだ。

当初Copilotはクラウドを利用したサービスだったが、これをクライアント側に持ってきて動作させる形になり、その際にVPUを使うことで高速化するようだ

 またこの先のロードマップとして、2024年中にArrow Lake/Lunar Lake/Panther Lakeの3製品が投入されることが明らかになったのも今回の新発表である。

Arrow Lake/Lunar Lakeの投入は2022年3月に発表されており、続くPanther Lakeが新情報になる。詳細はまだ不明なままだ

SoCタイルは省電力性を最大限に生かす設計

 では、そのMeteor Lakeの構造である。内部構造の推定は連載720回でお届けしたが、おおむね米国で特許出願した際の構造に近いものとなった。

米国で特許出願した際に提出されたMeteor Lakeの内部構造

 ただこの図ではコンピュート・タイルはPコア×2+Eコア×8であるが、今回説明されたものはPコア×6+Eコア×8の構成であり、またIOタイルも存在する。これはいわばSKU次第であって、ローエンド向けにはPコア×2+Eコア×8でIOタイルなしのものもあるかもしれない。

 また連載720回では4次キャッシュの存在の可能性について論じたが、少なくとも現時点では4次キャッシュに関しての言及がまったくない。

 ただし大きな違いはSoCタイルに搭載されている2コアのEコアである。筆者はこの2コアのEコアを「セキュリティ制御専用と言うよりは、SoC側のもろもろの処理をCPUタイル上のCPU Complexを動かすことなく行なえるようにしよう、ということのようだ。」と書いたが、間違ってはいないものの正確ではなかった。

 確かにブートの際にはセキュアブートなどの処理のために利用されるのだろうが、OSの起動後はこのSoCタイルのEコアもまたOSの管理下に置かれることになる。つまりMeteor LakeのCPUコアはPコア×6+Eコア×10になる。

 もっともここからがMeteor Lakeの大きな特徴である。ハードウェア的に言えばコンピュート・タイルのEコアもSoCタイルのEコアも同じCrestmontコアであるが、コンピュート・タイルの方はIntel 4プロセスで「最大のマルチスレッド性能」を発揮するように実装されているのに対し、SoCタイルの方はTSMC N6で省電力性を最大限に生かすような実装になっている。

 要するに物理設計におけるPPA(Power, Performance and Area)のターゲットが、コンピュート・タイルの方はやや高性能寄りになっているのに対し、SoCタイルの方は省電力/省エリアサイズに振った形になっている。この結果として、それぞれのコアの性能は見事にばらけることになる。

SoCタイルのEコアの動作周波数は不明だが、それこそ1GHz未満(600MHzなど)の可能性もある

 ではこれをどうやって制御するかであるが、スレッド・ディレクターにずいぶん手が入った。下の画像がその模式図である。基本CreateThread()やpthread_create()などで生成されたスレッドは、親スレッドと同じプロセッサーコア上で稼働しそうな気もするのだが確証はない。

スレッド・ディレクターの模式図。例えばPコアで動作中のスレッドが新たにスレッドを作った場合、それがSoC Eコアから動くのか、それともいきなりPコアで動くのか、などいくつか不明確なところは多い

 Alder Lake/Raptor Lakeでは、テーブルの登録に応じてPコアないしEコアに処理が割り当てられ、その後も監視しながら負荷が低いものはEコアに、負荷が高いものはPコアに移行する形で負荷分散を図っているのが原則である。

 これに対して、Meteor Lakeではまずすべての処理はSoCタイルのEコアで動かし、ここで負荷が大きい場合はコンピュート・タイルのEコアに移行させ、それでも足りなければPコアに移行する。

 この結果として、例えばOSのタスク類は常にSoCタイルのEコアで動き、コンピュート・タイルのEコア/Pコアはアプリケーションの処理に割り当てられる、というのはインテルの説明である。

つまり一番稼働率が高いのがSoC Eコアになる

 連載735回で、Meteor LakeのDVFS(Dynamic Voltage and Frequency Scaling)にはAIが利用されていると説明した。おそらくはAIを利用してタスクをIdle/Fixed QoS/Sustained/Burstyに分類、それぞれの特徴に応じて動作周波数や電圧の制御を行なうというものだが、これは単にDVFSだけでなくスレッド・ディレクターでも活用されていると考えられる。

 OSのタスクはFixed QoSあたりに分類され、基本はSoC Eコアで。そしてアプリケーションの処理はSustained/Burstyに分類され、コンピュート・タイルのEコアやPコアに推移すると思われる。

 思うに、まずSoCタイルのEコアで動かすのは、そのEコアでの稼働中に動作状態のサンプルを取り、そのサンプルを基にタスクの種類をAIを使って判断するためと考えられる。

 ただ別の見方をすると、Alder Lakeの時に説明された「省電力のEコアとパフォーマンスのPコア」という分類は、Raptor Lakeの時点でだいぶ怪しかった(*1)が、Meteor Lakeでは省電力なのはSoCタイルのEコアのみで、コンピュート・タイルのEコアは“Efficient MT performance”を実現するあたりは、それなりに動作周波数が引きあがるものと考えられる。

 もっともMeteor Lake、現在のパッケージがモバイル向けのみなので、最大でもH SKUの45~65Wで、メインはP SKUの28~35Wレンジになるだろうと考えると、どこまで動作周波数が積みあがるのかはわからない。

(*1) フル稼働時はEコアも限界までぶん回すことでマルチスレッド性能を引き上げるという実装になり、結果としてRaptor Lakeを爆熱CPUに仕立て上げた。

1次命令キャッシュが32KB→64KBに増量

 次は、そのMeteor Lakeを構成するPコアのRedwood CoveとEコアのCrestmontである。まずRedwood Coveの構造が下の画像だ。

Port 10と11の逆転は、なんだかスライドの打ち間違えではないか? という気がしてならない。少なくともこれを入れ替えて性能が上がるか? というと、そういう理由が思いつかない

 連載736回でも書いたが、Redwood CoveはGranite RapidsとMeteor Lakeの両方で採用されるわけだが、そのGranite Rapidsのブロック図と比較すると、予想通りマトリックス・エンジンはMeteor Lakeには搭載されないようだ。これは当然で、AVX512ですら有効化されているか怪しいのに、AMXを搭載するわけもない。

 内部構造をAlder LakeのGolden Coveと比較した場合、異なっているのは1次命令キャッシュが32KB→64KBに増量されたこと、それとPort 10と11の役割が逆転していること程度である。

 2次キャッシュが2MBというのはRaptor Lakeに搭載されたRaptor Coveですでに実現しているので、性能改善につながる目立った項目は1次命令キャッシュの容量しかない。

 実際には細かい改良などが施されているだろうから、いくつかの命令でスループットが上がったりレイテンシーが下がったりといった違いはあるだろうが、基本的には従来と変わらず、あとは動作周波数次第という感じである。

 一方のEコア。ここで利用されているCrestmontはSierra Forestと共通である。違いがあるとすれば、コンシューマー向けであるからメモリーサブシステム周りはSierra Forestに搭載される“Xeon Advanced Features”はまるっと無効化されているものと思われる。

おそらくだが、コンピュート・タイルのEコアは4コアあたり4MBの2次キャッシュであろう。ただSoCタイルの方はもっと少なく、例えば512KBなどでも不思議ではない

 ただこれを除くと基本的にはまったく一緒であり、そうなるとSierra Forestのところで説明したように基本的なIPCにはほとんど差がないことになる。こうなると、このスライドに出てくる“IPC gains over prior E-cores(以前のEコアに比べて IPCが向上)”をどうやって獲得しているのかは現時点でははっきりしない。

 少なくともVNNI周りの命令が多少高速化されたのはわかるし、分岐予測のメカニズムに改良があったらしいこともわかるのだが。

 このあたりは12月の製品出荷に合わせて公開されるであろうSystem Optimization Manualあたりで出てくるかもしれない。

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください