Infoseek 楽天

「Snapdragon 8 Elite」は何が進化したのか PC向けだったCPUコア「Oryon」採用のインパクト

ITmedia Mobile 2024年10月28日 16時15分

 米Qualcommは10月21日から23日にかけて米ハワイ州マウイ島で開催された「Snapdragon Summit 24」において、モバイル向けSoC「Snapdragon 8 Elite」を発表した。最大の特徴は、2023年にリリースされたPC向けSoC「Snapdragon X Elite/Plus」で初めて採用された「Oryon(オライオン)」の名称で呼ばれるCPUコアをモバイル向けとしては初めて採用した点で、Adreno GPUやHexagon NPUを含むSoC全体のブラッシュアップで性能が大幅に強化されている。

 ここでは前モデルとの違いと強化ポイントについてまとめたい。

●Arm IPから独自設計のCPUコアへ 高効率コアをなくても低消費電力は維持

 冒頭の説明にあるように、Snapdragon 8 Eliteの前モデルにあたる「Snapdragon 8 Gen 3」との差異を比較してみると、従来まで「Kryo(クライオ)」と呼ばれていたCPUコアがOryonベースのものになり、この他に搭載するモデムがX75 5G Modem-RF Systemから1つ世代が上がってX80 5G Modem-RF Systemとなっていることが分かる。実際には他のコアブロックについても改良が加えられ、全体にブラッシュアップが行われているのだが、まずCPUの部分に注目する。

 Snapdragon 8 Gen 3の場合、Primeと呼ばれる3.3GHz動作のメインコアが1つ存在し、Performanceの名称で呼ばれるサブのコアが3.2GHz動作で3つ、3.0GHz動作で2つの計5つ存在する。そしてEfficiency(高効率)の名称で呼ばれる2.3GHzベースの低消費電力動作コアが2つという変則的な構成を取っていた。

 Kryoの名称こそ付いているものの、これらCPUコアはArmが提供しているIPを利用したもので、PrimeはCortex-X4、PerformanceはCortex-A720、EfficiencyはCortex-A520をそれぞれ採用しており、いわゆるbig.LITTLE的な組み合わせだ。この構成になっている理由としては、アイドル時の動作をなるべく低消費電力で済ませたいという考えがある一方で、ゲームなど特にプロセッサパワーを必要とするアプリの動作時には強力なコアを用いたい考えがあるためだ。

 ところが、今回Snapdragon 8 Eliteで採用されたOryonのコア構成では、4.32GHz動作のPrimeコアが2つ、3.53GHz動作のPerformanceコアが6つとなっており、変則的な非対称構成ではなくなった。Efficiencyコアを廃して、どちらかといえば“高パフォーマンス”寄りの設計が行われている。特にPrimeコアが2つになったことで、Snapdragon 8 Gen 3と比べてパフォーマンスの上限が伸びやすい形となった。

 今回のSnapdragon 8 EliteのようなCPUコアの構成は、どちらかといえばPC製品向けといえ、特にマルチスレッド処理での効果が高い点が挙げられる。Snapdragon 8 Gen 3のようにモバイル向けSoCでのCPUで“Primeコアが1つだけ”という構成が選ばれることが多いのは、複数のアプリケーションを同時に動かすことが多いPCに比べ、モバイルではフォアグラウンドで動作するアプリの処理のみが優先されるという違いによる。

 この設計変更について米Qualcomm製品マネジメント担当シニアディレクターのKarl Whealton氏は、実際のアプリの利用スタイルを反映して最適化したものだと説明する。「異なる種類の多くのコアを抱えないことは、スケジューラをシンプル化する上で重要だ。これは特にモバイルゲーミングなど一部のワークロードで高パフォーマンスでのマルチスレッド処理を行う上で重要となる」(Whealton氏)と述べ、高負荷時のマルチスレッド処理をコア間で分散させやすくなることで、従来よりも性能を伸ばしやすくする効果があると述べている。

 また、Efficiencyコアが削除されたことで、従来のようなアイドル時の低消費電力動作が難しくなるような印象があるが、これについても「低消費電力のための専用コアを載せるより、多目的に使える汎用(はんよう)コアを採用した方が設計上メリットがある」という考えで、結果として従来のEfficiencyコアのような役割をPerformanceコアに担わせることが可能な設計となっているようだ。

●メモリアクセスの高速化とキャッシュの配置で高速処理を

 コアの構成以外に、処理速度を高めるための仕掛けとして改良されたのが、メモリアクセスの高速化とキャッシュの配置だ。Snapdragon 8 Gen 3ではCPUコア全体に12MBのL3キャッシュをひも付けていたが、Snapdragon 8 EliteではPrimeとPerformanceのCPUコアのブロックにそれぞれ12MBのL2キャッシュを割り当てている。

 Snapdragon 8ではもともと世代ごとにL3などのキャッシュ容量が大きく増加される傾向があったが、よりプロセッサコアに近い場所に大容量キャッシュを配置することで、前世代の5~12ナノ秒だったレスポンスタイムが5ナノ秒以下にまで縮小された。LPDDR5x自体のアクセス速度も向上しており、結果としてより高速処理が可能になっている。この設計変更についても前述のWhealton氏は「レスポンスタイムの向上が高速動作の上で最も効果が高くなる」と述べている。

 最初にOryonを搭載したSnapdragon X Eliteでは、4つのCPUコアを束ねて1つのクラスタを構成し、クラスタ単位でL2キャッシュが配置されたものが3つ並び、4コア×3クラスタの計12コアという組み合わせだった。Snapdragon 8 Eliteのブロックダイヤグラムを見る限り、前例にならえばPrimeとPerformanceの2つのクラスタから構成されており、Snapdragon X EliteのOryonをモバイル向けにアレンジしたようなイメージに見える。だが実際のところWhealton氏によれば「基本部分から見直しを行っている」とのことで、単純にクラスタやコア構成を変更しただけというわけではなく、モバイル動作に最適化するよう設計し直された製品になっている。

 QualcommではSnapdragon 8 Eliteで採用されたOryonコアを「第2世代」と呼んでおり、Arm v8の命令セットに準拠した第1世代同様の独自設計プロセッサコアと位置付けている。この世代の最大の特徴といえるのがシングルスレッド性能を大幅に強化した点で、特に低消費電力動作時のパフォーマンスは第1世代Oryonとの比較のみならず、IntelやAMDらライバルの最新世代PC向けプロセッサのそれを上回っていることを強調している。また同時に電力効率の高さも引き続きアピールしており、必要なときは高パフォーマンスを引き出しつつ、通常利用時はモバイルならではの低消費電力動作で長時間駆動を実現する。

●オンデバイスAIは実利用を想定したチューニング レシートを読み取って割り勘も

 Oryonの部分にばかり注目が集まりがちなSnapdragon 8 Eliteだが、全体的なチューニングを施すことで現在のスマートフォンでよく利用されるアプリが快適に動作し、また将来的に登場するアプリやソリューションについても十分な性能で利用できるようチューニングが行われている。例えばGPUのAdrenoはSlice型のアーキテクチャに変更されており、独立した3つのSliceが並列動作する形で4割程度パフォーマンスと低消費電力動作を向上させ、レイトレーシング時の動作も35%の向上が見込まれるなど、特にゲーミングでの性能引き上げを図っている。

 GPUもさることながら、NPU部分も強化が行われている。SnapdragonシリーズのNPUであるHexagonでは、今回、行列演算のTensorコアのみならず、ScalarとVectorの両方のコアが2倍に増加している。昨今は大規模言語モデル(LLM)などを用いた生成AI(GenAI)や音声・画像認識がオンデバイス上で実行されるケースが増えているが、NPUの強化により推論の実行速度や低消費電力動作性能の向上が期待できる。

 今回後者2コアの強化が特に行われた理由としてQualcommは、ScalarについてはAI関連の演算処理一般の向上が期待でき、VectorについてはLLM実行におけるプロンプト処理の増大に特に大きな効果をもたらすことを挙げている。つまり、過去2年ほどの間にAIの世界で起きた利用スタイルのトレンド転換を受けてNPUのコア構成を変更したことになる。前述のゲーミングなどの話同様に、実需を見越してハードウェアに改良を加えてきたというわけだ。

 結果としてAI推論におけるパフォーマンスは大幅な向上が見込まれており、MLPerfなどの推論に特化したベンチマークではSnapdragon 8 Gen 3の世代に比べ、Snapdragon 8 Eliteでは2~10割の高速化という大幅な性能向上を実現している。

 詳細は別のレポートでも触れるが、ChatGPTなどクラウドでGenAIが認知され始めたTransformerなど比較的新しい世代のAI技術の世界は、次に急速な性能向上によってオンデバイスAIの発展をもたらしている。

 米Qualcommプレジデント兼CEOのCristiano Amon氏は、デバイスの利用スタイルが大きく変化する画期的なトレンド転換のただ中に差し掛かっていることを示唆しており、デバイスとの接点となるUI・UXがより人間に寄り添ったものになりつつあると述べている。ChatGPTのような対話型AIはその典型だが、情報の入力手段がテキストやジェスチャー、音声のみならず、画像などの周辺情報を合わせて総合的に判断することで、より複雑な処理が可能になる。

 デモの1つでは、レストランでの会計時の割り勘を行うにあたり、会計の“紙”をカメラで読み取って「人数分で割って」と問いかけることで自動的に個々の会計額を出してくれる様子が紹介された。

 また、過去の出費状況など個人情報を蓄積することで、デバイスが節約術のアドバイスをしてくれる。人語を理解するエージェント(Qualcommでは「AI Orchestrator」と呼んでいる)とデータを組み合わせることで、さまざまな作業が可能になるため、今後アプリやエージェントを開発するベンダーにとって、新しい可能性にチャレンジする機会が生まれつつあるといえる。

 この他、Qualcommが地味に何度も強調していたのが「Webブラウザ動作速度の向上」だ。前述のシングルスレッド性能向上に結び付く部分もあるが、全体的な性能チューニングによりSnapdragon 8 Gen 3の世代に比べ、Snapdragon 8 Eliteでは2倍近い性能向上を実現している。

 Webブラウザ上で動作するアプリケーションの多さもさることながら、モバイルアプリ上であってもインタフェースそのものはWebブラウザのエンジンを活用しているケースが非常に多く、体感として「最も実用的な性能向上の恩恵を受けやすい」部分といえる。利用スタイルに寄り添う形で、OEMメーカーやソフトウェアベンダーなど全ての関係各社との連携でSoC開発を行っているQualcommが最も注視しているポイントでもある。

この記事の関連ニュース