Infoseek 楽天

GeForce RTX 50だけではない! 社会がAIを基礎にしたものに置き換わる? 「CES 2025」で聴衆を圧倒したNVIDIAの最新構想

ITmedia PC USER 2025年1月10日 17時40分

 NVIDIAのCEOであり共同創業者のジェンスン・ファン氏。同氏が「CES 2025」の開幕前夜に行った基調講演は、集まった聴衆を圧倒するものだった。

 CES前夜の基調講演といえば、かつてビル・ゲイツ氏が受け持つなど、現在に至るまで特別なスロットである。ここでNVIDIAが発表したのは、新GPUアーキテクチャ「Blackwell」をベースにした新GPU「GeForce RTX 50」のデスクトップ版とモバイル(ノートPC)版、さそしてArmアーキテクチャのCPU「NVIDIA Grace」とBlackwellアーキテクチャのGPUを組み合わせた「Grace Blackwell Superchip」を用いた小型AIコンピュータ「Project DIGITS」だ。

 しかしNVIDIAがAIを含むGPUの応用分野で強い理由は、「CUDA(Compute Unified Device Architecture)」プラットフォームを軸とした、開発者コミュニティにおける強固な地位に他ならない。当然のように、同社はAIアプリ開発を加速するための各種ソフトウェア技術を大々的に発表している。加えて、同社は次世代車載チップにおいてトヨタ自動車との提携も発表している。

 こうして、NVIDIAは高性能GPUを起点として、次世代AI技術のあり方を変えていこうとしている。

●新GPUアーキテクチャ「Blackwell」の飛躍

 Blackwellは、新たに設計されたGPUアーキテクチャの名称だが、単に従来の「Ada Lovelace」アーキテクチャから高性能化しただけではなく、GPUを活用するアプリケーション領域のさらなる拡大を意識している点が従来と異なる。ゲームを中心とした3Dグラフィックス領域だけでなく、生成AIからロボティクスまで、広範囲をカバーするプラットフォームとして活用できることが特徴だ。

 本アーキテクチャの最上位チップ(SoC)には約920億個のトランジスタが集積され、最大30Gbpsで接続されるGDDR7メモリの帯域幅は、最大毎秒1.8TBに達する。

 NVIDIAのGPUは、ハイエンドからエントリーまで、データセンター向けはもちろんPC向けにも“同じ”アーキテクチャを展開することが特徴だ。Grace Blackwell Superchipが既に出ていることから分かる通り、今回のBlackwellアーキテクチャでもこの戦略は踏襲される。

 つまり、NVIDIAはGPUにおいて「特定領域に特化」するのではなく、ある種の「汎用(はんよう)性」を重視しているのだ。

 Blackwellアーキテクチャでは「Neural Rendering(ニューラルレンダリング)」を次の大きな潮流と位置づけ、これをさらに強化するために「RTX Neural Shaders」という仕組みが導入されている。これはプログラマブルシェーダーの内部にニューラルネットワークを組み込み、テクスチャーの圧縮や高画質化、あるいはライティング効果の高度化など、従来であれば処理が固定されていた処理パイプラインに“適応力”をもたらす技術だ。

 その恩恵は多岐にわたる。例えばテクスチャーのデータは最大で7分の1まで圧縮でき、また表情をリアルに再現するフェイスレンダリング技術「RTX Neural Faces」を実現する。従来のラスタライズ手法の描画結果に対して3Dポーズ情報を合わせ、リアルタイムの生成AIモデルが自然な顔表現を補完することで、よりフォトリアルな顔面の描画が可能になるという。

 ゲームユーザーにとっては、AIを活用したアップスケーリング技術「DLSS(Deep Learning Super Sampling)」の進化が見逃せない。

 GeForce RTX 50シリーズに合わせて登場する最新の「DLSS 4」では、同シリーズ限定で利用できる「Multi Frame Generation(マルチフレーム生成)」という新機能が用意されている。これは1つのフレームに対してAIで最大3つの補間用フレームを生成することで、フレームレートを向上している。

 ゲームにもよるが、これにより平均フレームレートは従来比で最大8倍になるという。

 無論、本来のゲーム向けレンダリング性能も強化され、レイトレーシングの処理負荷が高いゲームにおいて高解像度でプレイしても、高リフレッシュレートを狙えるようになった。「Cyberpunk 2077」や「Alan Wake 2」などタイトルでも、最上位の「GeForce RTX 5090」でMulti Frame Generationをオンにしてプレイすれば4K解像度で毎秒240フレーム以上という“常識外れ”の性能を発揮可能だ。

●デスクトップ向けからモバイル向けまで一気に展開

 GeForce RTX 50シリーズを搭載する製品は、米国において1月30日から順次発売される。まずデスクトップのハイエンド製品「GeForce RTX 5080」「GeForce RTX 5090」が登場し、2月にはミドルレンジ製品「GeForce RTX 5070」「GeForce RTX 5070 Ti」が登場する。これらはいずれも従来世代(GeForce RTX 40シリーズ)に比べて2~8倍もの性能向上を実現するシーンもあるとファンCEOは語る。

 主なスペックは別記事を参照していただきたいが、例えば「GeForce RTX 5090」の場合、行列演算プロセッサ「Tensorコア」が4bit精度の演算にも対応したことで、生成AIの処理性能が「GeForceRTX 4090」の最大2倍に達する。

 他のデスクトップ向けGPUでも「前世代の(同等製品に対して)最大2倍の性能」は変わりなく、これは最新世代のNVIDIA GPUに共通する特徴と言ってよいだろう。

 またこのアーキテクチャは、モバイル向けの「GeForce RTX 50 Laptop GPUシリーズ」として、3月下旬からさまざまなPCメーカーから搭載製品がリリースされる。性能向上はもちろんだが、彼らが訴求しているのは省電力性能だ。省電力技術「Max-Q」を進化させたことで、前世代(GeForce RTX 40 Laptop GPUシリーズ)に比べ、最大40%ものバッテリー駆動時間延長効果が得られるという。

 例えば新要素である「Advanced Power Gating」は、使われていないGPUを迅速にシャットダウンし、「Low Latency Sleep」はGPU使用時でもアイドル時間を検知し、こまめにスリープする。かなり細かい積み重ねで、省電力性を向上させている。

 他にもさまざまな省電力機能を盛り込み、OSに組み込まれている小規模LLM(小規模言語モデル)の推論をバッテリー駆動でこなす場合でも、バッテリー駆動時間へのインパクトは最小限に抑えられる。

●小型AIコンピュータ「Project DIGITS」にも注目

 この基調講演でもう1つ注目を集めたのが「Project DIGITS」と呼ばれるコンパクトなAIコンピュータだ。本製品は20基の高効率コア(Cortex-X295×10基+Cortex-A725×10基)を備えるGrace CPUに、Blackwell GPUを接続したSoC「GB10 Grace Blackwell Superchip(GB10)」を備えている。FP4精度でのピーク演算性能は1PFLOPS(1000TFLOPS)だ。メモリは128GB(LPDDR5X規格)を備えているが、CPU/GPU共用の「ユニファイドメモリ」とすることで、CPUとGPUのデータ共有をしやすくしている。

 この構成は「Apple Silicon(Apple Mプロセッサ)」と似ており、ある意味でのカウンターともいえる。Apple Siliconと異なるのは、Apple以外のコンピュータメーカーでも採用できる点に他ならない。

 データセンター向けに提供するNVIDIA GB200 NVL72は、CPU1基+GPU2基を36セット搭載することでピーク演算性能は20PFLOPS(スパース利用時は40PFLOPS)というモンスター級の性能を備えるが、その分サイズはとても大きい。

 その点、GB10は「20コアCPU+Blackwell GPUを備えるSoC」1つが最小単位なので、個人や小規模研究所でも導入しやすいというメリットがある。ファン氏の言葉を借りれば、「Project DIGITSを利用すれば、誰でも容易にAIの開発を始められる」。

 それでいて、Project DIGITSはGB200を含むNVIDIAの大規模スーパーコンピュータ環境とソフトウェア的に互換性が保たれている。これも強みだ。

●「CPUからGPU中心」へ そして「認知AI」から「フィジカルAI」へ

 NVIDIAの発表で印象的なことは、圧倒的な高性能GPUチップを発表するにとどまらず、新しい領域のアプリが生まれてくるソフトウェアの土壌をきちんと整備していることだ。

 例えば同社はWindows 11とWSL(Windows Subsystem for Linux)環境の「RTX AI PC」を対象に、推論アプリケーション開発基盤「NIMマイクロサービス」を簡単に組み込めるキットを提供する。

 このキットを使うと、開発者はBlack Forest Labs/Meta/Mistral/Stability.AIなどが提供するLLM(大規模言語モデル)や画像生成モデルなどを利用しやすくなり、PCに組み込むAIエージェントの開発をスムーズに行える。

 また、ファン氏は「フィジカルAI」と呼ぶ、自動運転車やロボットなど物理的に人間社会と関わるAIの進化にも触れた。「Cosmos」は、そのために構築されたAI基盤だ

 フィジカルAIとは、自動運転車やロボットといった社会に物理的に存在するものに組み込まれたAIのことだ。いずれ、社会のさまざまな製品がAIを基礎にしたものに置き換わると予言しているようにも感じられる。

 AIロボットや自動運転の構築では、高精度な学習データが大量に必要となるが、「Cosmos World Foundation Models(WFM)」はシミュレーション環境から自動でデータを生成する機能を持ち、効率的なAIエージェントの開発を支援する。

 PCのソフトウェア開発は「CPUを動かす従来型コーディング」から「GPUがニューラルネットワークを実行するAI型コーディング」への移行が加速し、人々の仕事や娯楽、さらには社会インフラの根底を変えていく可能性が高い。

 30年前の「NV1」や1999年の「■省電力性を向上している

 NVIDIAはGPUとAIの“両輪”を使いこなすことで、PCやデータセンター、組み込みシステムを問わず、今後さらに深い領域へと進出しようとしているのだ。

この記事の関連ニュース