NVIDIAの最新GPU「GeForce RTX 50シリーズ」を搭載するグラフィックスカードが間もなく発売される。まず4K(3840×2160ピクセル)解像度でのゲーミングを見据えたハイエンドラインの「GeForce RTX 5080」「GeForce RTX 5090」からリリースされ、次いでWQHD(2560×1440ピクセル)解像度をターゲットとする「GeForce RTX 5070」「GeForce RTX 5070 Ti」が登場する見込みだ。
最上位の「GeForce RTX 5090 Founders Edition」に続き、ITmedia PC USER編集部はその下位モデルとなる「GeForce RTX 5080 Founders Edition」(日本未発売)を先行レビューする機会を得た。
この手のベンチマークテストでは「最新スペックのPCでテストする」ことが多い。しかし、誰もが常に最新環境のPCを使っているわけではない。「グラフィックスカード(GPU)だけリプレースしてパワーアップしたい」というニーズもあるはずだ。
そこで今回は、2022年12月に発売されたIntel製ベアボーンキット「Intel NUC 13 Extreme Kit」のCore i9-13900Kモデルに装着した「GeForce RTX 3080 Ti」と置き換えるとどのくらい性能向上を見込めるのか確かめてみようと思う。
●GeForce RTX 5080 Founders Editionの概要
GeForce RTX 5080は、GeForce RTX 50シリーズにおける「ハイエンドの下位モデル」という位置付けだ。SoC(System On a Chip)は「GB203」で、TSMCの4nmプロセスで製造されている。主なスペックは以下の通りだ。
・GPUアーキテクチャ:Blackwell
・CUDAコア:1万752基
・Tensorコア:第5世代
・ピーク処理性能:1801 AI TOPS(1秒当たり1801兆回の処理が可能)
レイトレーシングコア:第4世代
・ピーク処理性能:171 TFLOPS
動作クロック(定格):2.3GHz~2.62GHz
グラフィックスメモリ:16GB(GDDR7/256bit)
最大出力解像度:4K(3840×2160ピクセル)/480Hzまたは8K(7680×4320ピクセル)/120Hz(※1)
接続バス:PCI Express 5.0 x16(PCI Express 4.0互換)
消費電力:360W(推奨電源容量:850W)
(※1)DSC(データ圧縮)を利用した場合
今回レビューするGeForce RTX 5080 Founders Editionは、NVIDIA“自ら”が設計した2スロット厚のグラフィックスカードで、寸法は約137(幅)×304(奥行き)mmとなる。先代の「GeForce RTX 4080 Founders Edition」と比べると、幅と奥行きは変わらないものの1スロット分薄くなっている。
消費電力(TGP:トータルグラフィックスパワー)は360Wと、わずかなだが先代(320W)から増している。サードパーティー製のグラフィックスカードの多くは3スロット厚であることも手伝って、「薄くなったのに電力消費が増している……」と、ちょっとした浦島太郎(?)感を覚えてしまう。
GPU補助電源は「16ピン(12V2x6)×1」で、旧規格では「8ピン×3」相当が必要となる。本製品の場合、16ピンから8ピン×3に変換するアダプターも付属しているので、電源容量にゆとりがあれば旧規格の電源でも対応できる。
●今回“パワーアップ”するPCについて
今回、GeForce RTX 5080 Founders Editionで“パワーアップ”するIntel NUC 13 Extreme Kitは、約2年前にレビューしたもので、当時の「Intelお勧め構成」である。主なスペックは以下の通りだ。
・CPU:Core i9-13900K
・Pコア:8基16スレッド(3GHz~5.8GHz)
・Eコア:16基16スレッド(2.2GHz~4.3GHz)
メモリ:DDR5-5600 32GB SO-DIMM×2(Kingstone製)
ストレージ:1TB SSD(1000G Kingston FURY Renegade PCIe 4.0 NVMe M.2 SSD)
外部GPU:GeForce RTX 3080 Ti(TUF Gaming GeForce RTX 3080 Ti OC Edition)
OS:Windows 11 Pro バージョン24H2
CPUは実質2世代前で当時のフラグシップモデルだ。今でも十分に戦える。一方で、GPU(グラフィックスカード)のGeForce RTX 3080 Tiは、2021年6月にリリースされたもので登場から3年半が経過しており、「まだまだ戦える……!」ともいえるし、「新世代が出たなら取り換えてもいいのでは?」とも考えられる。
GeForce RTX 5080 Founders Editionをレビューするという話が来た時に、これは悩める筆者への福音だと考え、「GeForce RTX 3080 Tiとリプレースするとどうなるか?」という記事を執筆しようと考えた次第である。
●まず3Dグラフィックスをテストしてみる
ということで、ここからはグラフィックスカードを入れ替えつつ、GeForce RTX 5080の実力をチェックしていく。
今回はGeForce RTX 3080 TiとGeForce RTX 5080の比較をメインに据えよう……と思ったところ、編集長から「GeForce RTX 4080(Founders Edition)を交えて検証したら面白いのでは?」との提案を受けたので、一部のテストを除いて3つのGPU(グラフィックスカード)を比較することにする。
なお、グラフィックスドライバは、GeForce RTX 3080 Ti/4080が一般公開の最新版(バージョン566.36)で、5080がテスト用のβ版(バージョン572.12)を利用している。CPUがグラフィックスメモリ全体にアクセスできる「Resizable BAR」は有効としている。
まず、3Dグラフィックスからテストを進めていく。なお、記事では取り上げていないテストとして、「CINEBENCH 2024」と「FINAL FANTASY XV WINDOWS EDITION ベンチマーク」も実施したのだが、現時点でGeForce RTX 50シリーズに対応していないため、今回は除外する。
3DMark
ULの3Dグラフィックスベンチマークテストアプリ「3DMark」では、DirectX 11/12 APIを利用する主要なテストを実行した。総合スコアは以下の通りだ。
・GeForce RTX 5080
・Time Fire Strike(フルHD/DirectX 11):4万6021ポイント
・Time Fire Strike Extreme(WQHD/DirectX 11):3万5924ポイント
・Time Fire Strike Ultra(4K/DirectX 11):2万1294ポイント
・Time Spy(WQHD/DirectX 12):2万9553ポイント
・Time Spy Extreme(4K/DirectX 12):1万5378ポイント
・Port Royal(4K/DirectX Raytracing):2万1875ポイント
・Speed Way(4K/DirectX 12 Ultimate):8983ポイント
GeForce RTX 4080
・Time Fire Strike(フルHD/DirectX 11):4万2502ポイント
・Time Fire Strike Extreme(WQHD/DirectX 11):3万645ポイント
・Time Fire Strike Ultra(4K/DirectX 11):1万7332ポイント
・Time Spy(WQHD/DirectX 12):2万6251ポイント
・Time Spy Extreme(4K/DirectX 12):1万3375ポイント
・Port Royal(4K/DirectX Raytracing):1万8048ポイント
・Speed Way(4K/DirectX 12 Ultimate):7358ポイント
GeForce RTX 3080 Ti
・Time Fire Strike(フルHD/DirectX 11):3万8287ポイント
・Time Fire Strike Extreme(WQHD/DirectX 11):2万3598ポイント
・Time Fire Strike Ultra(4K/DirectX 11):1万2699ポイント
・Time Spy(WQHD/DirectX 12):1万9689ポイント
・Time Spy Extreme(4K/DirectX 12):1万104ポイント
・Port Royal(4K/DirectX Raytracing):1万3125ポイント
・Speed Way(4K/DirectX 12 Ultimate):5330ポイント
全テストで順当に「5080>4080>3080 Ti」という結果となった。テストにもよるが、5080は4080比で1.08~1.23倍、3080 Ti比で1.2~1.69倍のスコアで、負荷の大きい(≒レンダリング解像度の高い)テストほど差が開く傾向にある。
WQHD(2560×1440ピクセル)、あるいは4K(3840×2160ピクセル)のテストを実際に見守っていると、GeForce RTX 3080 Tiも頑張ってはいるが、GeForce RTX 5080の方がよりスムーズだと分かる。
FF14ベンチマーク
続けて、スクウェア・エニックスの「ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク(FF14ベンチマーク)」を試してみよう。本ゲームの場合、解像度プリセットはHD(1280×720ピクセル)/フルHD/4Kの3種類だが、今回はフルHD/4Kと、カスタム解像度としてWQHDを「最高画質」のフルスクリーン表示でテストした。本プログラムでは、GeForce RTXシリーズの超解像技術「DLSS(Deep Learning Super Sampling)」を利用できるが、今回は「60fpsを下回る場合に有効」としている。
結果は以下の通りだ。
・GeForce RTX 5080
・フルHD:2万9860ポイント
・WQHD(カスタム解像度):2万64559ポイント
・4K:1万5865ポイント
GeForce RTX 4080
・フルHD:3万277ポイント
・WQHD(カスタム解像度):2万3988ポイント
・4K:1万3849ポイント
GeForce RTX 3080 Ti
・フルHD:2万6128ポイント
・WQHD(カスタム解像度):2万362ポイント
・4K:1万1395ポイント
どのGPUも、全解像度で「非常に快適」または「とても快適」評価となった。最上位ではないものの、ハイエンドだけある。
ただ、少し不思議な部分がある。3DMarkのように全解像度で「5080>4080>3080 Ti」となると思いきや、フルHDでのみ「4080>5080」となったのだ。試しに何度かやり直してみたものの、結果は変わらずだった(上記はベストスコア)。
環境とゲームエンジンのバージョンが異なるため単純比較は難しいものの、この現象は先日のGeForce RTX 5090におけるFF14ベンチマークでも同様となっている。FF14シリーズのゲームエンジンでは、GeForce RTX 50シリーズのフルHD解像度のみ“何か”あるのだろうか……?
もちろん、WQHD/4K解像度では5080がスコアを順当に首位に立った。3080 Tiとの比較では1.14~1.39倍のパフォーマンス向上を果たしている。約2年前は3080 Tiでも「すごいなぁ」と思っていたところ、約3年半もすればGPUはさらに進化してしまうものなのだなと、感慨深い。
Cyberpunk 2077(DLSSテスト)
ここ数年はハイエンドGPUでも負荷的にキツい「超・超重量級ゲーム」が存在する。その典型例が、CD PROJECT REDの「Cyberpunk 2077」だ。このタイトルは最新技術を取り入れることにも積極的で、1月23日に公開された「パッチ2.21」では最新の「DLSS 4」に対応し、GeForce RTX 50シリーズでは「マルチフレーム生成」によるフレームレート向上を実現し、超解像処理に用いるAIモデルに新型の「トランスフォーマーモデル」も導入された(従来モデルも選択可能)。
そこで今回、パッチ2.21を適用した上で、プリセット設定では一番高負荷となる「レイトレーシング:オーバーレイ」の4K解像度における平均フレームレートを計測してみた。今回はGPUによって使えるDLSS設定が異なるが、有効にした場合は全てAIモデルをトランスフォーマーモデルとしている。結果は以下の通りだ。
・DLSSオフ(ネイティブ解像度)
・GeForce RTX 5080:19.83fps
・GeForce RTX 4080:16.1fps
・GeForce RTX 3080 Ti:4.85fps
DLSSオン(フレーム生成オフ)
・GeForce RTX 5080:60.07fps
・GeForce RTX 4080:53.38fps
・GeForce RTX 3080 Ti:38.83fps
DLSSオン(シングルフレーム生成)
・GeForce RTX 5080:95.81fps
・GeForce RTX 4080:90.88fps
DLSSオン(マルチフレーム生成2X)
・GeForce RTX 5080:136.35fps
DLSSオン(マルチフレーム生成3X)
・GeForce RTX 5080:173.3fps
ハイエンドとはいえ、さすがに“次点”のGPUでは最重量設定のネイティブ4K描画をこなすのは厳しいようだ。3080 Tiでは平均で5fpsを割り込んでおり“紙芝居”もいいところである。
しかしDLSSを有効化すると、いずれのGPUもプレイを楽しめるフレームレートは確保可能だ。5080であれば、この時点でスムーズさの1つの基準である平均60fpsを達成できる。
さらに、ハードウェア依存のあるフレーム生成を有効にすると、4080や5080は90fpsの大台に乗る。ここまでくれば“ヌルヌル”で楽しめるだろう。
加えて、5080でのみ使えるマルチフレーム生成は、描画の滑らかさをさらに高める。1フレームに対して3フレームを補間する「マルチフレーム生成3X」設定なら、平均で173.3fpsを達成できる。理論的にはフレーム生成オフ時の4倍のフレームレートが出ても良いような気もするのだが、3080 Ti比で最大4.46倍まで引き上げられるというのであれば、十分な気もする。
●動画のエンコードはどう?
別記事で解説したが、GeForce RTX 50シリーズは新世代の動画エンコーダー(第9世代)/デコーダー(第6世代)を搭載している。
今回比較している3つのGPUのエンコーダー/デコーダーの搭載状況は以下の通りだ。
・GeForce RTX 3080 Ti:エンコーダー1基(第7世代)/デコーダー1基(第5世代)
・GeForce RTX 4080:エンコーダー2基(第8世代)/デコーダー1基(第5世代)
・GeForce RTX 5080:エンコーダー2基(第9世代)/デコーダー2基(第6世代)
3080 Tiと比べると、5080はエンコーダーもデコーダーも2倍となっている。4080と比べた場合でも、デコーダーが1基増えているため、マルチストリーム再生時のパフォーマンスが改善しているものと思われる。
今回は時間の都合で、ULの総合ベンチマークテストアプリ「Procyon」に内包されたテスト「Video Editing Benchmark」を実施した。このテストは、「Adobe Premiere Pro」を使ってフルHD(H.264コーデック)と4K(H.265コーデック)の動画を2種類ずつ書き出す際のパフォーマンスを点数化する。負荷の大きい2つ目のテストは、エフェクト処理でGPUによるアクセラレーションを有効にできる。
総合スコアではなく、あえて書き出しに掛かった時間をチェックしてみると、以下の通りとなる。
・GeForce RTX 5080
・フルHD/その1:14.7秒
・フルHD/その2(GPUアクセラレーション):13.7秒
・4K/その1:49.6秒
・4K/その2(GPUアクセラレーション):42.7秒
GeForce RTX 4080
・フルHD/その1:17.7秒
・フルHD/その2(GPUアクセラレーション):15.7秒
・4K/その1:54.5秒
・4K/その2(GPUアクセラレーション):47.6秒
GeForce RTX 3080 Ti
・フルHD/その1:17.7秒
・フルHD/その2(GPUアクセラレーション):16.3秒
・4K/その1:55.4秒
・4K/その2(GPUアクセラレーション):47.6秒
順当に「5080>4080>3080 Ti」という結果となった。2つ目のテストは、GPUアクセラレーションをオフ(=CPU処理)にすると時間がめっぽう掛かり、ハイエンドCPU/GPUを搭載するPCであっても、全テスト終了までに1時間近く要することもある。エフェクトを多用する場合は、エンコーダー/デコーダーを含めたGPUの全体性能も重要となる。
5080は、グラフィックスメモリがGDDR7規格であり、PCとの接続にPCI Express 5.0バスを利用する。メモリやバスの高速化が積み重なった結果、従来モデルよりも高速な動画書き出しを実現できている。
動画の書き出しは、長尺になるほどわずかの差が大きな差となる。一層の時短を狙うなら、5080の導入は効果が高そうだ。
●物体検知/生成AIのパフォーマンスは?
最近、NPUを搭載する「AI PC」が評判だが、AI(人工知能)の演算処理にGPUを用いるアプリ(プログラム)も多い。そこで動画の書き出しテストでも登場したULのProcyonを使って、GPU演算を利用するAIのパフォーマンステストを実施してみた。
AI Computer Vision Benchmark
「AI Computer Vision Benchmark」は、機械学習データを使って物体を検知する「コンピュータビジョン」の処理パフォーマンスを確認するテストだ。複数のAPI(命令セット)で同種のテストを実行可能で、命令セットによってはCPU/NPU/GPUのパフォーマンス差もチェックできる。
NVIDIA製GPUを搭載しているWindows PCの場合、本来はGPU演算のAPIとして「Windows ML(Direct ML)」か「NVIDIA TensorRT」を選択できる。しかし、現在のAI Computer Vision BechmarkはGeForce RTX 50シリーズにおけるTensorRT APIに対応していない(対応に向けた修正を準備している)。そこで今回は、Windows ML APIを使った場合の演算パフォーマンスを比較する。総合スコアは以下の通りだ。
・GeForce RTX 5080
・INT(整数演算):634ポイント
・Float16(半精度浮動小数点数演算):2164ポイント
・Float32(単精度浮動小数点数演算):1267ポイント
GeForce RTX 4080
・INT(整数演算):539ポイント
・Float16(半精度浮動小数点数演算):1786ポイント
・Float32(単精度浮動小数点数演算):1116ポイント
GeForce RTX 3080 Ti
・INT(整数演算):415ポイント
・Float16(半精度浮動小数点数演算):1501ポイント
・Float32(単精度浮動小数点数演算):912ポイント
やはり順当な「5080>4080>3080 Ti」という結果だった。Windows MLという汎用(はんよう)APIを使うことによるオーバーヘッドはさておいて、5080は4080比で1.14~1.21倍、3080 Ti比で1.39~1.53倍のパフォーマンスとなっている。機械学習ベースのAIを使う場合は、やはり「なるべく新しいGPU(グラフィックスカード)」がよさそうである。
AI Image Generation Benchmark(FLUX.1 Beta)
ProcyonにはStable Diffusionベースの画像生成AIテスト「AI Image Generation Benchmark」もある。しかし、本テストも現時点ではTensorRT APIに対応していない。「ONNX」APIを使えばテスト可能なのだが、今回は時間の都合で見送った。
その代わり、ULとNVIDIAがβ提供しているFLUX.1ベースのAI Image Generation Benchmarkを実行してみた。このテストは、グラフィックスメモリの容量の都合から3080 Tiでの測定を行っていない。生成完了までの所要時間は以下の通りだ。
・GeForce RTX 5080
・FP4(4bit浮動小数点数演算):27.968秒
・FP8(8bit浮動小数点数演算):57.696秒
GeForce RTX 4080
・FP4(4bit浮動小数点数演算):128.82秒
・FP8(8bit浮動小数点数演算):66.869秒
「5080>4080」なのはもちろんなのだが、FP4の演算で“大差”が付いている。これはGeForce RTX 50シリーズのTensorコアでFP4演算をネイティブサポートした成果である(GeForce RTX 40シリーズではFP8に変換してから演算するためオーバーヘッドが生じてしまう)。
生成AIにおいて、より高速な処理を行うには「精度をあえて低くする」ことが求められる場合がある。しかし、単に精度を低くしても演算器(ここではTensorコア)が低精度演算に対応していないと精度の変換にリソースを割かれてしまうという“本末転倒”な事態もあり得る。
その点、GeForce RTX 50シリーズでは低精度演算(FP4)をネイティブサポートしたのは、生成AI時代を踏まえた大きな変化といえる。
●GPUを変えると意外といい! でも電源が心配
今回は「Intel NUC 13 Extreme Kitに取り付けたGeForce RTX 3080 TiをGeForce RTX 5080に置き換えるとどう?」というコンセプトでテストを実施した。結論をいうと取り換えるメリットは大きい。特にゲームをプレイするシーンでは、DLSSによる超解像込みで考えると今すぐにでも取り換えたくなる。マルチフレーム生成は、本当に偉大だ。
4:2:2フォーマットに対応した動画エンコーダー/デコーダーやFP4演算に対応したTensorコアなど、GeForce RTX 5080はゲーム以外の用途でも役立つパワーアップも行われている。「PCI Express 5.0対応なのにGeForce RTX 3080(Ti/SUPER)刺しているデスクトップPC」なら、恐らく感動しきりだろう。
ただ、不安要素もある。1つは消費電力だ。先に紹介した通り、GeForce RTX 5080の定格消費電力は360Wで、推奨電源容量は850Wとなっている。実は、今回レビューしたIntel NUC 13 Extreme Kitの電源容量は750Wで、推奨容量に対して100W足りない。ちょっと不安を覚えたので、3DMarkの「Time Spy Extreme」でシステム全体の消費電力を測ってみた所、以下の通りとなった。
・GeForce RTX 5080:アイドル時57W/ピーク時589W
・GeForce RTX 4080:アイドル時59W/ピーク時494W
・GeForce RTX 3080 Ti:アイドル時62W/ピーク時567W
消費電力だけ見ると、4080がピーク時の消費電力が一番「低い」。そして5080はピーク時の消費電力が一番「高い」。これはTime Spy Extremeでの計測値だが、負荷の大きいCyberpunk 2077の実行時は、一瞬だがシステム消費電力が630Wに達することもあった。少なくとも、Intel NUC 13 Extreme Kitで5080を使うのは“かなりギリギリ”だと思われる。
グラフィックスカードだけリプレースすることを検討する場合は、電源の容量(と、GPU補助電源の最大出力)を精査してからの方がよい。
日本では、GeForce RTX 5080を搭載するグラフィックスカードの想定価格が19万8800円からとなる。発売時で比較すると、GeForce RTX 3080 Tiと比べると2万3000円増、GeForce RTX 4080と比べると2万1000円減という絶妙なプライシング……なのだが、この価格通りに購入できるのはレアケースで、多くの製品は実売価格が20万円台前半となるものと思われる。
5080については、サードパーティー製品にも2スロット厚のグラフィックスカードがある。よりコンパクトなケースに組み込みやすいことは間違いないので、「Founders Editionなき日本」において2スロット厚のパワフルなGPUを探している人は、ぜひ注目してほしい。