1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

DLSS 3でGeForce RTX 4090の真の実力を開放!4K+レイトレ最高画質で120fpsを実現

ASCII.jp / 2022年10月12日 13時0分

 本稿はTSMC 4Nノードで製造されたAda Lovelace世代の「GeForce RTX 4090 Founders Edition」(以下、RTX 4090 FE)のレビュー記事の3回目となる。第1回目は注目すべき技術の解説と基本的ベンチマーク、第2回目は実ゲームにおけるパフォーマンスや消費電力効率について考察した。

 最終回となる第3回目では、RTX 40シリーズで最も注目すべき新機能「DLSS Frame Generation」の検証と、RTX 4090 FEとクリエイティブ系アプリの組み合わせによるパフォーマンスを検証する。

NVIDIAからお借りしたRTX 4090 FE。厚めの弁当箱のようなデザインが印象的だが、これは基板を箱状のフレームに組み込むことでバックプレートがなくても高い剛性を確保するようにしたためだ
RTX 4090 FEの補助電源ケーブルは最大600Wが供給可能な12VHPWRを使用する。電源ユニットから直出しできない場合でも、8ピンケーブルを4本接続すればよい。ただし、特に設定しなければTGPは450Wとして動作する

 検証環境は前回とまったく同じだ。比較対象として「GeForce RTX 3090 Founders Edition」(以下、RTX 3090 FE)と「GeForce RTX 3090 Ti」(以下、RTX 3090 Ti)、「Radeon RX 6950 XT」(以下、RX 6950 XT)を準備したが、RTX 3090 TiおよびRX 6950 XTは強めのOC設定をしたファクトリーOCモデルである。RTX 4090 FEの補助電源ケーブルは8ピンケーブル4本を接続してはいるものの、TGPは定格の450W出力で運用している。

 OSはWindows 11だが、安定性を重視してビルドは21H2とした。ReSizable BARやSecure Boot、コア分離(VBS)等はすべて有効化している。

 GeForce RTX 40シリーズ(以下、RTX 40シリーズ)のみで利用できるDLSS Frame Generationについては、第1回で解説済みだ。簡単にまとめておくと、GPU側で前フレームと今フレームから、次のフレームを生成することでフレームレートを底上げするというもの。通常のフレームはCPUがGPUに命令して描画するが、DLSS Frame GenerationはGPUだけで描画できるのがポイントだ。

 DLSS Frame Generationは従来のDLSSと同様にゲーム側の対応が必須だが、同時にRTX 40シリーズに実装されている「オプティカルフローアクセラレーター」の存在が必要だ。従来のDLSSはDLSS Super Resolutionと名を変え、既存のGeForce RTX 20シリーズ以降で引き続き利用可能になる。

DLSS Frame Generationは「DLSS 3」を構成する機能として位置付けられる。DLSS Super ResolutionでGPUの負荷を抑えて画面を描画し、AIの力を使って超解像処理を行う。さらにオプティカルフローアクセラレーターで動きを分析した後、AIで次のフレームを予測するのだ
「Cyberpunk 2077」βビルドにおけるDLSS関連の設定。DLSS Super ResolutionをオンにするとDLSS Frame Generationのスイッチも出現する。Super Resolutionを有効化せずにFrame Generationを有効化することはできない。また、RTX 20/RTX 30シリーズではFrame Generationのスイッチは動かせない
DLSS 3(ここではDLSS Frame Generation)に対応を表明しているゲームやゲームエンジン。負荷の高いレイトレーシングと併用することでDLSS Frame Generationはより輝きを増すが、レイトレーシングは必須要素ではない

 現時点ではまだDLSS Frame Generationに対応したゲームが存在しないが、検証用のβビルドで試すことができた。前回の検証からRTX 4090 FEはフルHD(1920×1080ドット)やWQHD(2560×1440ドット)では負荷が足りずに回りきらないため、解像度は4K(3840×2160ドット)のみで実施する。また、DLSS Frame Generationでレンダリングされたフレームはゲーム内のベンチマーク機能ではカウントされないため、「CapFrameX」を利用してリアルフレームレートを計測した。

驚異的なDLSS Frame Generationのパフォーマンス

 まずは「F1 22」で検証する。画質“超高”をベースにレイトレーシングのクオリティーも最高に設定。異方性フィルタリングはx16、アンチエイリアスは“TAA+FidelityFX”とした。DLSS Super Resolutionの設定はどのGPUも“パフォーマンス”を選択。ゲーム内ベンチマーク(条件は“モナコ”+“ウエット”)再生中のフレームレートを計測している。なお、以降のグラフ内ではDLSS Super ResolutionをDLSS SR、DLSS Frame GenerationをDLSS FGと表記する。

F1 22:3840×2160ドット時のフレームレート。RX 6950 XTはDLSS非対応なので除外した

 まず、DLSS Super Resolutionによって、どのGPUでもフレームレートが2倍以上に伸びている。ベースの処理性能が高いRTX 4090 FEでは、DLSS Super Resolutionだけでも平均144fpsを超えている。しかし、最低フレームレートは90fpsまで下がるため、動体視力の良い人ならカクつきが感じられるかもしれない。

 そして、DLSS Frame Generationを有効にると、DLSS無効の状態からは2.7倍弱、DLSS Super Resolutionからは1.3倍以上のフレームレート向上を達成。これなら、144Hz駆動の4Kディスプレーのポテンシャルをフルに引き出しつつ、最高の画質でゲームが堪能できるだろう。

 続いては「Cyberpunk 2077」だ。ここでもDLSS Frame Generationが実装されたβビルドを使用している。画質は“レイトレーシング:ウルトラ”をベースに、レイトレーシングの反射クオリティーを一番重い“サイコ”に設定。DLSS Super Resolutionの設定はパフォーマンス設定とした。ゲーム内ベンチマーク再生中のフレームレートを計測している。

Cyberpunk 2077:3840×2160ドット時のフレームレート

 パワフルなRTX 4090 FEといえど、Cyberpunk 2077のレイトレーシング最高設定をDLSS Super Resolution抜きで滑らかに表示するのは厳しい(ましてや解像度は4Kだ)。しかし、DLSS Super Resolutionを活用すれば60fpsキープが可能に。さらにDLSS Frame Generationも有効にすることで、120fpsプレイも視野に入れることができる。

 DLSS Frame Generation利用時は、AIによる推論が生み出したアーティファクトも描画されてしまうが、120fpsなら1フレームはわずか8.33ミリ秒で次フレームに移るため、目を凝らしても認識することは難しい。DLSS Frame Generationは超重量ゲームを一気にプレイアブルにする夢のある技術といえるだろう。

 DLSS Frame Generation最後の検証は「Microsoft Flight Simulator」だ。こちらもβビルドでの検証となる。APIはDirectX 12、画質は“ULTRA”、アンチエイリアスは“TAA”もしくはDLSS Super Resolutionの“パフォーマンス”に設定した。ランディングチャレンジ“シドニー”で一定時間飛行した時のフレームレートを計測。カメラは常時機外後方に固定している。

Microsoft Flight Simulator:DirectX 12 API、3840×2160ドット時のフレームレート

 Microsoft Flight Simulatorでは単なるDLSS Super Resolutionの効果はほとんど観測できなかった。βビルドの制約なのか、こちらの設定ミスかは不明だが、DLSS Super Resolutionだけでは大きなフレームレート向上は見られない。

 しかし、RTX 4090 FEでDLSS Frame Generationを有効にした途端、フレームレートが約2倍に上昇。描画の滑らかさが格段に向上した。このゲームのプレイ体験を極大化したいなら、RTX 4090 FEはぜひとも欲しいGPUといえるだろう。DLSS Frame Generation対応パッチが楽しみだ。

 ここで、前回と同様にベンチマーク中のGPU Powerと、GPU Power 10Wあたりの平均フレームレート(ワットパフォーマンス)を見てみよう。DLSSでTensorコアやオプティカルフローアクセラレーターを動かした際に、消費電力は上がるのか? 下がるのか? 調べてみる価値は十分にある。

前掲のベンチマーク計測時にCapFrameXで観測されたGPU Power。上段が最大値、下段が平均値を示す

 DLSSを使わない時を基準とした場合、DLSS Super Resolutionを使うと消費電力が増えるケースと減るケースが混じっていることがわかる。RTX 4090 FEとRTX 3090 Tiでは、どのゲームでもDLSS Super Resolutionは消費電力減方向に動いているが、RTX 3090 FEではCyberpunk 2077やF1 22では消費電力増、Microsoft Flight Simulatorでは消費電力減となる。Microsoft Flight Simulatorだけが消費電力減なのは、このゲームでDLSS Super Resolutionを使ってもフレームレートが上がらなかった事に関連していると考えられる。

 Microsoft Flight SimulatorのDLSS Frame Generationは、DLSS Super Resolutionに比してGPUの消費電力が70W近く増えているが、これも同じ理屈だと考えられる。DLSS Super Resolutionで描画負荷を軽くしても、CPUから新たな描画指令が来ないため、結果としてGPU負荷は下がる(=消費電力減)が、DLSS Frame Generationで新たなフレームを生成するのに必要な負荷のぶんだけ消費電力が上昇したのだろう。もしMicrosoft Flight SimulatorのDLSS Super Resolutionが上手く機能していたら、RTX 4090 FEのGPU Powerは273W近辺に上がるはずだ。

同じく10Wあたりの平均フレームレート比較。前掲の表の平均値と、対応する平均フレームレートを利用して算出

 また、ワットパフォーマンスを見ると、DLSSによって著しく改善する効果が得られることは明らかだ。特に負荷の高いCyberpunk 2077では、DLSS Super Resolutionを有効化するだけでも劇的な効率改善が期待できるだろう。DLSS Frame Generationもワットパフォーマンスを向上させる傾向に変わりはないが、F1 22のようにわずかに低下することもあるようだ。

各ゲームのベンチマーク中のVRAM使用量の最大値をまとめた表

 DLSSが消費電力減に繋がることがわかったら、VRAM消費量も変化するかチェックしておきたい。上の表に示した通り、DLSS Super Resolutionを有効化することによりVRAM使用量が減り、そこからDLSS Frame Generationを追加するとやや増える。無論、すべてのDLSS対応ゲームで同じ傾向になるとは言えないが、GPU稼働時のリソースを考える上で、DLSSは有効な手段にはなりそうだ。

クリエイティブ系アプリでも前世代の2倍近いスコアーに

 ここから先はクリエイティブ系アプリにおけるパフォーマンス検証に入る。24GBものGDDR6Xを搭載したRTX 4090は、動画編集やCG作成には極めて魅力的な存在だ。さらにAV1のハードウェアエンコードにも対応したデュアルNVEncなど、ゲームだけに使うのは極めて勿体ない。

 まずはCGレンダリング系ベンチとして「Blender」の公式ベンチを使用する。Blenderのバージョンは“3.3.0”を指定した。CPUで処理させた際のスコアーとも比較してみよう。

Blender公式ベンチのスコアー

 まず驚くのは、RTX 4090 FEのスコアーの高さだ。16384基ものCUDAコアのパワーは凄まじく、前世代のフラッグシップの2倍近いスコアーを出している。

 「V-Ray Benchmark」も試してみよう。このベンチは3種類のシーンが用意されているが、ここではRTコアを利用する「GPU RTX」を利用した。そのためRX 6950 XTは比較対象から外れている点に注意。

V-Ray Benchmarkのスコアー

 こちらもBlenderと同様に、RTX 3090/RTX 3090 Tiの1.8~1.9倍程度の高いスコアーを出した。描画性能の高さを考えれば当然だが、CGレンダリング時間を少しでも短縮したいなら、RTX 4090は極めて有効なパワーアップになり得る。

 続いては「Adobe Media Encoder 2022」を利用した動画エンコード速度だ。ここではデュアルエンコーダーではなくCUDAやOpenCLの処理などがエンコード時間に与える影響をチェックする。

 テストはAdobe Premiere Proで作成した再生時間約3分の4K動画を、Media Encoder 2022上で50Mbps/VBR/1パスのソフトウェアエンコードし、H.264/H.265の4K動画に出力する時間を計測した。フレーム補間は“オプティカルフロー”を指定している。

Media Encoder 2022によるエンコード時間

 このテストのH.264はGPUパワーの影響が強いことがこれまでの経験からわかっているが、今回の結果からもそれが追認できた。GeForce勢の中でH.265の処理時間が変わっていないのは、CPUが律速になっているためだが、RX 6950 XTではH.265の処理速度も遅くなっているのが確認できるなど、改めてGeForce(CUDA)の強さを実感できた。

アプリによってはRTX 4090 FEの パワーを使いきれない場合も?

 続いては「DaVinci Resolve Studio 18」で検証する。今回は検証用のβビルドを利用することで、デュアルAV1エンコードも試すことができた。テストはProRes 422 HQ動画を利用した再生時間約2分の4K動画を編集し、これを4Kまたは8KのMP4に書き出す時間を測定した。ビットレートは80000Kbpsとし、エンコーダーはGPU即ち“NVIDIA”を指定、コーデックはH.265もしくはAV1(RTX 4090 FEのみ)とした。

DaVinci Resolve Studio 18:H.265のGPUエンコード時間
DaVinci Resolve Studio 18:AV1のGPUエンコード時間

 デュアルNVEncの威力は圧巻だ。8K動画であってもRTX 3090 Tiや3090 FEの半分以下の時間で処理ができる。AV1コーデックは残念ながら比較可能なGPUがなかった(インテル Arc Aシリーズで後日試してみたいところだが……)が、H.265と大差ない速度で書き出せるのは驚くしかない。

 もう1つ、DaVinci Resolve Studioに搭載されたMagic Maskの処理もチェックしてみよう。ここではタイムラインに読み込まれたDCI 4K動画(再生時間は30秒弱)に写っている人物を、AIが判定してマスクをかける処理の時間を計測した。つまり、最初のフレームでマスクがかかった状態から動きをトラッキングするボタンをクリックし、最終フレームの処理が終わるまでの時間である。

DaVinci Resolve Studio:Magic Mask処理時間

 ここでもRTX 4090 FEは他のGPUを圧倒している。RX 6950 XTだと2分以上待たされる処理が、RTX 4090 FEだと20秒以下で完了するのは感動的ですらある。動画編集時のイライラを少しでも無くしたいクリエイターなら、RTX 4090は決して高い買い物ではないだろう。

 画像や動画のアップスケールやノイズ除去にも、GPUを利用したAI処理が使われる。そこで、「On1 Resize AI」を使ったリサイズ処理をチェックしてみよう。30枚のJPEG画像(800ピクセル四方)を読み込み、これを縦横2倍、即ち400%の拡大処理を行わせる。30枚すべてに処理をかけてJPEGに出力する時間を計測した。

On1 Resize AI:30枚のJPEG画像の拡大処理実行時間

 ここでも確かにGPUパワーの影響が反映されている。RTX 3090 TiやRTX 3090 FEではRX 6950 XTと大差ない速度だったが、RTX 4090 FEでは一気に10秒以上の短縮に成功した。

 しかし、すべてのアプリがRTX 4090によって高速化されたわけではない、という例もお見せしよう。次は「Topaz Gigapixel AI」で同じような処理を実施する。こちらは学習モデルに“Severe Noise”を指定しノイズ除去も追加した。AIプロセッサーの設定では明示的にGPUを指定し、メモリー使用量も最大に設定している。

Topaz Gigapiexl AIによる処理時間

 今回の検証ではどのGPUも3分台で終了したが、RTX 3090 TiとRTX 3090 FEが速く、RTX 4090 FEは3番手。Topaz Gigapiexl AIがRTX 4090 FEを上手く扱えなかったのかもしれないが、RTX 4090 FEがあれば無条件で速くなるわけではないようだ。

まとめ:速さを求めるのにこれ以上のGPUはない ただし、金に糸目をつけない人向け

 以上で3回に渡るRTX 4090 FEレビューは終了だ。16384基ものCUDAコアのパワーはゲームでもクリエイティブ系アプリでも極めて有用だ。もし自分の作業環境の遅さがGPUにあるのではと疑っているなら、RTX 4090を導入してしまうのはどうだろう。RTX 4090で太刀打ちできなければ、原因は他にあるからだ(Topaz Gigapiexl AIのようにRTX 4090でも奮わない例はあるが……)。

 ゲームに使う場合、ディスプレー環境も4K(以上)にしなければ強みを発揮できないという制約はあるが、Cyberpunk 2077のような超重量級ゲームでも快適にプレイできる環境が作れるだろう。RTX 4090を導入すれば、今後しばらくGPU性能について心配する必要はなくなる。即ち、“内なる平穏”を享受できるはずだ。

 しかしながら、この環境を躊躇無く用意できる個人は、今の時代相当に限られる。比類なきパワーといっても、単体で30〜40万円のパーツはそう気楽に買えるものではない。消費電力が高めなのもネックだが、何より同梱の8ピンケーブル×4変換のケーブルは見た目的に邪魔すぎる。となれば12VHPWRを直出しできる電源ユニットも一緒に揃えたい。

 さらに、大型カードに合わせてPCケースの新調を……等と考えていけばあっという間に50万円コースだ。RTX 40シリーズ最大の売りであるDLSS Frame Generationが一般に試せるようになるのはまだ先だし、動画編集アプリにおけるAV1対応まだ十分とはいえない。じっくりと検討し、覚悟を決めてから購入に踏み切りたいものだ。

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください