レビュー
謳い文句どおりの高性能で4K&レイトレも余裕だが,消費電力はやはり大きい
NVIDIA GeForce RTX 4090 Founders Edition
2022年10月12日に発売となる,Ada Lovelace世代のNVIDIA製GPU「GeForce RTX 4090」(以下,RTX 4090)を搭載するNVIDIA製グラフィックスカード「GeForce RTX 4090 Founders Edition」(関連記事,以下 RTX 4090 Founders Edition)のベンチマークテスト情報が解禁となった。
NVIDIAは,RTX 4090で,同社独自の超解像技術「DLSS」を「DLSS 3」にアップデートしたことで,DLSS無効時と比べて2倍の性能を発揮するとしている。さらに,リアルタイムレイトレーシングのスループットは,前世代の最上位GPUである「GeForce RTX 3090 Ti」(以下,RTX 3090 Ti)と比べても2倍を超えるそうで,実に威勢いい数字が並んでいる。では,はたしてRTX 4090のゲームにおける実行性能はどの程度なのだろうか。実際にテストを行って,その実力に迫ってみたい。
動作クロックは2715MHzまで上昇するのを確認
それに加えて,レイトレーシングエンジンの「RT Core」は第3世代に,AI処理エンジン「Tensor Core」は第4世代へと進化しているのも見逃せない。また,L2キャッシュメモリ容量が72MBと大容量になった点も,トピックのひとつとして挙げられよう。
RTX 4090 Founders Editionの仕様については,カードの紹介記事を合わせて参照してほしいが,追記すると,8ピンのPCI Express(以下,PCIe)拡張電源コネクタを4つ束ねて16ピンに変換する付属の電源ケーブルは,コネクタを3本しかつなげていない状態でも,PCは起動して,ベンチマークやゲームも動作した。
ただ,電源コネクタを3本しか束ねていない状態では,性能がおおむね2%くらい低下する。RTX 4090 Founders Editionの実力をフルに発揮したいのであれば,コネクタは4本すべてに接続するのが望ましい。ちなみに,接続するコネクタが2本の場合は,PCが起動しなかった。
RTX 4090の主な仕様を,RTX 3090と「GeForce RTX 3080 Ti」(以下,RTX 3080 Ti)と合わせてまとめたのが表1となる。
3DMarkとCyberpunk 2077でDLSS 3のテストを実施
それでは,RTX 4090のテスト環境の構築に話を移そう。今回,比較対象にはRTX 3090とRTX 3080 Tiを用意した。前世代のハイエンドと比べて,RTX 4090がどの程度進化したのを確認しようというわけである。
ただ,RTX 3090搭載カードとして利用したPalit Microsystems製の「GeForce RTX 3090 GamingPro OC」は,メーカーレベルで動作クロックが引き上げられたクロックアップモデルなので,MSIのオーバークロックツール「Afterburner」(Version 4.6.5 Beta2)でブーストクロックをリファレンスクロックまで下げて使用している。
使用したドライバソフトは,RTX 4090レビュワー向けに配布された「GeForce 521.90 Driver」だ。テスト時にNVIDIA公式が配布している最新版は,「GeForce 517.48 Driver」なので,RTX 40世代に合わせてドライバも520世代へとアップデートするようだ。また今回は,後述する理由により,OSにWindows 10ではなくWindows 11を選択した。そのほかの環境は表2のとおり。
CPU | Ryzen 9 5950X(16C32T,定格クロック3.4GHz, |
---|---|
マザーボード | MSI MEG X570 ACE(AMD X570, |
メインメモリ | G.Skill F4-3200C16D-16GIS |
グラフィックスカード | GeForce RTX 4090 Founders Edition |
Palit Microsystems GeForce RTX 3090 GamingPro OC | |
GeForce RTX 3080 Ti Founders Edition |
|
ストレージ | Samsung Electronics SSD 850 |
電源ユニット | Corsair CMPSU |
OS | 64bit版Windows 11 Pro(22H2,Build 22621.521) |
チップセットドライバ | AMD Chipset Drivers 4.08 |
グラフィックスドライバ | GeForce: |
テスト内容は,4Gamerのベンチマークレギュレーション25.0に準拠。テスト解像度は,いつもどおり3840×2160ドット,2560×1440ドット,1920×1080ドットの3つを選んだ。
ただ,「3DMark」に関しては,DLSS 3に対応したレビュワー向けバージョンとなる「3DMark Version 2.22.8009」を用いている。
余談気味だが,レビュワー向け3DMarkを使ってDLSS 3を指定した「NVIDIA DLSS feature test」を実行しようとしたところ,Windows 10環境では動作せず,Windows 11では動作するという現象が発生した。NVIDIAに確認したところ,Windows側の「ハードウェア アクセラレータによる GPUスケジューリング」(以下,GPUスケジューリング)が有効になっていないと,同テストが正常に動作しないのが原因とのこと。この項目は,DLSS 3の「フレーム生成」(Frame Generation)で必要になるそうだが,Windows 11では既定で有効,Windows 10では既定で無効になっている。つまり,Windows 10でNVIDIA DLSS feature testを実行する前には,OSの設定アプリからGPUスケジューリングを有効にしておく必要があるわけだ。
DLSS 3に対応する3DMarkの一般公開版では,「SystemInfo」ツールがGPUスケジューリングの有効/無効を通知する機能が盛り込まれるとのこと。そういった理由から,今回はテストにWindows 11を採用している。
また,3DMarkにおいては,レイトレーシングのテストである「Port Royal」と「DirectX Raytracing feature test」,それに先ほどのNVIDIA DLSS feature testを追加した。NVIDIA DLSS feature testでは,RTX 4090のみDLSS 3(3.0)を,それ以外はDLSS 2(2.0)を選択したうえで,DLSS modeは,いずれもQualityに設定している。なお,DLSS 3では1920×1080ドットが選択できないため,今回は3840×2160ドットと2560×1440ドットの2種類で実施している。
これら標準のテストに加えて,今回は,DLSS 3の効果を確認するために,「Cyberpunk 2077」でテストを行う。使用したのは,レビュワー向けに配布されたDLSS 3対応のβ版で,DLSS 3の補間フレーム生成機能「Frame Generation」(フレーム生成)のオンとオフを切り替えられる。
そこで今回は「レイトレーシング:ウルトラ」プリセットを適用したうえで,NVIDIA独自の遅延短縮機能「NVIDIA Reflex」(以下,Reflex)も加えた3つの状態で,ゲーム内にあるベンチマークモードを実行した。
- DLSS 3:オン,フレーム生成:オン,Reflex:オン
- DLSS 3:オン,フレーム生成:オフ,Reflex:オン
- DLSS 3:オフ,Reflex:オフ
なお,DLSS 3オン時は,「DLSS Super Resolution」を「パフォーマンス」に設定している。
ただ,NVIDIAによると,このベンチマークはDLSS 3が生成した補間フレームを正確にカウントできないそうで,フレーム生成をしていない状態とフレームレートの計測結果が変わらないそうだ。そこで,テスト中のフレームレートとレイテンシ(描画遅延)は,NVIDIA製のベンチマークツール「FrameView」(Version 1.4.8127)で取得している。
RTX 3090の2倍程度の性能を発揮する場面も
DLSS 3におけるフレーム生成の恩恵はかなり大きい
それでは,3DMarkの結果から順に見ていこう。DirectX 11世代のテスト「Fire Strike」から,総合スコアをまとめたものがグラフ1である。
RTX 4090が,群を抜いたスコアを記録したのが一目瞭然だ。RTX 3090との差は19〜89%程度で,テスト解像度が高くなるにつれて,RTX 4090の優位性が増している。RTX 3080 Ti比では,Fire Strike Ultraで約95%の差を付けており,新世代のGPUらしい抜群の性能と言っていい。
グラフ2は,総合スコアから「Graphics score」を抜き出したものだ。
ここではCPU性能の影響がなくなるため,RTX 4090がさらに勢いを増す形となった。RTX 3090との差は38〜97%程度もあり,RTX 3080 Tiに対してはFire Strike Ultraで倍以上のスコアを発揮した。RTX 4090が,格の違いを見せ付けている。
続いてグラフ3は,ソフトウェアベースの物理演算テスト結果を「CPU score」として抜き出したものだ。CPUを統一していることもあり,スコア差は大きくても約1%と,ほぼ横一線だ。
GPUとCPU両方の性能が効いてくる「Combined test」の結果をまとめたものがグラフ4となる。
Fire Strike“無印”で,なぜかRTX 4090のスコアが奮わない。Fire Strike ExtremeやFire Strike Ultraでは,RTX 4090が如何なく性能を発揮しているため,“無印”だけが異常だ。
そこで,テスト中のGPU使用率を追ってみると,“無印”では,RTX 3090が80%程度にまで達しているのに対して,RTX 4090は40%弱までしか上がっていない。NVIDIAによると,Fire Strikeは10年近く前に開発された古いテストなので,CPUによって処理速度が制限される「CPUバウンド」が発生しているという。つまり,古いゲームでは,RTX 4090の性能を活かしきれない場面があるわけで,注意しておきたい。
続いては,DirectX 12世代のテストである「Time Spy」の結果を見ていこう。まずは総合スコアをまとめたグラフ5からだ。
ここでも,RTX 4090の牙城はまったく揺るがない。RTX 4090とRTX 3090との差は53〜68%程度もあり,RTX 3080 Tiにいたっては57〜74%程度にまで差が広がっている。
次のグラフ6は,Time SpyのGPUテスト結果を,グラフ7は,CPUテストの結果をそれぞれまとめたものだ。
まず,GPUテストだが,ここではCPU性能の影響がなくなるため,RTX 4090はCPUの足かせがなくなり,スコアはさらに勢いを増している。RTX 3090との開きは81〜95%程度に広がり,Time Spy ExtremeでRTX 4090は,RTX 3080 Tiの2倍を超えるスコアを発揮したのは,なかなかインパクトがある。
一方のCPUテストは,Fire Strikeと同様に,CPUが同一なので基本的に横並びだ。
リアルタイムレイトレーシングの性能を計るPort Royalの結果がグラフ8だ。
Port Royalでは,RTX 4090がRTX 3090やRTX 3080 Tiと比べて2倍前後のスコアを叩き出した。RT Coreが第3世代に進化したことと,RT Coreの数も128基に増量されたことで,レイトレーシング性能は飛躍的に伸びているといっていいだろう。
それは,もうひとつのレイトレーシングテストとなる「DirectX Raytracing feature test」でも同様だ。その結果がグラフ9となる。
ここでは,RTX 4090がさらにスコアを伸ばし,RTX 3090やRTX 3080 Tiの2.5倍と,まったく相手にしないほどずば抜けた結果を残している。冒頭で述べたとおり,NVIDIAはRTX 4090のレイトレーシングのスループットに関して,「RTX 3090 Tiの2倍以上」と説明していたが,どうやら誇大表現ではなかったようだ。
続いて,DLSSの性能を見るNVIDIA DLSS feature testの結果(グラフ10)を見ていこう。ここで,注意してほしいのは,RTX 4090ではDLSS 3を,RTX 3090とRTX 3080 TiではDLSS 2を用いていることだ。
DLSS on時のフレームレートを見ると,RTX 4090は,2560×1440ドットでRTX 3090の約2.5倍,3840×2160ドットで約3倍にも達しており,非常に高い。DLSS有効時に無効時からどれだけフレームレートが向上したかを算出すると,RTX 3090やRTX 3080 Tiが1.6〜1.8倍程度しか伸びていないのに対して,RTX 4090は2.1〜2.7倍と大きく伸びている。第4世代のTensor Coreによるフレーム生成の恩恵は,かなり大きいことが分かる。
DLSS 3の実力をゲームでも検証してみよう。Cyberpunk 2077でのフレームレート測定結果をグラフ11〜13にまとめた。
DLSS 3でフレーム生成がオンの状態では,平均フレームレートでDLSSオフ時の2〜3.3倍,1パーセンタイルフレームレートは3倍程度にまで伸びている。とくにRTX 4090は,1パーセンタイルフレームレートが3840×2160ドットでも90fpsまで達しているのが,かなり衝撃的だ。フレーム生成だけをオフにした状態との差も58〜100%程度あるので,フレーム生成の恩恵はかなり大きい。
さらに,Cyberpunk 2077におけるレイテンシの結果をまとめたものが,グラフ14〜16となる。フレーム生成はどうしてもレイテンシが大きなってしまうが,それを補うのがNVIDIA ReflexだとNVIDIAは主張しており,その効果を見るためのテストだ。
フレーム生成をオンにすると,DLSSオフ時と比べて平均で1〜14%程度,最大では1〜20%程度,レイテンシが長くなっている。とくにフレーム生成だけをオフにした状態と比べて,平均で11〜23%程度,最大で18〜27%程度もの差が付いた。フレームレートが大きく向上する半面,レイテンシが増大してしまう点は,DLSS 3の弱点と見てよさそうだ。
ちなみに,DLSSオフ時のほうがフレーム生成だけをオフにした状態よりレイテンシが遅いのは,DLSSオフ時はReflexもオフにしているためだ。
さらに,RTX 4090でDLSS 3をオフにした状態と,DLSS 3とフレーム生成をオンにした状態で,ゲームの画質やフレームレートがどう変わるかを動画で見てみよう。プリセットなどの設定は,ベンチマークテストと同じで,解像度3840×2160ドットでベンチマークモードを実行したものを録画した。
編集時とYouTubeでの掲載時に再圧縮がかかっているので分かりにくいかもしれないが,フレーム生成の影響なのか,煙の表現が若干異なるように見える。フレーム生成オンのほうは,空気中の煙が薄かったり,チラつくようだ。とはいえ,全体的には大差なく,実際にプレイしていて,フレーム生成の画質に違和感を覚えることはあまりないと思われる。
続いてグラフ17〜19にまとめた「Far Cry 6」の結果を見てみよう。
これまでのようなRTX 4090の勢いは見られない。RTX 4090とRTX 3090との差は,平均フレームレートで4〜28%程度,最小フレームレートで3〜17%程度と,3840×2160ドット以外の解像度では,かなり差が詰まっている。RTX 4090がトップの座に就いているのは変わらないものの,やはりCPUがネックとなっているのではないだろうか。
一方,グラフ20〜22にまとめた「バイオハザード ヴィレッジ」では,RTX 4090が再び勢いを取り戻している。
2560×1440ドット以上の結果を見ると,RTX 4090とRTX 3090との差は平均フレームレートで37〜103%程度あり,とくに1パーセンタイルフレームレートに注目すると,RTX 4090は3840×2160ドットでRTX 3090の2倍以上にもなるフレームレートを記録したのは立派だ。ただ,ここでも1920×1080ドットでは,CPUのボトルネックが発生してしまっている。
グラフ23〜25は,「Call of Duty: Warzone」(※グラフ内ではCoD Warzone)の結果だ。
1920×1080ドットでRTX 4090のフレームレートが伸びないのは,ここでも同じ。そこで,2560×1440ドット以上を見ていくと,RTX 4090は,RTX 3090に平均フレームレートで35〜72%程度の差を付け,RTX 3080 Tiに対しては,45〜79%程度まで差を広げている。とくに1パーセンタイルフレームレートでは,RTX 4090が3840×2160ドットでも166fpsと非常に高く,前世代との差が明確だ。
続いては,「Fortnite」の結果をグラフ26〜28に示す。
ここでは,先ほどのCall of Duty: Warzoneと似通った傾向となった。1920×1080ドットの平均フレームレートでは,RTX 4090がRTX 3090に対して約13%しか引き離せていないのに対して,2560×1440ドット以上では40〜62%程度と大差をつけている。1パーセンタイルフレームレートでも,RTX 4090が真価を発揮するのは2560×1440ドット以上の解像度で,3840×2160ドットでも100fpsに迫っている点は見逃せない。
グラフ29〜31は「Borderlands 3」の結果だ。
Borderlands 3でも,CPUの影響でRTX 4090が伸び悩んでいるのが見て取れる。RTX 4090とRTX 3090との差は,2560×1440ドットまでの解像度では2〜10%程度しかなく,3840×2160ドットになって,ようやく差が約54%まで広がった。1パーセンタイルフレームレートでは,それほど差が付いておらず,3840×2160ドットでもRTX 4090はRTX 3090に約25%の差をつけている程度だ。RTX 4090が最高の性能を発揮していることは間違いないが,これまでのテスト結果に比べると,インパクトは乏しい。
グラフ32は,「ファイナルファンタジーXIV: 暁月のフィナーレ ベンチマーク」(以下,FFXIV暁月のフィナーレ ベンチ)の総合スコアをまとめたものだ。
RTX 4090は,RTX 3090に21〜43%程度の差を付け,3840×2160ドットではスコアが2万を超えている点は立派の一言。スクウェア・エニックスが示す指標では,スコア1万5000以上が最高評価であるが,RTX 4090は,3840×2160ドットでもそれを大きく上回っており,本作における段違いの快適さを期待できると言っていいレベルだ。
そんなFFXIV暁月のフィナーレ ベンチにおける平均フレームレートと最小フレームレートをまとめたものがグラフ33〜35だ。
平均フレームレートは,おおむね総合スコアを踏襲したものとなっており,RTX 4090が頭ひとつ抜きんでた格好となっている。とくに,3840×2160ドットでも,RTX 4090の平均フレームレートは165fpsと非常に高く,RTX 3090やRTX 3080 Tiをまったく寄せ付けていない。一方,最小フレームレートはCPU性能の影響が色濃くなるため,RTX 4090でも,RTX 3090やRTX 3080 Tiと差がない結果となった。
グラフ36〜38には,「Project CARS 3」の結果をまとめている。
レギュレーションでは,Project CARS 3のグラフィックス設定を,かなり高めにしている。それゆえ,RTX 3090やRTX 3080 Tiをもってしても,3840×2160ドットでは平均フレームレートが30fpsを割ってしまうわけだが,RTX 4090はレギュレーションで合格点とした50fpsを超えており,前世代のハイエンドをまったく相手にしていないほど高い性能を発揮している。
最小フレームレートでも,RTX 4090は実力を発揮しており,3840×2160ドットでは40fpsにあと一歩のところまで迫っている。
RTX 3090より45〜84W高い電力喰い
さて,RTX 4090のグラフィックスカード全体における最大消費電力「Total Graphics Power」は450Wで,RTX 3090やRTX 3080 Tiの350Wから,100Wも増加してしまっている。先述したとおり,PCIe補助電源用の変換コネクタも,8ピンを4基接続するようになっている点からして,消費電力の大きさが想像できるというもの。はたして,ゲーム中における実際の消費電力はどの程度なのだろうか。
いつもなら,NVIDIAが開発した消費電力計測ツール「PCAT」(Power Capture Analysis Tool)を用いて,グラフィックスカード自体の消費電力を計測してるのだが,PCATは8ピンのPCIe補助電源コネクタを3本使うグラフィックスカードまでしか対応していないのだ。先述したように,RTX 4090はPCIe補助電源コネクタが3本でも動作したのだが,その状態では実力をフルに発揮できない。そのため,今回はログの取得が可能なワットチェッカー「Watts up? PRO」を用いたシステム全体の最大消費電力のみを計測している。
なお,テストにあたっては,Windowsの電源プランを「バランスに設定」。さらに,ゲーム用途を想定して,無操作時にもディスプレイ出力が無効化されないよう指定したうえで,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点をタイトルごとの実行時,OSの起動後30分放置した時点を「アイドル時」としている。
その結果がグラフ39だ。
各ゲーム実行時で,RTX 4090とRTX 3090の差は45〜84W程度にもなった。ピーク値を結果として採用しているため,どうしても値は高くなってしまう傾向にあるのだが,とはいえシステム全体の消費電力が600Wを大きく上回っているあたりは,かなりの電力喰いと言わざるをえない。RTX 3090のレビュー記事で,筆者はRTX 3090を「電力喰い」と称したが,RTX 4090はそれ以上の「大食漢」とでも言えばいいだろうか。RTX 3080 Tiとの差も60〜94W程度であり,RTX 4090は,レベルが違う消費電力の大きさだ。
最後にGPU-Zを用いて計測したGPU温度も確認しておきたい。ここでは,温度約24℃の室内で,テストシステムをPCケースに組み込まず,いわゆるバラックに置いた状態から,3DMarkの30分間連続実行時を「高負荷時」として,アイドル時ともども,GPU-Zから温度を取得することにした。
その結果はグラフ40のとおり。
GPUによって温度センサーの位置が異なる可能性があるうえ,ファンの制御方式も同一ではないため,横並びにあまり意味はない。それを踏まえて見ていくと,RTX 4090は消費電力が高い半面,GPUの温度は高負荷時でも70℃を割っており低めだ。さすがに3スロット占有タイプのGPUクーラーは伊達じゃないと言ったところか。アイドル時も,RTX 4090はファンの回転が停止するものの,大規模なGPUクーラーにより温度は低めだ。
最後にRTX 4090の動作音について触れておこう。筆者の主観であることを断ったうえで述べると,かなり静かなほうだ。もちろん,高負荷時になると動作音はするのだが,それでも簡易液冷型CPUクーラーのファンよりも静かな印象を受けた。RTX 4090が巨大なGPUクーラーを採用したことで,ファンをそれほど高速で回転させる必要がなくなったことが奏功しているのではないだろうか。
30万円前後の価格はネックだが,最高性能が欲しい人なら魅力的な存在
以上のようにRTX 4090の性能は良好だ。とくにDLSS 3を使用したときのフレームレートは秀逸で,現時点において世界最高の性能を誇るGPUと言っても過言ではないだろう。
ただ,RTX 4090にも弱点がないわけではない。ひとつは多くのゲームテストで垣間見えたように,低解像度ではその実力を発揮できない場面があること。このあたりは,より高性能なCPUが今後登場することによって評価も変わってくるだろう。
DLSS 3はゲーム側の実装が必須な点もネックだ。NVIDIAは,「35以上のタイトルがDLSS 3への対応を表明している」と謳っているものの,ゲーマー側からすると,自分のプレイする/したいゲーム側がいつ対応するのかが重要で,それはまだ見えてこない。今後,ほかのゲームでもDLSS 3の採用が進むかどうかも不明だ。
消費電力の高さも称賛はできない。トップエンドの性能であれば消費電力が増大してしまうのは仕方のないことだが,この点でも世代の進化を実感させてほしかった,というのが正直なところだ。
最後に10月に入って東京都内も気温が急に下がり,中には12月並みの気温のところもあったようだが,RTX 4090のテストを行っている最中は,いい暖房になったことを付け加えて,今回のレビューを締めたい。
NVIDIAのGeForce RTX 4090製品情報ページ
- 関連タイトル:
GeForce RTX 40
- この記事のURL: