レビュー
レイトレ&AI対応の新世代GPUは「世界最速」以上の価値を提供できるか
GeForce RTX 2080 Ti
(GeForce RTX 2080 Ti Founders Edition)
GeForce RTX 2080
(GeForce RTX 2080 Founders Edition)
2018年9月19日22:00,GeForce RTX 20シリーズのレビューが解禁となった。
「Turing」(テューリング)アーキテクチャを採用する新世代GPUは,3Dグラフィックスなどを処理するためのシェーダプロセッサ「CUDA Core」とは別に,リアルタイムレイトレーシング用の「RT Core」,AI推論エンジンアクセラレータとしての「Tensor Core」を搭載するというのが最大の特徴だが,ゲーマーが最も注目しているのは間違いなく,既存のゲームがGeForce RTX 20シリーズでどれだけ速くなるかだろう。
今回4GamerではNVIDIAから,「GeForce RTX 2080 Ti」(以下,RTX 2080 Ti)と「GeForce RTX 2080」(以下,RTX 2080)のそれぞれ「Founders Edition」を入手することができたので,GPUの特徴を押さえつつ,そのゲーム性能をチェックしてみたい。
「GPU Boost 4.0」と「Scanner」を利用できるGeForce RTX 20シリーズ
GeForce RTX 20シリーズのアーキテクチャについては西川善司氏による連載記事が詳しいが,本稿でも要点のみ確認しておこう。
本シリーズは,TSMC(Taiwan Semiconductor Manufacturing)がNVIDIA専用に用意する12nm FinFETプロセス技術「12nm FFN」(FFN:FinFET NVIDIA custom)を利用して製造されるGPUだ。RTX 2080 Tiは「TU102」,RTX 2080は「TU104」という名のコアを採用している。
RTX 2080 Ti。パッケージ上の刻印は「TU102-300A-K1-A1」だった。あくまで参考だが,デジタルノギスで計測したサイズは短辺が24.85mm,長辺が31.11mm |
RTX 2080。こちらは「TU104-400A-A1」だ。やはり参考で,実際にはもう少し小さくなるはずだが,デジタルノギスで計測したサイズは短辺22.86mm,長辺24.77mmとなる |
GPUコアが異なるため,ここからは順に見ていこうと思うが,まずTU102のダイサイズは754mm2で,これはPascal世代の「GeForce GTX 1080 Ti」(以下,GTX 1080 Ti)が採用する「GP102」コアの471mm2比で約1.6倍という規模だ。
TU102のフルスペックだと,CPUにおける「CPUコア」的な存在となる「Graphics Processor Cluster」(以下,GPC)数は6基。GPCを構成する演算ユニット「Streaming Multiprocessor」(以下,SM)数はGPCあたり12基で,SMには64基のCUDA CoreとWarpスケジューラ,命令発効ユニット,それにロード/ストアユニット,L1キャッシュ,テクスチャユニット,そしてレイトレーシングにおける光線の生成と衝突判定を行うRT Coreを1基と,行列同士の積和算に特化したTensor Coreを8基統合する仕様だ。
また,2基のSMでジオメトリエンジン「PolyMorph Engine」を共有するという,Volta世代の「GV100」やPascal世代の「GP100」と同じ仕様なので,「Texture/Processor Cluster」(以下,TPC)数はSM数比で半分の36基となる。「GP104」コアを採用する「GeForce GTX 1080」だとSMごとにPolyMorph Engineを組み合わせてあるため,「SM数とTPC数は同じもの」という理解でよく,筆者の過去記事でもよくその前提に立っていたが,TU102は「そうではない」ので,その点は押さえておきたい。
さて,RTX 2080 Tiでは6基あるGPCのどれかで合計4基のSMが無効になっている。GTX 1080 Tiは「6基あるGPCのうち2基でSMの数を少なくする」仕様だったので,おそらくそれと同じようなパターンのはずだが,いずれにせよRTX 1080 TiではSM数が68基,TPC数が34基,CUDA Core数が4352基,RT Core数が68基,Tensor Core数が544基となる。GTX 1080 TiだとCUDA Core数は3584基なので,CUDA Core数ベースの規模感だと2割増しという計算だ。
GPUコアクロックはベース1350MHz,ブースト1545MHz。GTX 1080 Tiだと順に1480MHz,1582MHzだったので若干抑え気味だ。ただしFounders Editionはブーストクロックが1635MHzに設定されており,NVIDIAから全世界のレビュワー向けに配布されたEVGA製オーバークロックツール「Precision X1」(Version 0.1.9.0)でテスト中の動作クロックを追ってみたところ,最大クロックは1935MHzに達していた。Turing世代でも高クロック動作は健在と言っていいだろう。
組み合わせるグラフィックスメモリとしてはGDDR6を初採用。GDDR6とは何かという話は大原雄介氏の解説記事を参照してもらえればと思うが,RTX 2080 Tiではメモリクロック14GHz相当(実クロック1.75GHz)の8Gbit品を11枚搭載することで総容量11GBを実現している。
RTX 2080 Ti側ではメモリコントローラを11基搭載し,全体のメモリインタフェースは352bit幅となるので,メモリバス帯域幅は616GB/sだ。これはGTX 1080 Tiの484GB/sと比べて約38%広い。
続いてはTU104コアを採用するRTX 2080だが,こちらのダイサイズは545mm2。GTX 1080のGP104コアだと314mm2なので,約1.74倍の規模になる。
TU104もGPCの数はTU102と同じく6基なのだが,TU102だとGPCあたりのSM数が12基なのに対し,TU104では8基となる。SM(やTPC)の構成はTU102と変わらないため,TU104のフルスペックだと総CUDA Core数は3072基,RT Core数は48基,Tensor Core数は384基だ。
ただしRTX 2080の場合はどこかのGPCでSMが2基(=TPCが1基)無効になっているため,SM数は46基,総CUDA Core数は2944基となる。RT Core数はSM数と同じ46基で,Tensor Core数は368基である。
RTX 2080のGPUクロックはベース1515MHz,ブースト1710MHzで,GTX 1080の同1607MHz,1733MHzと比べると若干低いが,Founders Editionだとブーストクロックが1800MHzとなり,GTX 1080のリファレンスクロックを逆転する。
また,先ほどと同じようにPrecision X1で動作クロックを追ってみると,GPUコアクロックが1950MHzまで上がることを確認できた。
採用するグラフィックスメモリはRTX 2080 Tiと同じくGDDR6で,メモリクロックも同じ14GHz相当だが,RTX 2080の場合は32bit幅のメモリコントローラを8基搭載する仕様なので,メモリインタフェースは合計256bitとなって,メモリバス帯域幅は448GB/sとなる。グラフィックスメモリの総容量は8GBだ。
ここまで紹介してきたスペックをまとめたものが表1となるので,参考にしてもらえればと思う。
ところで,動作クロックに関しては,GeForce RTX 20シリーズで追加になった要素が2つあることに触れなければならない。
1つは「GPU Boost 4.0」だ。Pascal世代の「GPU Boost 3.0」から整数値が1つ上がった新しいGPU Boostでは,温度制御周りに手が入ったのがトピックとなる。
Pascal世代のGPU Boost 3.0では,「Power Target」(電力目標,以下日本語表記)と「Temperature Target」(温度目標,以下日本語表記)がブーストクロックを制御していた。GPUの消費電力が電力目標に達せず,GPUの温度が温度目標に達しなければ,GPUコアクロックはブーストクロックを大きく超えるところまで伸び,典型的な負荷状況ではブーストクロックに近い動作クロックとなり,GPU温度が温度目標に達した場合はベースクロックでの動作となる。付け加えると,このアルゴリズムは公開されていなかった。
それに対してGPU Boost 4.0では,温度目標より高い温度を「Second Temperature Target」(第2温度目標,以下日本語表記)として設定するという改良も入っている。前述のとおり,GPU Boost 3.0ではGPUコア温度が温度目標に達するとGPUクロックはベースにまで落ちるのだが,GPU Boost 4.0では,温度目標と,ハードウェアの上限温度との間に第2温度目標を設定することで,「温度目標に達しても,第2温度目標へ達するまでは一定レベルのブーストクロックを維持する」ようになったのである。当然,これは高負荷時により高い性能を狙うのに役立つ。
また,GPUの冷却をユーザーが強化することができれば,GPU Boost 4.0をチューニングすることで従来のGPU Boost 3.0以上に性能の引き上げを図ることもできるという。
また,第2温度目標周りのアルゴリズムは公開されており,実際,Turing世代のオーバークロックツールではこの第2温度目標をGPUコアクロックとセットで設定可能だ。たとえばPrecision X1はそれを「Temp Tuner」という名前で実装している。
もう1つの新要素は「NVIDIA Scanner」(以下,Scanner)なのだが,これの使い方が実のところよく分からない。Precision X1でScannerは「VF Curve Tuner」という名前になっているのだが,[SCAN]ボタンを押すと,Scannerはテスト用の専用スレッドを立ち上げて,コア電圧700mV付近,800mV付近,900mV付近,1000mV付近のそれぞれにおいて動作クロックを順に高めていき,安全に動作する限界を自動的に探し出すという動きを見せる。設定後に,途中の電圧を補間してくれる仕掛けなのも確認できた。
終了までには20分近く要し,最終的に,ブーストクロックを若干引き上げてくれる。なのでScannerは「自動オーバークロック機能」と紹介すべきなのかもしれないが,VF Curve Tunerのメニューには別途電力目標値などもあるので,これを併用する前提という可能性も(大いに)あるだろう。
とにかく時間がなく,今回は[SCAN]ボタンを押すことしかできていないため,これについては後日あらためてもう少し突っ込んだテスト結果をお届けできればと考えている。
GPUクーラーや電源回路がPascal世代比で大きく変更となったFounders Edition
続いて,RTX 2080 Ti Founders EditionとRTX 2080 Founders Editionのカードそのものを順に見ていきたい。
RTX 2080 Ti Founders Edition
排気は,整然と並んだフィンを抜け,カードの側面,マザーボードに差したときの垂直方向上下へ抜ける仕様なのが分かる |
ファンは13枚羽仕様。NVIDIAによると,最新世代のファンでは冷却性能と静音性が向上しているという |
補助電源はリファレンスどおり8ピン
NVLinkベースのSLIインタフェースはプラスチック製のカバーで覆われた場所にあった。サイズは大きくなったが,配置は従来のSLIインタフェースと同じ場所だ。
補助電源コネクタは8ピン×2構成 |
こちらがNVLinkインタフェース |
ちなみに,このVapor Chamber付き放熱フィン部は周囲から金属製のベースプレートで囲むことにより,カード全体の強度を高めてあるのだが,金属製ベースプレートは電源回路やGDDR6メモリチップと(おそらく熱伝導シートを介して)接しており,これらのヒートシンクとしても機能するようになっているという。
基板はGPUを電源ユニットが囲むという大がかりな仕様になっているが,NVIDIAいわく,RTX 2080 Ti Founders Editionの電源部は13フェーズ構成の「iMON DrMOS」を採用しているとのことだ。
iMON DrMOSは,ミリ秒以下の電流監視と制御を可能としており,電力のヘッドルームが増大し,オーバークロック動作の安定性も向上するという。また,iMON DrMOSでは負荷状況に合わせてフェーズ数を動的に切り換えられるようになっているため,アイドル時など,低負荷時の電力損失を抑えることもできるそうだ。
なお,13フェーズはあくまでもGPUとメモリコントローラ用。基板上には14GHzで動作するGDDR6用の電源フェーズ用コンポーネントも3組載っている。
表1の繰り返しとなるが,動作クロックはベース1350MHz,ブースト1635MHz。メモリクロックは14GHz相当だ。ブーストクロックが高い分,TDP(Thermal Design Power,熱設計消費電力)はリファレンスの250Wから10W高い260Wとなっている。
RTX 2080 Founders Edition
補助電源コネクタは8ピン+6ピン。6ピン端子は「8ピン端子から2ピン潰してある」という,面白いものになっていた |
5系統の外部出力インタフェースは配置も含めてRTX 2080 Ti Founders Editionと完全に同じだった |
NVIDIAはRTX 2080 Founders Editionが搭載するGPUクーラーについて追加情報を開示しているのだが,それによると,RTX 2080 Founders Editionが搭載するクーラーは,GTX 1080 Founders Editionが搭載するものと比べて動作音が定格動作時に約2倍,オーバークロック設定時には約5倍静かだそうだ。また,最も静かな動作時であってもGPUコア温度は75℃以下に保てるレベルだという。
ただし,基板デザインはさすがに異なり,iMOS DrMOSを採用した電源部はGPU用が8+2フェーズ,メモリチップ用が3フェーズと,RTX 2080 Ti Founders Editionと比べて規模が若干小さくなった。もっとも,GTX 1080 Founders Editionは5+1フェーズだったので,それと比べると大幅な強化を実現している。
動作クロックはベース1515MHz,ブースト1800MHz。ブーストクロックがリファレンス比で90MHz高いこともあって,TDPはリファレンスの215Wより10W高い225Wという設定になっている。
テストに用いたドライバはレビュワー向けの「411.51」。レイトレーシングやDLSSのテストも実施
前置きが長くなってしまったが,テスト環境のセットアップに入ろう。
今回,2製品の比較にはGTX 1080 Ti Founders EditionとGTX 1080 Founders Editionを用意した。つまり,RTX 2080 TiとRTX 2080が,置き換え対象となっているGeForce GTX 10シリーズに対してどの程度の性能を実現できるかを確認しようというわけである。
また,テストにあたっては,あくまでも参考ながら,[SCAN]ボタンを押してブーストクロックが若干上がった状態を「RTX 2080 Ti SC」「RTX 2080 SC」として,テスト結果を併記することにした。
テストに用いるグラフィックスドライバは,RTX 2080 TiとRTX 2080のテスト用としてNVIDIAから全世界のレビュワーに配布された「GeForce 411.51 Driver」だ。Windowsの「電源プラン」は「高パフォーマンス」を選択している。そのほかテスト環境は表2のとおりとなる。
テスト方法は基本的に4Gamerのベンチマークレギュレーション22.0準拠。RTX 2080 TiとRTX 2080が4K環境を想定していること,一方でフルHDでの高リフレッシュレート環境における性能を気にする読者が多いであろうことから,3840
さらに,RT CoreとTensor Core搭載の意義を簡単に確認すべく,リアルタイムレイトレーシングのほうではNVIDIAが用意したデモプログラム「Star Wars Reflections」のテストを実施する。また,Tensor Coreも用いた「DLSS」(Deep Learning Super Sampling)としては,「FINAL FANTASY XV WINDOWS EDITION」(以下,PC版FFXV)の公式ベンチマークソフト「FINAL FANTASY XV WINDOWS EDITION ベンチマーク」(以下,FFXVベンチ),そのDLSS対応版としてNVIDIAから配布されたリビジョン1216052を用いる。また,新しいプログラマブルシェーダ「メッシュシェーダ」(Mesh Shader)のテストではNVIDIA製のデモプログラム「Asteroids Demo」を用いることにした。
これら追加テストをどのように実行したかという話は考察のところで併せて述べたい。
対Pascalではざっくり3〜4割程度の性能向上。4Kなど高解像度に強い
以下,本文中,グラフ中とも「Founders Edition」表記を省略するとお断りしつつ,「3DMark」(Version 2.5.5029)からテスト結果を順に見ていこう。グラフ1は「Fire Strike」における総合スコアをまとめたものだ。
RTX 2080 TiはGTX 1080 Tiに18〜30%程度のスコア差を付けた。Fire Strike“無印”でスコア差が約18%に縮まっているのはCPUが相対的なボトルネックとなっているためなので,それを除けば約3割のスコア向上と言える。
一方のRTX 2080はRTX 2080 Ti比80〜87%のスコアを示した。「Fire Strike Extreme」以上のテスト条件で言えば約80%だ。GTX 1080 Tiに対しては3〜4%程度,GTX 1080に対しては17〜26%程度――Fire Strike“無印”を無視すれば25〜26%程度――高いスコアを示している。
Scannerを利用してブーストクロックを引き上げたRTX 2080 Ti SC,RTX 2080 SCはそれぞれ定格動作時に対してスコアを最大2%伸ばした。これを「ほぼノーリスクで2%も!」と肯定的に捉えるか,「たった2%」と否定的に捉えるかは意見が分かれそうである。
「Fire Strike“無印”で相対的なボトルネックが生じていた」という話の証拠となるのがグラフ2,総合スコアから「Graphics score」を抜き出したものだ。ここではCPUの影響を受けないため,RTX 2080 TiはGTX 1080 Tiに対して安定的に30〜34%程度,RTX 2080はGTX 1080に対してやはり安定的に26〜27%程度高いスコアを示している。RTX 2080 TiとRTX 2080のスコア差は26〜27%程度だ。
Scannerの効果が最大で約2%なのは総合スコアと変わらない。
続いてグラフ3はソフトウェアベースの物理演算テスト結果を「CPU score」として抜き出したものだが,CPUを統一していることもあり,スコアはほぼ横一線に並んでいる。
厳密に言えば,RTX 2080 SCだけFire Strike“無印”でスコアを若干落としているが,この理由は分からない。Scannerに絡んで何かしらCPUの処理が発生したのかもしれないが,なんとも言えないところだ。
グラフ4はGPUとCPU両方の性能が効いてくる「Combined test」の結果をまとめたものだが,ここではFire Strike“無印”で相対的なCPUボトルネックによってスコアが頭打ちになってしまっている。そこでFire Strike Extreme以上を見ていくことになるが,ここでは総合スコアやGraphics scoreよりもTuring世代とPascal世代でスコア差が開く結果となった。
RTX 2080 TiはGTX 1080 Tiに対して28〜37%程度,RTX 2080はGTX 1080に対して31〜38%程度高いスコアだった。RTX 2080 TiとRTX 2080のスコア差も28〜34%程度と若干開き気味である。
DirectX 12世代のテストである「Time Spy」だと,また違った結果が得られた。グラフ5は総合スコアをまとめたものだが,RTX 2080 TiとGTX 1080 Tiのスコア差は46〜48%程度,RTX 2080とGTX 1080のスコア差は41〜43%程度と,かなり大きくなっているのだ。
西川善司氏が解説しているとおり,Turing世代のGPUではCUDA CoreレベルでFP32演算とINT32演算のオーバーラップ実行が可能になっているのだが,ひょっとするとその効果が大きく出ている可能性はある。あるいは,NVIDIAが何も言っていないだけで,DirectX 12(Direct3D)のAsynchronous Compute性能にTuring世代で最適化が入っている可能性もあるだろう。
なお,Scannerの効果はここでも1〜2%程度だった。
次にグラフ6はTime SpyのGPUテスト結果,グラフ7はCPUテストの結果をそれぞれまとめたものだ。
GPUテスト結果は総合スコアよりさらに景気がよく,RTX 2080 TiはGTX 1080 Tiに対して61〜63%程度,RTX 2080はGTX 1080に対して51〜54%程度も高いスコアを示した。RTX 2080 TiとRTX 2080のスコア差は27〜31%程度となる。
CPUテストは基本的にスコアが横並びだが,Fire Strikeと同様にRTX 2080 SCだけ若干低くなったのはやや気になる。
では,実際のゲームだとどうか。グラフ8〜10は「Far Cry 5」のテスト結果となる。
ここで注目したいのは,3840
一方のRTX 2080は,1920
Scannerの効果が最大約2%というのは3DMarkと変わらない。
RTX 2080 TiとRTX 2080が良好な結果を残したのはグラフ11〜13の「Overwatch」でも同じだ。ゲームの仕様上,フレームレートの上限は300fpsとなり,それゆえに1920
RTX 2080も平均および最小フレームレートの両方でGTX 1080 Tiを上回っており,世代の違いを実感できる結果となっている。
グラフ14〜16の「PLAYERUNKNOWN'S BATTLEGROUNDS」(以下,PUBG)でもRTX 2080 Tiのスコアはなかなかインパクトの高いものになっている。
最も注目したいのは,グラフィックス設定プリセット「高」の1920
平均フレームレートでスコア差を見てみると,RTX 2080 TiはGTX 1080 Tiに対して36〜43%程度,RTX 2080はGTX 1080に対して31〜38%程度高いスコアを示す。3840
「Fortnite」の結果がグラフ17〜19になるが,「エピック」プリセットを選択しているにもかかわらず,1920
平均フレームレートを比較すると,RTX 2080 TiはGTX 1080 Ti比で47〜48%程度,RTX 2080はGTX 1080 Ti比で14〜20%程度,GTX 1080比で43〜47%程度高いスコアを示しているので,3DMarkのTime Spyに近いスコア差が出ている計算になる。
「Middle-earth: Shadow of War」(以下,Shadow of War)の結果がグラフ20〜22だ。
平均フレームレートを比較すると,RTX 2080 TiはGTX 1080 Ti比で33〜58%程度,RTX 2080はGTX 1080 Ti比で15〜21%程度,GTX 1080比で37〜53%程度と,Fortnite以上に大きなスコア差が付いた。これは,GPU自体の性能差以上に,「Shadow of Warがグラフィックスメモリに対する負荷の高いタイトルである」ことの影響が出ていると言ってよさそうだ。要するに,GDDR6の広帯域幅による恩恵が大きいということである。
グラフ23は「ファイナルファンタジーXIV: 紅蓮のリベレーター ベンチマーク」(以下,FFXIV紅蓮のリベレーター ベンチ)の総合スコアをまとめたものとなるが,ここではRTX 2080 Tiが3840
スコア差は高解像度になるに従って広がっていくので,Shadow of Warと同様にグラフィックスメモリバス帯域幅がかなり“効いて”いるという理解でいいと思うが,実際,3840
そんなFFXIV紅蓮のリベレーター ベンチにおける平均フレームレートと最小フレームレートをまとめたものがグラフ24〜26だが,3840
ここでちょっと気になったのは,1920
グラフ27〜29は「Project CARS 2」の結果だが,平均フレームレートを比較すると,RTX 2080 TiがRTX 2080に対して5〜25%程度,GTX 1080 Tiに対して11〜32%,RTX 2080がGTX 1080 Tiに対して6〜8%程度,GTX 1080に対して19〜31%程度高いスコアになっている。1920
リアルタイムレイトレーシングやDLSSは「ゲーム側が対応すれば」大きな効果を期待できそう
まずは,リアルタイムレイトレーシングだが,ここで用いるStar Wars Reflectionsデモは,その名のとおり映画「Star Wars」(スター・ウォーズ)を題材にしたものだ。シルバーの装甲に身を包んだ,キャプテン・ファズマと思しき人物がいるエレベータに,2人のストームトルーパーが乗り込んでくるという50秒ほどのシーンを描くものだ。
GDC 2018でデビューしたこのデモはこれまで何度も披露されてきたので,見たことのある読者も多いだろう。床や装甲などを描写するのにリアルタイムレイトレーシングを用いている。
Star Wars ReflectionsはUnreal Engine 4ベースで,グラフィックスAPIにDirectX 12(Direct3D 12)を採用しているため,今回はGPUOpenのフレームレート計測ツール「OCAT」(Version 1.1.0)で50秒間の平均フレームレートを取得することにした。テスト解像度は3840
ただし,OCATでは最小フレームレートを測定する術がないため,代わりに「1 percentile」(以下,1パーセンタイル)を指標として用いることにしている。1パーセンタイルというのは,「得られたフレームレートを大きいほうから並べたとき,1%の位置にあるフレームレート」という意味で,厳密な最小フレームレートではないものの,それに近い値として利用できるからだ。
その結果がグラフ30,31だ。3820
続いてDLSSのテスト用となる特別版FFXVベンチだが,この特別版は解像度が3840×2160ドット,グラフィックス設定プリセットが「カスタム」にそれぞれ固定されていた。そして,「DLSSバッチファイル」と「TAAバッチファイル」のそれぞれを実行することで,DLSSとTAA(Temporal Anti-Aliasing,テンポラルアンチエイリアシング)それぞれの環境でベンチマークを行えるようになっていた。
そこで今回は,DLSSとTAAのそれぞれにおいて,総合スコアを取得するだけでなく,「Fraps」で平均フレームレートと最小フレームレートも記録することにした。テストは条件ごとに2回ずつ行い,それぞれ平均をスコアとして採用している。
総合スコアはグラフ32,平均フレームレートと最小フレームレートはグラフ33にまとめたが,RTX 2080 TiとRTX 2080ではいずれもDLSS有効時のスコアがTAA有効時のそれを圧倒した。具体的には,総合スコアだとDLSS有効時のスコアがTAA有効時を35〜37%程度上回った。
最小フレームレートに着目すると,グラフィックスメモリ容量が相対的に少ないRTX 2080でDLSS有効化の効果が大きいことも見てとれよう。アンチエイリアシングをポストプロセスで処理することの恩恵は,メモリ周りのスペックがより低いGPUでこそ活きるということなのだろう。
また,DLSSを利用できないPascal世代のGPUと比較した場合,DLSS利用時のRTX 2080 TiはTAA利用時のGTX 1080 Tiに対して約94%,DLSS利用時のRTX 2080はTAA利用時のGTX 1080に対して約88%高いスコアなので,完全に圧倒している状態だ。
気になるDLSSの品質についても確認しておきたい。下に示すスクリーンショットは,DLSSもしくはTAAを適用した状態でベンチマークの1シーンを切り出したものだ。
チョコボで移動するシーンでは風景が流れていくが,DLSS有効時のほうが若干,アンチエイリアシングの効きは強い印象を受ける。ただ,葉の精細感は落ちているので,一長一短か。一方,釣りのシーンでは,主人公であるノクトの顔に注目すると,TAAでは乱れる表示がDLSSでは整っている。
繰り返すが,この特別版FFXVベンチもNVIDIA提供のものだ。最終的にFFXVのゲーム本編で今回と同じDLSSの効果が得られる保証はない。しかし,仮に得られるのであれば,DLSSはかなり有効なポストプロセスだと言っていいのではなかろうか。
メッシュシェーダのテストには,これまたNVIDIAが用意した「Asteroids Demo」を利用する。このAsteroids Demoは,小惑星帯を宇宙船が飛行するだけのデモだが,総数30万〜40万個の小惑星を描画するのにメッシュシェーダ(と,それを制御するタスクシェーダ(Task Shader))を活用することで実描画数を抑えている。グラフィックスAPIにはDirectX 12を用いており,メッシュシェーダを持たないGTX 1080 TiやGTX 1080では実行できない。
Asteroids Demoを実行している様子 |
LoDレベルを色分けして分かりやすくしたもの |
RTX 2080 TiとRTX 2080を比較すると,平均フレームレートの違いは26〜33%程度。かなりの数の小惑星を描画しているにも関わらず,RTX 2080 Tiは平均40fps台を維持できている。
なお,RTX 2080 Ti SCやRTX 2080 SCのスコアを見る限り,Scannerの恩恵はあまりなさそうだ。
Pascal世代から消費電力は確実に増大。GPUクーラーの冷却性能と静音性は高い
さて,RTX 2080 TiのTDPは250WとGTX 1080 Tiから変わっていないものの,補助電源コネクタは8ピン×2へと変更され,電力供給量は増加している。また,RTX 2080にいたっては215Wと,GTX 1080から35Wも増えている。付け加えるなら,今回入手したFounders Editionでは定格プラス10Wだ。では実際のところ,RTX 2080 TiとRTX 2080の消費電力はどの程度なのだろうか。
「4Gamer GPU Power Checker」(Version 1.1)を用いて,FFXIV紅蓮のリベレーター ベンチ実行時におけるカード単体の消費電力推移をまとめたものがグラフ37となる。
下のグラフ画像はクリックすると横に引き伸ばしたものを表示するようにしてあるので,ぜひそちらも合わせてチェックしてもらえればと思うが,ここではRTX 2080 Ti SCで何度か400W超級の消費電力値を示しているのを確認できる。RTX 2080 Tiもそこまでではないが,350Wを超える局面が多く,消費電力は相当に大きいと言っていいだろう。
RTX 2080も300Wに達する局面が頻発しており,GTX 1080と比べると消費電力が増大しているのは明らかだ。
グラフ37におけるスコアの中央値をまとめたものがグラフ38である。RTX 2080 TiはGTX 1080 Ti比で約48W,RTX 2080に至ってはGTX 1080比で約70W上がってしまっている。
ちょっと面白いのは,RTX 2080 Ti SCがRTX 2080比で約19Wも消費電力が上がってしまっているのに対し,RTX 2080 SCでは1Wに留まっている点だ。先に紹介したScannerの結果だとRTX 2080 SCのほうがクロックは上がっている印象だったのだが,RTX 2080 Ti SCでは中間の電圧における動作クロックの引き上げが大きかったため,その電圧付近で動作した結果として消費電力も増えてしまったということなのかもしれない。
念のため,ログの取得が可能なワットチェッカー「Watts up? PRO」を用いてシステム全体の最大消費電力も計測することにした。
テストにあたっては,Windowsの電源プランを「バランスに設定」。さらに,ゲーム用途を想定し,無操作時にもディスプレイ出力が無効化されないよう指定したうえで,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点をタイトルごとの実行時,OSの起動後30分放置した時点を「アイドル時」としている。その結果がグラフ39だ。
ここでは,4Gamer GPU Power Checkerで計測したカード単体の消費電力ほどにはRTX 2080 TiとGTX 1080 Tiのスコア差が開いていないものの,それでもやはりTuring世代で消費電力が確実に増大していることは見てとれる。また,ゲーム実行時におけるRTX 2080の消費電力は,こちらだとGTX 1080 Tiより低いものの,GTX 1080と比べると35〜69W高くなった。Scanner利用によるオーバークロックの影響はプラス10W以内といったところか。
最後に,「GPU-Z」(Version 2.11.0)を用いて計測したGPU温度も確認しておきたい。
ここでは,温度約24℃の室内で,テストシステムをPCケースに組み込まず,いわゆるバラックに置いた状態から,3DMarkの30分間連続実行時を「高負荷時」として,アイドル時ともども,GPU-Zから温度を取得することにした。
その結果はグラフ40のとおり。RTX 2080 TiとRTX 2080の高負荷時における80℃を割り,GTX 1080 TiやGTX 1080よりも低い。Turing世代のFounders EditionではGPU温度をPascal世代よりも低く抑えようとしているようだ。
一方でアイドル時の温度は40℃前後とPascal世代のFounders Editionより高い。このあたりは静音性に配慮したファン設定になっているようだ。
気になるRTX 2080 TiとRTX 2080両Founders Editionの動作音だが,筆者の主観であることを断ったうえで述べると,十分静かな印象を受けた。少なくとも,GTX 1080 TiやGTX 1080のFounders Editionより静かなのは確かだ。NVIDIAが「5倍静か」と言うのもあながち間違いではなさそうな印象がある。
新要素にどれだけの価値を見出せるか。RTX 2080 Tiは「世界最速」に魅力を感じるならアリ
テストを終えてはっきりしてきた課題は2つで,1つは,NVIDIAが声高にアピールするリアルタイムレイトレーシングやDLSSを利用するには,ゲーム側の対応が不可欠だということだ。NVIDIAはリリースと同時に複数のタイトルで両機能を利用できるとしていたが,少なくともレビュワーがテストできたタイミングで「実ゲームタイトル」は1本もない。
RT CoreやTensor Coreがバリバリ活躍してこそのTuringアーキテクチャだが,真価を日常的に発揮できるようになるまでは,相応の時間がかかるのではないだろうか。
もう1つは,そうした「これから重要になるとNVIDIAが考えている機能」を実装したことで,価格がPascal世代を圧倒してしまっていることである。
Pascal世代を振り返ってみると,GTX 1080とGTX 1080 Tiをそれぞれ搭載するグラフィックスカードの北米市場でのメーカー想定売価は発売時点でいずれも699ドル(税別)だった(※GTX 1080のリリースから約10か月後にGTX 1080 Tiが発表になったとき,GTX 1080は価格改定が入った)。
それに比べると,RTX 2080が699ドル(税別)なのはともかく,RTX 2080 Tiの999ドル(税別)という搭載グラフィックスカードのメーカー想定売価は明らかに高い。また,国内価格に至ってはブランドにもよるが前者が12万1000〜14万円程度,後者が17万3000〜19万円程度だ。ベンチマークテストで明らかになったとおり,RXT 2080 TiとRTX 2080の性能は「置き換え対象に対してそれぞれおおむね3〜4割増し,一部のメモリバス帯域幅が“効く”タイトルでそれ以上を期待できる」というレベルなので,少なくとも現時点の性能と機能が国内価格設定に対して完全に見合ったものだとは言いがたい。
とはいえ,疑いなく世界最速であり,真の意味で4K解像度に対応できたと言えるRTX 2080 Tiに惹かれるものがないと言うと嘘になるのも正直なところだ。4K環境での現実的なフレームレートや,グラフィックス設定プリセットを高めたFPSおよびTPSで叩き出せる高フレームレートにグっときた読者も多いだろう。
その意味でRTX 2080 Tiは,とにかく4K環境でAAAタイトルをプレイしたいとか,垂直リフレッシュレート144Hzや240Hzといったゲーマー向け液晶ディスプレイのポテンシャルを使い切りたい人にとっては価値があり,27日に予定されている搭載カードの発売日を待つ意義は十分にあるはずだ。
一方,9月20日0:01に販売解禁となるRTX 2080のほうは,現時点だとやや微妙な立ち位置ということになりそうである。場合によっては,すでに一部で処分価格になっているGeForce GTX 10シリーズの上位モデルを選んだほうが幸せになれるかもしれない。
RTX 2080に価値を見出すためには,年内に出てくる予定になっているリアルタイムレイトレーシングおよびDLSS対応タイトルの登場を待つ必要があるのではなかろうか。
NVIDIAのGeForce RTX 20シリーズ製品情報ページ
- 関連タイトル:
GeForce RTX 20,GeForce GTX 16
- この記事のURL: