オススメ機能
Twitter
お気に入り
記事履歴
ランキング
4Gamer.net
お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
「GeForce RTX 2080 Ti」「GeForce RTX 2080」レビュー。レイトレ&AI対応の新世代GPUは「世界最速」以上の価値を提供できるか
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2018/09/19 22:00

レビュー

レイトレ&AI対応の新世代GPUは「世界最速」以上の価値を提供できるか

GeForce RTX 2080 Ti
(GeForce RTX 2080 Ti Founders Edition)
GeForce RTX 2080
(GeForce RTX 2080 Founders Edition)

Text by 宮崎真一


 2018年9月19日22:00,GeForce RTX 20シリーズのレビューが解禁となった。
 「Turing」(テューリング)アーキテクチャを採用する新世代GPUは,3Dグラフィックスなどを処理するためのシェーダプロセッサ「CUDA Core」とは別に,リアルタイムレイトレーシング用の「RT Core」,AI推論エンジンアクセラレータとしての「Tensor Core」を搭載するというのが最大の特徴だが,ゲーマーが最も注目しているのは間違いなく,既存のゲームがGeForce RTX 20シリーズでどれだけ速くなるかだろう。

 今回4GamerではNVIDIAから,「GeForce RTX 2080 Ti」(以下,RTX 2080 Ti)と「GeForce RTX 2080」(以下,RTX 2080)のそれぞれ「Founders Edition」を入手することができたので,GPUの特徴を押さえつつ,そのゲーム性能をチェックしてみたい。

RTX 2080 Ti Founders Edition
GeForce RTX 20
RTX 2080 Founders Edition
GeForce RTX 20


「GPU Boost 4.0」と「Scanner」を利用できるGeForce RTX 20シリーズ


 GeForce RTX 20シリーズのアーキテクチャについては西川善司氏による連載記事が詳しいが,本稿でも要点のみ確認しておこう。
 本シリーズは,TSMC(Taiwan Semiconductor Manufacturing)がNVIDIA専用に用意する12nm FinFETプロセス技術「12nm FFN」(FFN:FinFET NVIDIA custom)を利用して製造されるGPUだ。RTX 2080 Tiは「TU102」,RTX 2080は「TU104」という名のコアを採用している。

GeForce RTX 20
RTX 2080 Ti。パッケージ上の刻印は「TU102-300A-K1-A1」だった。あくまで参考だが,デジタルノギスで計測したサイズは短辺が24.85mm,長辺が31.11mm
GeForce RTX 20
RTX 2080。こちらは「TU104-400A-A1」だ。やはり参考で,実際にはもう少し小さくなるはずだが,デジタルノギスで計測したサイズは短辺22.86mm,長辺24.77mmとなる

 GPUコアが異なるため,ここからは順に見ていこうと思うが,まずTU102のダイサイズは754mm2で,これはPascal世代の「GeForce GTX 1080 Ti」(以下,GTX 1080 Ti)が採用する「GP102」コアの471mm2比で約1.6倍という規模だ。

CUDA SDKに付属する「devicequerydrv.exe」を実行してスペックを確認したところ。L2キャッシュ容量は6MBだと確認できた
GeForce RTX 20

 TU102のフルスペックだと,CPUにおける「CPUコア」的な存在となる「Graphics Processor Cluster」(以下,GPC)数は6基。GPCを構成する演算ユニット「Streaming Multiprocessor」(以下,SM)数はGPCあたり12基で,SMには64基のCUDA CoreとWarpスケジューラ,命令発効ユニット,それにロード/ストアユニット,L1キャッシュ,テクスチャユニット,そしてレイトレーシングにおける光線の生成と衝突判定を行うRT Coreを1基と,行列同士の積和算に特化したTensor Coreを8基統合する仕様だ。
 また,2基のSMでジオメトリエンジン「PolyMorph Engine」を共有するという,Volta世代の「GV100」やPascal世代の「GP100」と同じ仕様なので,「Texture/Processor Cluster」(以下,TPC)数はSM数比で半分の36基となる。「GP104」コアを採用する「GeForce GTX 1080」だとSMごとにPolyMorph Engineを組み合わせてあるため,「SM数とTPC数は同じもの」という理解でよく,筆者の過去記事でもよくその前提に立っていたが,TU102は「そうではない」ので,その点は押さえておきたい。

 さて,RTX 2080 Tiでは6基あるGPCのどれかで合計4基のSMが無効になっている。GTX 1080 Tiは「6基あるGPCのうち2基でSMの数を少なくする」仕様だったので,おそらくそれと同じようなパターンのはずだが,いずれにせよRTX 1080 TiではSM数が68基,TPC数が34基,CUDA Core数が4352基,RT Core数が68基,Tensor Core数が544基となる。GTX 1080 TiだとCUDA Core数は3584基なので,CUDA Core数ベースの規模感だと2割増しという計算だ。

RTX 2080 Tiのブロック図。暗くしてある部分が「SMを削っている」イメージで,4Gamerによる推測となる
GeForce RTX 20

 GPUコアクロックはベース1350MHz,ブースト1545MHz。GTX 1080 Tiだと順に1480MHz,1582MHzだったので若干抑え気味だ。ただしFounders Editionはブーストクロックが1635MHzに設定されており,NVIDIAから全世界のレビュワー向けに配布されたEVGA製オーバークロックツール「Precision X1」(Version 0.1.9.0)でテスト中の動作クロックを追ってみたところ,最大クロックは1935MHzに達していた。Turing世代でも高クロック動作は健在と言っていいだろう。

RTX 2080 Ti Founders Editionの動作クロックを追ったところ,1935MHzにまで達するのを確認できた
GeForce RTX 20

 組み合わせるグラフィックスメモリとしてはGDDR6を初採用。GDDR6とは何かという話は大原雄介氏の解説記事を参照してもらえればと思うが,RTX 2080 Tiではメモリクロック14GHz相当(実クロック1.75GHz)の8Gbit品を11枚搭載することで総容量11GBを実現している。
 RTX 2080 Ti側ではメモリコントローラを11基搭載し,全体のメモリインタフェースは352bit幅となるので,メモリバス帯域幅は616GB/sだ。これはGTX 1080 Tiの484GB/sと比べて約38%広い。

 続いてはTU104コアを採用するRTX 2080だが,こちらのダイサイズは545mm2。GTX 1080のGP104コアだと314mm2なので,約1.74倍の規模になる。

RTX 2080に対するdevicequerydrv.exeの実行結果。こちらだとL2キャッシュ容量が4MBだと確認できる
GeForce RTX 20

 TU104もGPCの数はTU102と同じく6基なのだが,TU102だとGPCあたりのSM数が12基なのに対し,TU104では8基となる。SM(やTPC)の構成はTU102と変わらないため,TU104のフルスペックだと総CUDA Core数は3072基,RT Core数は48基,Tensor Core数は384基だ。
 ただしRTX 2080の場合はどこかのGPCでSMが2基(=TPCが1基)無効になっているため,SM数は46基,総CUDA Core数は2944基となる。RT Core数はSM数と同じ46基で,Tensor Core数は368基である。

RTX 2080のブロック図。こちらも,暗くしてある部分が「SMを削っている」イメージで,4Gamerによる推測だ
GeForce RTX 20

 RTX 2080のGPUクロックはベース1515MHz,ブースト1710MHzで,GTX 1080の同1607MHz,1733MHzと比べると若干低いが,Founders Editionだとブーストクロックが1800MHzとなり,GTX 1080のリファレンスクロックを逆転する。
 また,先ほどと同じようにPrecision X1で動作クロックを追ってみると,GPUコアクロックが1950MHzまで上がることを確認できた。

RTX 2080 Founders Editionの動作クロックを追った結果。1950MHzまで上昇していた
GeForce RTX 20

 採用するグラフィックスメモリはRTX 2080 Tiと同じくGDDR6で,メモリクロックも同じ14GHz相当だが,RTX 2080の場合は32bit幅のメモリコントローラを8基搭載する仕様なので,メモリインタフェースは合計256bitとなって,メモリバス帯域幅は448GB/sとなる。グラフィックスメモリの総容量は8GBだ。

 ここまで紹介してきたスペックをまとめたものが表1となるので,参考にしてもらえればと思う。


 ところで,動作クロックに関しては,GeForce RTX 20シリーズで追加になった要素が2つあることに触れなければならない。
 1つは「GPU Boost 4.0」だ。Pascal世代の「GPU Boost 3.0」から整数値が1つ上がった新しいGPU Boostでは,温度制御周りに手が入ったのがトピックとなる。
 Pascal世代のGPU Boost 3.0では,「Power Target」(電力目標,以下日本語表記)と「Temperature Target」(温度目標,以下日本語表記)がブーストクロックを制御していた。GPUの消費電力が電力目標に達せず,GPUの温度が温度目標に達しなければ,GPUコアクロックはブーストクロックを大きく超えるところまで伸び,典型的な負荷状況ではブーストクロックに近い動作クロックとなり,GPU温度が温度目標に達した場合はベースクロックでの動作となる。付け加えると,このアルゴリズムは公開されていなかった。

GPU Boost 3.0の仕組み
GeForce RTX 20

 それに対してGPU Boost 4.0では,温度目標より高い温度を「Second Temperature Target」(第2温度目標,以下日本語表記)として設定するという改良も入っている。前述のとおり,GPU Boost 3.0ではGPUコア温度が温度目標に達するとGPUクロックはベースにまで落ちるのだが,GPU Boost 4.0では,温度目標と,ハードウェアの上限温度との間に第2温度目標を設定することで,「温度目標に達しても,第2温度目標へ達するまでは一定レベルのブーストクロックを維持する」ようになったのである。当然,これは高負荷時により高い性能を狙うのに役立つ。
 また,GPUの冷却をユーザーが強化することができれば,GPU Boost 4.0をチューニングすることで従来のGPU Boost 3.0以上に性能の引き上げを図ることもできるという。

GPU Boost 4.0の仕組み
GeForce RTX 20

 また,第2温度目標周りのアルゴリズムは公開されており,実際,Turing世代のオーバークロックツールではこの第2温度目標をGPUコアクロックとセットで設定可能だ。たとえばPrecision X1はそれを「Temp Tuner」という名前で実装している。

Precision X1のTemp Tuner。RTX 2080 Founders Editionの場合,温度目標である84℃とハードウェアレベルの上限温度である89℃の間で,第2温度目標とその動作クロックを自由に設定できるようになっていた
GeForce RTX 20

 もう1つの新要素は「NVIDIA Scanner」(以下,Scanner)なのだが,これの使い方が実のところよく分からない。Precision X1でScannerは「VF Curve Tuner」という名前になっているのだが,[SCAN]ボタンを押すと,Scannerはテスト用の専用スレッドを立ち上げて,コア電圧700mV付近,800mV付近,900mV付近,1000mV付近のそれぞれにおいて動作クロックを順に高めていき,安全に動作する限界を自動的に探し出すという動きを見せる。設定後に,途中の電圧を補間してくれる仕掛けなのも確認できた。

Precison X1から[SCAN]ボタンを押し,RTX 2080 Ti Founders Edition(左)とRTX 2080 Founders Edition(右)のそれぞれでScannerを実行している様子。それぞ緑色の点線が持ち上がっている部分があるが,これはScannerがテストしているところを示す
GeForce RTX 20 GeForce RTX 20

 終了までには20分近く要し,最終的に,ブーストクロックを若干引き上げてくれる。なのでScannerは「自動オーバークロック機能」と紹介すべきなのかもしれないが,VF Curve Tunerのメニューには別途電力目標値などもあるので,これを併用する前提という可能性も(大いに)あるだろう。
 とにかく時間がなく,今回は[SCAN]ボタンを押すことしかできていないため,これについては後日あらためてもう少し突っ込んだテスト結果をお届けできればと考えている。

Scanner実行完了後。初期設定である青い実線に対し,Scannerが新たに設定した緑の点線ではRTX 2080 Ti Founders Editionで電圧がそこまで高くない状態のクロックが上がっている(左)。一方,RTX 2080 Founders Editionだと電圧が低い状態から高い状態までまんべんなく動作クロックが高くなっているのが分かる(右)
GeForce RTX 20 GeForce RTX 20

Scanner実行後,RTX 2080 TiとRTX 2080の最大動作クロックは順に1950MHz,2040MHzへ上がった。ひょっとすると電力目標の調整なども併用できるのかもしれないが,レビュワーズガイドにそこまでの情報はなかったのと,単純にスケジュールの都合で,そこまでは試していない
GeForce RTX 20 GeForce RTX 20


GPUクーラーや電源回路がPascal世代比で大きく変更となったFounders Edition


 続いて,RTX 2080 Ti Founders EditionとRTX 2080 Founders Editionのカードそのものを順に見ていきたい。


RTX 2080 Ti Founders Edition


GeForce RTX 20
 RTX 2080 Ti Founders Editionのカード長は実測で約267mm(※突起部除く)と,GTX 1080 TiのFounders Editionとほぼ同じサイズだ。しかし,長らく外排気スタイルであり続けてきたGPUクーラーは,(一部が外部へ排気されるものの,基本的には)PCケース内へ排気するタイプへと変更になった。しかも,ファンは90mm角相当のものが2基だ。黒と銀を基調色としている点はPascal世代のFounders Editionと同じだが,もはやデザインはほぼ一新と言ってしまって構わないだろう。

カードを別の角度から。TX 1080やGTX 1080 Tiだとカード背面側のカバーは後方部が外れるようになっていて,SLI構成時のエアフローを改善できるようにしてあったりするのだが(※関連記事),RTX 2080 Ti Founders Editionの背面カバーは1枚板だ
GeForce RTX 20 GeForce RTX 20
GeForce RTX 20
排気は,整然と並んだフィンを抜け,カードの側面,マザーボードに差したときの垂直方向上下へ抜ける仕様なのが分かる
GeForce RTX 20
ファンは13枚羽仕様。NVIDIAによると,最新世代のファンでは冷却性能と静音性が向上しているという

 補助電源はリファレンスどおり8ピン×2。金属製のベースプレートが端子を覆うようになっており,端子周辺の強度を増そうとしているのが分かる。
 NVLinkベースのSLIインタフェースはプラスチック製のカバーで覆われた場所にあった。サイズは大きくなったが,配置は従来のSLIインタフェースと同じ場所だ。

GeForce RTX 20
補助電源コネクタは8ピン×2構成
GeForce RTX 20
こちらがNVLinkインタフェース

DisplayPortは1.4aとなり,不可逆圧縮伝送方式「DSC」を利用すればケーブル1本で8K 60Hz出力を行える。2本使えば劣化なしの8K 60Hz出力も可能だ。5系統出力のうち,同時に利用できるのは4系統までとなる
GeForce RTX 20
 外部出力インタフェースはDisplayPort 1.4a×3,HDMI 2.0b(Type A)×1,USB 3.1 Gen.2 Type-C×1という構成。GPUコアに統合されたUSBコントローラはDisplayPort Alternativeモードに対応しており,基本的には2018年7月に発表されたVRヘッドマウントディスプレイ接続規格「VirtualLink」用だが,USB Type-C接続型ディスプレイなど,汎用のUSBデバイスも接続できるとされている。筆者の手元にType-Cデバイスが何もないので確認できていない点はご容赦を。

Vapor Chamberベースの放熱ユニットが基板全体を覆っている
GeForce RTX 20
 今回,カードの到着がレビュー解禁ギリギリのタイミングで,分解撮影する時間が取れなかったため,やむなくNVIDIA公式の画像を使うことにするが,側面から内部を覗き込んだときに見える大きな放熱フィン部は基板全体をほぼ覆うもので,底面部には「Vapor Chamber」(ヴェイパーチャンバー)を採用することで熱移動の効率を高めているとのことだ。
 ちなみに,このVapor Chamber付き放熱フィン部は周囲から金属製のベースプレートで囲むことにより,カード全体の強度を高めてあるのだが,金属製ベースプレートは電源回路やGDDR6メモリチップと(おそらく熱伝導シートを介して)接しており,これらのヒートシンクとしても機能するようになっているという。

 基板はGPUを電源ユニットが囲むという大がかりな仕様になっているが,NVIDIAいわく,RTX 2080 Ti Founders Editionの電源部は13フェーズ構成の「iMON DrMOS」を採用しているとのことだ。
 iMON DrMOSは,ミリ秒以下の電流監視と制御を可能としており,電力のヘッドルームが増大し,オーバークロック動作の安定性も向上するという。また,iMON DrMOSでは負荷状況に合わせてフェーズ数を動的に切り換えられるようになっているため,アイドル時など,低負荷時の電力損失を抑えることもできるそうだ。
 なお,13フェーズはあくまでもGPUとメモリコントローラ用。基板上には14GHzで動作するGDDR6用の電源フェーズ用コンポーネントも3組載っている。

NVIDIAが用意したRTX 2080 Ti Founders Editionの基板写真。13+3フェーズという大規模な電源回路を実現するため,電源部はGPUの左右に分かれた実装となっている
GeForce RTX 20

 表1の繰り返しとなるが,動作クロックはベース1350MHz,ブースト1635MHz。メモリクロックは14GHz相当だ。ブーストクロックが高い分,TDP(Thermal Design Power,熱設計消費電力)はリファレンスの250Wから10W高い260Wとなっている。

NVIDIAコントロールパネルから「システム情報」を開いたところ。ブーストクロックを示すグラフィックスクロックは1635MHzと表示されている
GeForce RTX 20 GeForce RTX 20


RTX 2080 Founders Edition


GeForce RTX 20
 続いてRTX 2080 Founders Editionだが,その外観はRTX 2080 Ti Founders Editionとほぼ区別が付かない。GPUクーラー上の型番表示に「Ti」がないことと,補助電源コネクタの仕様が8ピン+6ピンであること以外に,外観上の違いはまったくない。もちろんカード長は実測約267mm(※突起部除く)だ。90mm角相当のファンを2基搭載した,PCケース内排気のクーラーを搭載する点も上位モデルと共通である。

RTX 2080 Founders EditionのGPUクーラー側(左)とその背面側(右)。型番表記がなければRTX 2080 Ti Founders Editionとまず見分けが付かない
GeForce RTX 20 GeForce RTX 20
GeForce RTX 20
補助電源コネクタは8ピン+6ピン。6ピン端子は「8ピン端子から2ピン潰してある」という,面白いものになっていた
GeForce RTX 20
5系統の外部出力インタフェースは配置も含めてRTX 2080 Ti Founders Editionと完全に同じだった
カバー付きのNVLinkインタフェースを搭載するのもRTX 2080 Ti Founders Editionと同じ。ただしNVLinkはRTX 2080 Tiが2リンク(双方向帯域幅100GB/s)なのに対しRTX 2080では1リンク(双方向帯域幅50GB/s)となる
GeForce RTX 20 GeForce RTX 20

 NVIDIAはRTX 2080 Founders Editionが搭載するGPUクーラーについて追加情報を開示しているのだが,それによると,RTX 2080 Founders Editionが搭載するクーラーは,GTX 1080 Founders Editionが搭載するものと比べて動作音が定格動作時に約2倍,オーバークロック設定時には約5倍静かだそうだ。また,最も静かな動作時であってもGPUコア温度は75℃以下に保てるレベルだという。

NVIDIAが示している,RTX 2080 Founders EditionとGTX 1080 Founders EditionのGPUクーラー性能比較グラフ
GeForce RTX 20

RTX 2080 Founders Editionの放熱ユニット部
GeForce RTX 20
 こちらも時間の都合で分解まで行えていないため,やはりNVIDIAの公式画像を使うことになるが,Vapor Chamberベースの大型放熱ユニットが基板電材を覆い,それを金属製のベースプレートで囲むデザインは上位モデルと同じだ。
 ただし,基板デザインはさすがに異なり,iMOS DrMOSを採用した電源部はGPU用が8+2フェーズ,メモリチップ用が3フェーズと,RTX 2080 Ti Founders Editionと比べて規模が若干小さくなった。もっとも,GTX 1080 Founders Editionは5+1フェーズだったので,それと比べると大幅な強化を実現している。

NVIDIA公式のRTX 2080 Founders Edition基板写真。RTX 2080 Ti Founders Editionと比べるとさすがにすっきりしたが,それでもGPUを挟むような電源フェーズ構成は健在だ
GeForce RTX 20
背面カバーだけ取り外してみた。背面カバーは補強用だけでなく冷却用でもあることが分かる。基板上にある型番表記は「PG180」だった
GeForce RTX 20 GeForce RTX 20

 動作クロックはベース1515MHz,ブースト1800MHz。ブーストクロックがリファレンス比で90MHz高いこともあって,TDPはリファレンスの215Wより10W高い225Wという設定になっている。

RTX 2080 Founders Editionを差した状態でNVIDIAコントロールパネルから「システム情報」を開いたところ。ブーストクロックは1800MHzとなっている
GeForce RTX 20 GeForce RTX 20


テストに用いたドライバはレビュワー向けの「411.51」。レイトレーシングやDLSSのテストも実施


 前置きが長くなってしまったが,テスト環境のセットアップに入ろう。
 今回,2製品の比較にはGTX 1080 Ti Founders EditionとGTX 1080 Founders Editionを用意した。つまり,RTX 2080 TiとRTX 2080が,置き換え対象となっているGeForce GTX 10シリーズに対してどの程度の性能を実現できるかを確認しようというわけである。
 また,テストにあたっては,あくまでも参考ながら,[SCAN]ボタンを押してブーストクロックが若干上がった状態を「RTX 2080 Ti SC」「RTX 2080 SC」として,テスト結果を併記することにした。

 テストに用いるグラフィックスドライバは,RTX 2080 TiとRTX 2080のテスト用としてNVIDIAから全世界のレビュワーに配布された「GeForce 411.51 Driver」だ。Windowsの「電源プラン」は「高パフォーマンス」を選択している。そのほかテスト環境は表2のとおりとなる。


 テスト方法は基本的に4Gamerのベンチマークレギュレーション22.0準拠。RTX 2080 TiとRTX 2080が4K環境を想定していること,一方でフルHDでの高リフレッシュレート環境における性能を気にする読者が多いであろうことから,3840×2160ドットと2560×1440ドット,1920×1080ドットの3パターンを選択した。

 さらに,RT CoreとTensor Core搭載の意義を簡単に確認すべく,リアルタイムレイトレーシングのほうではNVIDIAが用意したデモプログラム「Star Wars Reflections」のテストを実施する。また,Tensor Coreも用いた「DLSS」(Deep Learning Super Sampling)としては,「FINAL FANTASY XV WINDOWS EDITION」(以下,PC版FFXV)の公式ベンチマークソフト「FINAL FANTASY XV WINDOWS EDITION ベンチマーク」(以下,FFXVベンチ),そのDLSS対応版としてNVIDIAから配布されたリビジョン1216052を用いる。また,新しいプログラマブルシェーダ「メッシュシェーダ」(Mesh Shader)のテストではNVIDIA製のデモプログラム「Asteroids Demo」を用いることにした。
 これら追加テストをどのように実行したかという話は考察のところで併せて述べたい。


対Pascalではざっくり3〜4割程度の性能向上。4Kなど高解像度に強い


 以下,本文中,グラフ中とも「Founders Edition」表記を省略するとお断りしつつ,「3DMark」(Version 2.5.5029)からテスト結果を順に見ていこう。グラフ1は「Fire Strike」における総合スコアをまとめたものだ。

 RTX 2080 TiはGTX 1080 Tiに18〜30%程度のスコア差を付けた。Fire Strike“無印”でスコア差が約18%に縮まっているのはCPUが相対的なボトルネックとなっているためなので,それを除けば約3割のスコア向上と言える。
 一方のRTX 2080はRTX 2080 Ti比80〜87%のスコアを示した。「Fire Strike Extreme」以上のテスト条件で言えば約80%だ。GTX 1080 Tiに対しては3〜4%程度,GTX 1080に対しては17〜26%程度――Fire Strike“無印”を無視すれば25〜26%程度――高いスコアを示している。

 Scannerを利用してブーストクロックを引き上げたRTX 2080 Ti SC,RTX 2080 SCはそれぞれ定格動作時に対してスコアを最大2%伸ばした。これを「ほぼノーリスクで2%も!」と肯定的に捉えるか,「たった2%」と否定的に捉えるかは意見が分かれそうである。


 「Fire Strike“無印”で相対的なボトルネックが生じていた」という話の証拠となるのがグラフ2,総合スコアから「Graphics score」を抜き出したものだ。ここではCPUの影響を受けないため,RTX 2080 TiはGTX 1080 Tiに対して安定的に30〜34%程度,RTX 2080はGTX 1080に対してやはり安定的に26〜27%程度高いスコアを示している。RTX 2080 TiとRTX 2080のスコア差は26〜27%程度だ。
 Scannerの効果が最大で約2%なのは総合スコアと変わらない。


 続いてグラフ3はソフトウェアベースの物理演算テスト結果を「CPU score」として抜き出したものだが,CPUを統一していることもあり,スコアはほぼ横一線に並んでいる。
 厳密に言えば,RTX 2080 SCだけFire Strike“無印”でスコアを若干落としているが,この理由は分からない。Scannerに絡んで何かしらCPUの処理が発生したのかもしれないが,なんとも言えないところだ。


 グラフ4はGPUとCPU両方の性能が効いてくる「Combined test」の結果をまとめたものだが,ここではFire Strike“無印”で相対的なCPUボトルネックによってスコアが頭打ちになってしまっている。そこでFire Strike Extreme以上を見ていくことになるが,ここでは総合スコアやGraphics scoreよりもTuring世代とPascal世代でスコア差が開く結果となった。
 RTX 2080 TiはGTX 1080 Tiに対して28〜37%程度,RTX 2080はGTX 1080に対して31〜38%程度高いスコアだった。RTX 2080 TiとRTX 2080のスコア差も28〜34%程度と若干開き気味である。


 DirectX 12世代のテストである「Time Spy」だと,また違った結果が得られた。グラフ5は総合スコアをまとめたものだが,RTX 2080 TiとGTX 1080 Tiのスコア差は46〜48%程度,RTX 2080とGTX 1080のスコア差は41〜43%程度と,かなり大きくなっているのだ。
 西川善司氏が解説しているとおり,Turing世代のGPUではCUDA CoreレベルでFP32演算とINT32演算のオーバーラップ実行が可能になっているのだが,ひょっとするとその効果が大きく出ている可能性はある。あるいは,NVIDIAが何も言っていないだけで,DirectX 12(Direct3D)のAsynchronous Compute性能にTuring世代で最適化が入っている可能性もあるだろう。
 なお,Scannerの効果はここでも1〜2%程度だった。


 次にグラフ6はTime SpyのGPUテスト結果,グラフ7はCPUテストの結果をそれぞれまとめたものだ。
 GPUテスト結果は総合スコアよりさらに景気がよく,RTX 2080 TiはGTX 1080 Tiに対して61〜63%程度,RTX 2080はGTX 1080に対して51〜54%程度も高いスコアを示した。RTX 2080 TiとRTX 2080のスコア差は27〜31%程度となる。
 CPUテストは基本的にスコアが横並びだが,Fire Strikeと同様にRTX 2080 SCだけ若干低くなったのはやや気になる。


 では,実際のゲームだとどうか。グラフ8〜10は「Far Cry 5」のテスト結果となる。
 ここで注目したいのは,3840×2160ドット条件におけるRTX 2080 Tiのスコアだろう。前述のとおり,NVIDIAはRTX 2080 Tiを「4K環境での利用を想定したGPU」と位置づけているわけだが,それを裏付けるかのように,今回テスト対象としたGPUでは唯一,最小フレームレートが60fpsを超えてきている。GTX 1080 Tiとのスコア差も解像度が高いほど大きく,平均フレームレートは3840×2160ドット条件で約48%高い。

 一方のRTX 2080は,1920×1080ドット条件だとCPUの相対的なボトルネックによってスコア差が縮まるものの,2560×1440ドット以上ではGTX 1080に対して31〜35%程度高いスコアを示し,GTX 1080 Tiに対しても約14%高いところに納まっている。
 Scannerの効果が最大約2%というのは3DMarkと変わらない。


 RTX 2080 TiとRTX 2080が良好な結果を残したのはグラフ11〜13の「Overwatch」でも同じだ。ゲームの仕様上,フレームレートの上限は300fpsとなり,それゆえに1920×1080ドット条件ではスコアが頭打ちになってしまうため,ここでは2560×1440ドット以上を見ていくが,RTX 2080 Tiでは3840×2160ドット条件でも平均144fps超,最小120fps超を叩き出しているというのは見事だ。G-SYNC HDR対応ディスプレイや(未発売だが)「Big Format Gaming Display」(BFGD)といった製品と組み合わせても十分なフレームレートを期待できるだろう。
 RTX 2080も平均および最小フレームレートの両方でGTX 1080 Tiを上回っており,世代の違いを実感できる結果となっている。


 グラフ14〜16の「PLAYERUNKNOWN'S BATTLEGROUNDS」(以下,PUBG)でもRTX 2080 Tiのスコアはなかなかインパクトの高いものになっている。
 最も注目したいのは,グラフィックス設定プリセット「高」の1920×1080ドットで平均250fps超,最小220fps超と,垂直リフレッシュレート240Hz対応ディスプレイにほぼ対応できるスコアを示したところだ。「PUBGで240fps表示できること」のメリットがあるか否かはまた別の議論ではあるものの,「ほぼ240fps表示できる」GPUが出てきたのは,垂直リフレッシュレート240Hz対応ディスプレイのユーザーにとって朗報と言えるのではなかろうか。

 平均フレームレートでスコア差を見てみると,RTX 2080 TiはGTX 1080 Tiに対して36〜43%程度,RTX 2080はGTX 1080に対して31〜38%程度高いスコアを示す。3840×2160ドットの最小フレームレートでGTX 1080が50.0fpsのところ,RTX 2080が65.0fpsと60fpsを超えてくる点にも注目しておきたい。


 「Fortnite」の結果がグラフ17〜19になるが,「エピック」プリセットを選択しているにもかかわらず,1920×1080ドット条件でRTX 2080 Tiは最小フレームレートが168fpsと,垂直リフレッシュレート144Hz級のディスプレイに完全対応できるレベルのスコアを叩き出している。RTX 2080も137.5fpsなので,ほぼ対応と言っていいだろう。このスコアはインパクトが大きい。
 平均フレームレートを比較すると,RTX 2080 TiはGTX 1080 Ti比で47〜48%程度,RTX 2080はGTX 1080 Ti比で14〜20%程度,GTX 1080比で43〜47%程度高いスコアを示しているので,3DMarkのTime Spyに近いスコア差が出ている計算になる。


 「Middle-earth: Shadow of War」(以下,Shadow of War)の結果がグラフ20〜22だ。
 平均フレームレートを比較すると,RTX 2080 TiはGTX 1080 Ti比で33〜58%程度,RTX 2080はGTX 1080 Ti比で15〜21%程度,GTX 1080比で37〜53%程度と,Fortnite以上に大きなスコア差が付いた。これは,GPU自体の性能差以上に,「Shadow of Warがグラフィックスメモリに対する負荷の高いタイトルである」ことの影響が出ていると言ってよさそうだ。要するに,GDDR6の広帯域幅による恩恵が大きいということである。


 グラフ23は「ファイナルファンタジーXIV: 紅蓮のリベレーター ベンチマーク」(以下,FFXIV紅蓮のリベレーター ベンチ)の総合スコアをまとめたものとなるが,ここではRTX 2080 Tiが3840×2160ドット条件でスコア1万を超えてきたことと,RTX 2080がベンチマークレギュレーションの合格ラインであるスコア8500を超えてきたことが目を惹く。
 スコア差は高解像度になるに従って広がっていくので,Shadow of Warと同様にグラフィックスメモリバス帯域幅がかなり“効いて”いるという理解でいいと思うが,実際,3840×2160ドット条件だと,RTX 2080 TiのスコアはGTX 1080 Tiより約41%,RTX 2080のスコアはGTX 1080 Tiより約9%,GTX 1080より約37%高い。


 そんなFFXIV紅蓮のリベレーター ベンチにおける平均フレームレートと最小フレームレートをまとめたものがグラフ24〜26だが,3840×2160ドット条件のRTX 2080 Tiは「4K環境向けGPU」らしいスコアを示していると言ってよさそうだ。
 ここでちょっと気になったのは,1920×1080ドット条件におけるRTX 2080 TiとRTX 2080の最小フレームレートがPascal世代のGPUと比べて低いこと。1920×1080ドット条件の最小フレームレートはCPUの性能依存が強いため,RTX 2080 TiとRTX 2080ではドライバの最適化不足や何らかのバグの影響を受けている可能性がある。


 グラフ27〜29は「Project CARS 2」の結果だが,平均フレームレートを比較すると,RTX 2080 TiがRTX 2080に対して5〜25%程度,GTX 1080 Tiに対して11〜32%,RTX 2080がGTX 1080 Tiに対して6〜8%程度,GTX 1080に対して19〜31%程度高いスコアになっている。1920×1080ドット条件ではスコアが丸まる傾向を見せるが,2560×1440ドット以上では順当に開いていくとのいうのは,ここまで何度も見られたものである。



リアルタイムレイトレーシングやDLSSは「ゲーム側が対応すれば」大きな効果を期待できそう


Star Wars Reflectionsデモより
GeForce RTX 20
 続いては,Turingの新要素周りのテストに移ろう。
 まずは,リアルタイムレイトレーシングだが,ここで用いるStar Wars Reflectionsデモは,その名のとおり映画「Star Wars」(スター・ウォーズ)を題材にしたものだ。シルバーの装甲に身を包んだ,キャプテン・ファズマと思しき人物がいるエレベータに,2人のストームトルーパーが乗り込んでくるという50秒ほどのシーンを描くものだ。

 GDC 2018でデビューしたこのデモはこれまで何度も披露されてきたので,見たことのある読者も多いだろう。床や装甲などを描写するのにリアルタイムレイトレーシングを用いている。


 Star Wars ReflectionsはUnreal Engine 4ベースで,グラフィックスAPIにDirectX 12(Direct3D 12)を採用しているため,今回はGPUOpenのフレームレート計測ツール「OCAT」(Version 1.1.0)で50秒間の平均フレームレートを取得することにした。テスト解像度は3840×2160ドットと2560×1440ドットの2パターンで,いずれも2回計測して平均をスコアとして採用する。
 ただし,OCATでは最小フレームレートを測定する術がないため,代わりに「1 percentile」(以下,1パーセンタイル)を指標として用いることにしている。1パーセンタイルというのは,「得られたフレームレートを大きいほうから並べたとき,1%の位置にあるフレームレート」という意味で,厳密な最小フレームレートではないものの,それに近い値として利用できるからだ。

 その結果がグラフ30,31だ。3820×2160ドットではグラフィックスメモリ容量8GBのRTX 2080とGTX 1080でエラーが発生してデモが動作しなかったため,今回は2560×1440ドット条件のスコアを見ていくと,RT Coreを持たないPascal世代のGPUでフレームレートが1桁に留まる中,RTX 2080は平均44.9fps,RTX 2080 Tiは平均58.7fpsを示した。もちろんこれがあくまでもNVIDIA製のデモであって,実ゲームのベンチマークではないことは十分に注意すべきだが,少なくともStar Wars Reflectionsデモにおいて,リアルタイムレイトレーシングにおけるRT Coreの存在感は極めて大きい。


 続いてDLSSのテスト用となる特別版FFXVベンチだが,この特別版は解像度が3840×2160ドット,グラフィックス設定プリセットが「カスタム」にそれぞれ固定されていた。そして,「DLSSバッチファイル」と「TAAバッチファイル」のそれぞれを実行することで,DLSSとTAA(Temporal Anti-Aliasing,テンポラルアンチエイリアシング)それぞれの環境でベンチマークを行えるようになっていた。
 そこで今回は,DLSSとTAAのそれぞれにおいて,総合スコアを取得するだけでなく,「Fraps」で平均フレームレートと最小フレームレートも記録することにした。テストは条件ごとに2回ずつ行い,それぞれ平均をスコアとして採用している。

 総合スコアはグラフ32,平均フレームレートと最小フレームレートはグラフ33にまとめたが,RTX 2080 TiとRTX 2080ではいずれもDLSS有効時のスコアがTAA有効時のそれを圧倒した。具体的には,総合スコアだとDLSS有効時のスコアがTAA有効時を35〜37%程度上回った。
 最小フレームレートに着目すると,グラフィックスメモリ容量が相対的に少ないRTX 2080でDLSS有効化の効果が大きいことも見てとれよう。アンチエイリアシングをポストプロセスで処理することの恩恵は,メモリ周りのスペックがより低いGPUでこそ活きるということなのだろう。

 また,DLSSを利用できないPascal世代のGPUと比較した場合,DLSS利用時のRTX 2080 TiはTAA利用時のGTX 1080 Tiに対して約94%,DLSS利用時のRTX 2080はTAA利用時のGTX 1080に対して約88%高いスコアなので,完全に圧倒している状態だ。


 気になるDLSSの品質についても確認しておきたい。下に示すスクリーンショットは,DLSSもしくはTAAを適用した状態でベンチマークの1シーンを切り出したものだ。
 チョコボで移動するシーンでは風景が流れていくが,DLSS有効時のほうが若干,アンチエイリアシングの効きは強い印象を受ける。ただ,葉の精細感は落ちているので,一長一短か。一方,釣りのシーンでは,主人公であるノクトの顔に注目すると,TAAでは乱れる表示がDLSSでは整っている。

チョコボに乗った移動シーン(※)。完全に同じフレームでの比較は行えないので,似通った場面での比較になるが,チョコボのたてがみはDLSSのほうが自然に見える。ただし,葉の繊細さはTAAが上で,DLSSでは明らかにボケている(※上下段ともサムネイルは一部をトリミングのうえ2倍に拡大しています。また,画像をクリックすると解像度3840×2140ドットの全体を表示します)
GeForce RTX 20 GeForce RTX 20
GeForce RTX 20 GeForce RTX 20
キャラクターの顔をクローズアップすると違いは一目瞭然だ(※サムネイルは一部をトリミングのうえ2倍に拡大しています。また,画像をクリックすると解像度3840×2140ドットの全体を表示します)
GeForce RTX 20 GeForce RTX 20

 繰り返すが,この特別版FFXVベンチもNVIDIA提供のものだ。最終的にFFXVのゲーム本編で今回と同じDLSSの効果が得られる保証はない。しかし,仮に得られるのであれば,DLSSはかなり有効なポストプロセスだと言っていいのではなかろうか。

こちらはGTX 1080 Ti搭載環境でAsteroids Demoを実行しようとしたところ。メッシュシェーダがない旨のエラーメッセージが出て,実行できない
GeForce RTX 20
 最後にメッシュシェーダについても確認しておこう。
 メッシュシェーダのテストには,これまたNVIDIAが用意した「Asteroids Demo」を利用する。このAsteroids Demoは,小惑星帯を宇宙船が飛行するだけのデモだが,総数30万〜40万個の小惑星を描画するのにメッシュシェーダ(と,それを制御するタスクシェーダ(Task Shader))を活用することで実描画数を抑えている。グラフィックスAPIにはDirectX 12を用いており,メッシュシェーダを持たないGTX 1080 TiやGTX 1080では実行できない。


GeForce RTX 20
Asteroids Demoを実行している様子
GeForce RTX 20
LoDレベルを色分けして分かりやすくしたもの
 グラフ34〜36は,このデモを1分間実行している最中のフレームレートをOCATで測定したときの結果だ。テストは3840×2160ドットと2560×1440ドット,1920×1080ドットの3パターンごとに2回ずつ行い,平均をスコアとして採用している。
 RTX 2080 TiとRTX 2080を比較すると,平均フレームレートの違いは26〜33%程度。かなりの数の小惑星を描画しているにも関わらず,RTX 2080 Tiは平均40fps台を維持できている。

 なお,RTX 2080 Ti SCやRTX 2080 SCのスコアを見る限り,Scannerの恩恵はあまりなさそうだ。



Pascal世代から消費電力は確実に増大。GPUクーラーの冷却性能と静音性は高い


 さて,RTX 2080 TiのTDPは250WとGTX 1080 Tiから変わっていないものの,補助電源コネクタは8ピン×2へと変更され,電力供給量は増加している。また,RTX 2080にいたっては215Wと,GTX 1080から35Wも増えている。付け加えるなら,今回入手したFounders Editionでは定格プラス10Wだ。では実際のところ,RTX 2080 TiとRTX 2080の消費電力はどの程度なのだろうか。

 「4Gamer GPU Power Checker」(Version 1.1)を用いて,FFXIV紅蓮のリベレーター ベンチ実行時におけるカード単体の消費電力推移をまとめたものがグラフ37となる。

 下のグラフ画像はクリックすると横に引き伸ばしたものを表示するようにしてあるので,ぜひそちらも合わせてチェックしてもらえればと思うが,ここではRTX 2080 Ti SCで何度か400W超級の消費電力値を示しているのを確認できる。RTX 2080 Tiもそこまでではないが,350Wを超える局面が多く,消費電力は相当に大きいと言っていいだろう。
 RTX 2080も300Wに達する局面が頻発しており,GTX 1080と比べると消費電力が増大しているのは明らかだ。

※グラフ画像をクリックすると横に引き伸ばした拡大版を表示します
GeForce RTX 20

 グラフ37におけるスコアの中央値をまとめたものがグラフ38である。RTX 2080 TiはGTX 1080 Ti比で約48W,RTX 2080に至ってはGTX 1080比で約70W上がってしまっている。
 ちょっと面白いのは,RTX 2080 Ti SCがRTX 2080比で約19Wも消費電力が上がってしまっているのに対し,RTX 2080 SCでは1Wに留まっている点だ。先に紹介したScannerの結果だとRTX 2080 SCのほうがクロックは上がっている印象だったのだが,RTX 2080 Ti SCでは中間の電圧における動作クロックの引き上げが大きかったため,その電圧付近で動作した結果として消費電力も増えてしまったということなのかもしれない。


 念のため,ログの取得が可能なワットチェッカー「Watts up? PRO」を用いてシステム全体の最大消費電力も計測することにした。
 テストにあたっては,Windowsの電源プランを「バランスに設定」。さらに,ゲーム用途を想定し,無操作時にもディスプレイ出力が無効化されないよう指定したうえで,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点をタイトルごとの実行時,OSの起動後30分放置した時点を「アイドル時」としている。その結果がグラフ39だ。

 ここでは,4Gamer GPU Power Checkerで計測したカード単体の消費電力ほどにはRTX 2080 TiとGTX 1080 Tiのスコア差が開いていないものの,それでもやはりTuring世代で消費電力が確実に増大していることは見てとれる。また,ゲーム実行時におけるRTX 2080の消費電力は,こちらだとGTX 1080 Tiより低いものの,GTX 1080と比べると35〜69W高くなった。Scanner利用によるオーバークロックの影響はプラス10W以内といったところか。

GeForce RTX 20

 最後に,「GPU-Z」(Version 2.11.0)を用いて計測したGPU温度も確認しておきたい。
 ここでは,温度約24℃の室内で,テストシステムをPCケースに組み込まず,いわゆるバラックに置いた状態から,3DMarkの30分間連続実行時を「高負荷時」として,アイドル時ともども,GPU-Zから温度を取得することにした。
 その結果はグラフ40のとおり。RTX 2080 TiとRTX 2080の高負荷時における80℃を割り,GTX 1080 TiやGTX 1080よりも低い。Turing世代のFounders EditionではGPU温度をPascal世代よりも低く抑えようとしているようだ。
 一方でアイドル時の温度は40℃前後とPascal世代のFounders Editionより高い。このあたりは静音性に配慮したファン設定になっているようだ。


 気になるRTX 2080 TiとRTX 2080両Founders Editionの動作音だが,筆者の主観であることを断ったうえで述べると,十分静かな印象を受けた。少なくとも,GTX 1080 TiやGTX 1080のFounders Editionより静かなのは確かだ。NVIDIAが「5倍静か」と言うのもあながち間違いではなさそうな印象がある。


新要素にどれだけの価値を見出せるか。RTX 2080 Tiは「世界最速」に魅力を感じるならアリ


RTX 2080 Ti Founders Edition(上)とRTX 2080 Founders Edition(下)のそれぞれ製品ボックス。見た目はほぼ同じだ
GeForce RTX 20
GeForce RTX 20
 以上,Turing世代の幕開けを告げる上位2モデル,RTX 2080 TiとRTX 2080のテストを行ってきた。
 テストを終えてはっきりしてきた課題は2つで,1つは,NVIDIAが声高にアピールするリアルタイムレイトレーシングやDLSSを利用するには,ゲーム側の対応が不可欠だということだ。NVIDIAはリリースと同時に複数のタイトルで両機能を利用できるとしていたが,少なくともレビュワーがテストできたタイミングで「実ゲームタイトル」は1本もない。
 RT CoreやTensor Coreがバリバリ活躍してこそのTuringアーキテクチャだが,真価を日常的に発揮できるようになるまでは,相応の時間がかかるのではないだろうか。

 もう1つは,そうした「これから重要になるとNVIDIAが考えている機能」を実装したことで,価格がPascal世代を圧倒してしまっていることである。
 Pascal世代を振り返ってみると,GTX 1080とGTX 1080 Tiをそれぞれ搭載するグラフィックスカードの北米市場でのメーカー想定売価は発売時点でいずれも699ドル(税別)だった(※GTX 1080のリリースから約10か月後にGTX 1080 Tiが発表になったとき,GTX 1080は価格改定が入った)。

 それに比べると,RTX 2080が699ドル(税別)なのはともかく,RTX 2080 Tiの999ドル(税別)という搭載グラフィックスカードのメーカー想定売価は明らかに高い。また,国内価格に至ってはブランドにもよるが前者が12万1000〜14万円程度,後者が17万3000〜19万円程度だ。ベンチマークテストで明らかになったとおり,RXT 2080 TiとRTX 2080の性能は「置き換え対象に対してそれぞれおおむね3〜4割増し,一部のメモリバス帯域幅が“効く”タイトルでそれ以上を期待できる」というレベルなので,少なくとも現時点の性能と機能が国内価格設定に対して完全に見合ったものだとは言いがたい。

 とはいえ,疑いなく世界最速であり,真の意味で4K解像度に対応できたと言えるRTX 2080 Tiに惹かれるものがないと言うと嘘になるのも正直なところだ。4K環境での現実的なフレームレートや,グラフィックス設定プリセットを高めたFPSおよびTPSで叩き出せる高フレームレートにグっときた読者も多いだろう。
 その意味でRTX 2080 Tiは,とにかく4K環境でAAAタイトルをプレイしたいとか,垂直リフレッシュレート144Hzや240Hzといったゲーマー向け液晶ディスプレイのポテンシャルを使い切りたい人にとっては価値があり,27日に予定されている搭載カードの発売日を待つ意義は十分にあるはずだ。

GeForce RTX 20

 一方,9月20日0:01に販売解禁となるRTX 2080のほうは,現時点だとやや微妙な立ち位置ということになりそうである。場合によっては,すでに一部で処分価格になっているGeForce GTX 10シリーズの上位モデルを選んだほうが幸せになれるかもしれない。
 RTX 2080に価値を見出すためには,年内に出てくる予定になっているリアルタイムレイトレーシングおよびDLSS対応タイトルの登場を待つ必要があるのではなかろうか。

GeForce RTX 20

NVIDIAのGeForce RTX 20シリーズ製品情報ページ

  • 関連タイトル:

    GeForce RTX 20

  • この記事のURL:
トピックス
スペシャルコンテンツ
注目記事ランキング
集計:12月11日〜12月12日