レビュー
Ampere世代のハイエンドGPUはRTX 2080 Tiをあらゆる面で圧倒する
GeForce RTX 3080 Founders Edition
2020年9月16日22:00,NVIDIAの新世代GPU「GeForce RTX 3080」(以下,RTX 3080)搭載のNVIDIA製グラフィックスカード「GeForce RTX 3080 Founders Edition」(以下,RTX 3080 Founders Edition)の性能に関する情報が解禁となった。
既報のとおり,RTX 3080は,Ampereアーキテクチャを採用したGPUで,従来の「GeForce RTX 2080 SUPER」(以下,RTX 2080 SUPER)を置き換えるハイエンド向けモデルとなる。RTX 3080における大きなトピックとしては,搭載するリアルタイムレイトレーシング向け演算ユニット「RT Core」が第2世代に,AI推論エンジンアクセラレータとしての「TENSOR Core」が第3世代へとそれぞれ進化したことが挙げられる。
もちろん,NVIDIAが「4K解像度をターゲットとしている」と豪語したとおり,純粋なゲームグラフィックスの性能にも期待できる。
そんなRTX 3080では,実際にどの程度のパフォーマンスが得られて,従来製品からどれだけ性能向上を果たしたのか。NVIDIAからRTX 3080 Founders Editionを借用したので,さっそくテストにより明らかにしてみたい。
GPUコアにはAmpereアーキテクチャのGA102を採用
メモリにはGDDR6Xを搭載して広帯域幅を実現
RTX 30シリーズの詳細やAmpereアーキテクチャについては,西川善司氏の解説記事を参照してもらうとして,本稿ではおさらいとして,RTX 3080の特徴について簡単にまとめておきたい。
Ampereアーキテクチャでは,演算ユニットのクラスタである「Streaming Multiprocessor」(以下,SM)1基あたりに,シェーダプロセッサの「CUDA Core」が128基も搭載されている。Turingアーキテクチャでは,SM 1基あたりのCUDA Core数は64基だったので,倍増した計算だ。
GA102のフルスペックでは,そのSMを12基集めたミニGPUクラスタ「Graphics Processor Cluster」(以下,GPC)を計7基搭載する。そのため,フルスペック版GA102の場合,SM数は12×7の84基,CUDA Core数は128×84の1万752基という計算になる。しかしRTX 3080の場合,おそらく歩留まりの都合上からだと思うが,GPUのうち1基分と,さらに4基分のSMが無効化されている。つまり,RTX 3080のGPC数は6基で,SM数は68基,CUDA Core総数は計8704基となる。数だけなら,これはRTX 2080 Ti比でちょうど2倍にあたる。
RT Coreは,Ampereアーキテクチャでも1基のSMに対して1基分が用意されているので,RTX 3080全体では,計68基を搭載する計算だ。SM1基あたりの数こそRTX 2080 Tiと変わっていないが,RTX 3080ではRT Coreが第2世代となり,スループットは58 RT FLOPSとRTX 2080 SUPERの1.7倍を実現している。
一方のTENSOR Coreは,272基を搭載しており,これはRTX 2080 Tiの半分となった。しかし,TENSOR Coreの内部は第3世代に進化しており,スループットは238 Tensor TFLOPSと,こちらはRTX 2080 Tiの倍以上の性能を実現している。
ちなみに,RTX 3080でも従来どおり「GPU Boost 4.0」がサポートされており,テスト中のGPUコアクロックは,GPU-Zで最大2010MHzまで上昇していたのを確認した。
また,RTX 3080では,グラフィックスメモリとしてGDDR6Xを搭載する。メモリインタフェースは320bitと広く,メモリクロックも19GHz相当とかなり高速なため,メモリバス帯域幅は760GB/sと,RTX 2080 Tiの約1.7倍,RTX 2080 SUPERの約1.5倍を実現している。
また,RTX 3080は,PCI Express(以下,PCIe) 4.0に対応した点も,トピックのひとつに挙げられよう。
そんなRTX 3080の主なスペックを,RTX 2080 TiおよびRTX 2080 SUPERとともにまとめたものが表1となる。
GeForce RTX 3080 | GeForce RTX 2080 Ti | GeForce RTX 2080 SUPER | |
---|---|---|---|
GPUコア | GA102(GA102-200) | TU102(TU102-300) | TU104(TU102-300) |
GPUアーキテクチャ | Ampere | Turing | Turing |
製造プロセス技術 | 8nm | 12nm FFN | 12nm FFN |
トランジスタ数 | 280億 | 186億 | 136億 |
ダイサイズ | 628mm2 | 754mm2 | 545mm2 |
ミニGPU(GPC)数 | 6 | 6 | 6 |
演算ユニット(SM)数 | 68 | 68 | 48 |
シェーダプロセッサ数 | 8704 | 4352 | 3072 |
TPC数 | 34 | 34 | 24 |
RT Core数 | 68 | 68 | 48 |
Tensor Core数 | 272 | 544 | 384 |
テクスチャユニット数 | 272 | 272 | 192 |
ROP数 | 96 | 88 | 64 |
ベースクロック | 1440MHz |
1350MHz | 1650MHz |
ブーストクロック | 1710MHz |
1545MHz (FEは1635MHz) |
1815MHz |
GPU Boost | 4.0 | 4.0 | 4.0 |
L2キャッシュ容量 | 5MB | 4MB | 4MB |
メモリタイプ | GDDR6X | GDDR6 | GDDR6 |
メモリインタフェース | 320bit | 256bit | 256bit |
メモリクロック | 19GHz相当 | 14GHz相当 | 15.5GHz相当 |
メモリバス帯域幅 | 760GB/s | 448GB/s | 496GB/s |
メモリ容量 | 10GB | 11GB | 8GB |
TDP | 320W | 215W (FEは260W) |
250W |
接続インタフェース | PCIe 4.0 | PCIe 3.0 | PCIe 3.0 |
NVLink SLI | ― | ○(1リンク) | ○(1リンク) |
PCIe外部電源 | 12ピン(FE) | 8ピン×2 | 8ピン×1,6ピン×1 |
カード長は実測で約287mm
電源部は18フェーズ構成の豪華な仕様
それでは,RTX 3080 Founders Editionのカードそのものを見て行こう。
カード長は実測で約287mm(※突起部含まず)で,RTX 2080 Ti Founders Editionが同267mmだったのと比べると,20mmほど長くなったことになる。角が丸みを帯びているものの,その外観は箱そのもの。RTX 30シリーズの発表時にSNS上では,Founders Editionを指して「レンガ」や「鈍器」と揶揄されたものだ。
ちなみに,重量は実測で約1351g。少々意地悪な言い方をすると,一般的な赤レンガは1つ約2.4kgなので,それよりは1kgほど軽いとも言える。
なお,空冷ファンは,ファン部分と外枠が一体成型されたもので,GPUへの負荷が低いアイドル時には,回転を停止する機能もある。
付け加えると,12ピンコネクタは,カードをマザーボードに装着したときに垂直ではなく斜め向きになるように実装されているので,付属アダプタを取り付けても,PCケースに干渉しにくいように配慮されている。
今回はテスト前にカードを分解しなかったので,NVIDIAが公開した写真でGPUクーラーや基板を見て行くと,GPUクーラーにはベイパーチャンバーと4本のヒートパイプが用いられているのが分かる。
さらに,電源部は18フェーズ構成と,かなり豪華な仕様だ。基板自体は,ブラケットからPCIe補助電源コネクタぐらいまでの長さしかなく,意外と短い。NVIDIAによると,従来よりも50%小さい超高密度PCB設計を実現したそうだ。ただ,メモリチップ2枚分の空きパターンが用意されていることから,上位モデルである「GeForce RTX 3090」と,基板設計の共通化を図っているのかもしれない。
外部出力インタフェースは,DisplayPort 1.4a×3,HDMI 2.1 Type A×1という構成だ。RTX 2080 Ti Founders EditionにあったVirtualLink対応のUSB Type-Cが省略された一方で,HDMIがバージョン2.1をサポートした点が特徴的だ。これにより,対応するHDMIケーブルとディスプレイを組み合わせて,リフレッシュレート120Hzの4K解像度や,60Hzの8K解像度が利用可能となる。
ドライバはGeForce 456.16 Driverを利用
リアルタイムレイトレーシングなどのテストも実施
それでは,テスト環境の構築に話を移そう。今回,比較対象には前世代のハイエンド向けとなるRTX 2080 Tiと,RTX 2080 SUPERを用意した。ドライバソフトには,NVIDIAが全世界のレビュワー向けに配布した「GeForce 456.16 Driver」を利用している。
また,RTX 3080がPCIe 4.0に対応しているので,CPUとマザーボードには,AMDの「Ryzen 9 3900XT」とAMD X570チップセット搭載マザーボード「X570 AORUS MASTER」を使用している。それ以外のテスト環境は表2のとおり。
テスト方法は,4Gamerのベンチマークレギュレーション23.2に準拠。それに加えて,RTX 3080ではリアルタイムレイトレーシングやDLSSの性能が向上したことと,PCIe 4.0に対応したことを加味して,「3DMark」(Version 2.12.6964)において,「Port Royal」と「NVIDIA DLSS feature test」,それに「PCI Express feature test」を追加する。
なお,RTX 3080は4K解像度でのゲームプレイを想定しているものの,PC市場ではいまだフルHD解像度の液晶ディスプレイが大勢を占めていることを鑑みて,解像度は3840×2160ドット,2560×1440ドット,1920×1080ドットの3つを選択した。
RTX 3080は,RTX 2080 Tiのおおよそ1.3倍の性能
やはり真価を発揮するのは4K解像度
それでは,3DMarkから順にテスト結果を見て行こう。
Fire Strikeの総合スコアをまとめたものがグラフ1となる。
RTX 3080は,RTX 2080 Ti比でも12〜31%程度の差を付けており,高解像度になるほど差が広がる傾向が見られる。これは,解像度が低い場合はCPUがボトルネックになりやすく,RTX 3080が十分な性能を発揮できないからではないだろうか。また,RTX 2080 SUPERに25〜57%程度と,やはり高解像度のほうが開きが大きい。
グラフ2は,総合スコアから「Graphics score」を抜き出したものだ。
このテストはCPU性能の影響を受けないため,RTX 3080とRTX 2080 Tiとの差は23〜33%程度,RTX 2080 SUPERとの差は47〜61%程度と,スコア差はある程度に収まっている。大雑把に言うと,Graphics scoreにおいて,RTX 3080の描画性能はRTX 2080 Tiと比べて130%前後,RTX 2080 SUPER比では150%前後とまとめられる。
続いてグラフ3は,ソフトウェアベースの物理演算テスト結果を「CPU score」として抜き出したものだが,CPUを統一していることもあり,スコアはほぼ横一線だ。
グラフ4はGPUとCPU両方の性能が効いてくる「Combined test」の結果をまとめたものだ。
ここでもCPUによるスコアの頭打ちが発生しており,Fire Strike“無印”において,RTX 3080はRTX 2080 TiやRTX 2080 SUPERに明確な差を付けることができていない。NVIDIAが「4K解像度でのゲームプレイを想定している」と言うように,1920×1080ドットでは,RTX 3080の真価を発揮できない場面が多くなるのではないだろうか。
続いては,DirectX 12世代のテストである「Time Spy」の結果を見ていこう。まずは総合スコアをまとめたグラフ5からだ。
RTX 3080は,RTX 2080 Tiに20〜28%程度の,RTX 2080 SUPERには42〜53%程度の差を付けている。DirectX 12により描画負荷が増大したことで差が明確に表れているが,傾向としてはFire Strikeの結果を踏襲していると言えよう。
次のグラフ6はTime SpyのGPUテスト結果,グラフ7はCPUテストの結果をそれぞれまとめたものだ。
GPUテスト結果は,総合スコアよりも差が開き,RTX 2080 Tiとの差は26〜34%程度,RTX 2080 SUPERとの差は55〜66%程度と景気がいい。やはり,CPU性能の影響がない状況では,RTX 3080の高性能が顕著に表れる。一方のCPUテストは,CPUが同一なため,Fire Strikeと同様に,基本的にスコアが横並びだ。
リアルタイムレイトレーシングの性能を計るPort Royalの結果がグラフ8だ。
RTX 3080は,RTX 2080 Tiの1.3倍,RTX 2080 SUPERの1.6倍のパフォーマンスを発揮している。NVIDIAは,RTX 3080のリアルタイムレイトレーシング性能を「RTX 2080 SUPERの1.7倍」と説明していたが,それに近いスコアが得られたわけだ。
続いて,DLSSの性能を見るNVIDIA DLSS feature testの結果(グラフ9)を見ていく。このテストは,DLSSがオンとオフの状態で同じシーンを描画して,フレームレートの違いで性能の差を見るというものだ。
DLSS有効時の性能は,RTX 3080がRTX 2080 Tiに28〜32%程度の,RTX 2080 SUPERには53〜61%もの差を見せつけた。ただ,DLSS onとDLSS offで描画性能がどれだけ変化したのかを計算すると,RTX 3080は1920×1080ドットで約29%,2560×1440ドットで約40%,3840×2160ドットで約79%となる。これはRTX 2080 TiやRTX 2080 SUPERと大差ない数値だ。つまり,RTX 3080は,DLSS off時のスコアが高いだけで,Tensor Coreが第3世代へと進化したことによる性能向上は,少なくともこのテストからは拾えていないことになる。
グラフ10は,PCI Express feature testの結果だが,ここではRTX 2080 TiやRTX 2080 SUPERに対して,RTX 3080は約1.7倍の転送レートを記録した。PCIe 4.0とPCIe 3.0では,規格における転送レート差は2倍もあるので,それに近い結果が得られたと言える。
では,実際のゲームではどうなのだろうか。グラフ11〜13は「Far Cry New Dawn」の結果となる。
ここでは,平均フレームレートにおいて,1920×1080ドットだけでなく2560
続いて,「バイオハザード RE:3」の結果がグラフ14〜16となる。
ここでも,1920×1080ドットではスコアが丸まりつつあり,RTX 3080は平均フレームレートでRTX 2080 Tiに差を付けられず,RTX 2080 SUPERに対しても約8%しか引き離せていない。しかし,解像度が高くなると差は広がりを見せ,3840
その傾向は,グラフ17〜19の「Call of Duty: Warzone」(※グラフ内ではCoD Warzone)でも変わらない。
本作は描画負荷が大きいため,1920×1080ドットでもRTX 3080が平均フレームレートでほかに若干の差を付けているが,やはり大きく開きを見せるのは3840×2160ドットである。ただ,最小に当たる99パーセンタイルフレームレートに目を向けると,RTX 3080は唯一,1920×1080ドットで144fpsを超えており,この点でFPSゲーマーにとってかなり魅力的ではないだろうか。また,3840×2160ドットで,RTX 3080は平均フレームレートが100fpsを上回っている点も立派の一言だ。
「Fortnite」の結果をグラフ20〜22に示す。なお,今回のテストは,FortniteにリアルタイムレイトレーシングやDLSS対応のパッチ(関連記事)が当たる前に行っていることをお断りしておく。
テスト結果だが,RTX 3080が1920×1080ドットでも,平均フレームレートでしっかりとほかに差を付けた。RTX 3080とRTX 2080 Tiとの差は24〜34%程度で,RTX 2080 SUPERとの差は42〜59%程度と,高解像度で差が広がる点はこれまで変わらないものの,1920×1080ドットで平均200fpsに迫っている点は立派だ。最小フレームレートを見ても,RTX 3080は1920×1080ドットで157fpsと,その性能を如何なく発揮している。
グラフ23〜25の「Borderlands 3」では,再びCPUの足かせが姿を現す。
RTX 3080とRTX 2080 Tiとの差は,平均フレームレートにおいて1920×1080ドットで約5%ほどしかなく,RTX 2080 SUPER比でも約10%だ。だが,3840
グラフ26は「ファイナルファンタジーXIV: 漆黒のヴィランズ ベンチマーク」(以下,FFXIV漆黒のヴィランズ ベンチ)の総合スコアをまとめたものだ。
ここでも2560×1440ドット以下の解像度では,RTX 3080は既存GPUにあまり差を付けられていない。だが,3840×2160ドットになると,RTX 2080 Tiに約19%,RTX 2080 SUPERに約38%の差を見せつけている。
そんなFFXIV漆黒のヴィランズ ベンチにおける平均フレームレートと最小フレームレートをまとめたものがグラフ27〜29だ。
平均フレームレートは,基本的に総合スコアを踏襲したものとなっているが,RTX 3080は3840×2160ドットで100fpsに迫っている点は評価に値する。ただ,最小フレームレートはCPU性能の影響が色濃く表れるため,RTX 3080であっても,3840×2160ドットでは40fpsがやっとの印象だ。
グラフ30〜32には,「PROJECT CARS 2」の結果をまとめている。
平均フレームレートを比較すると,RTX 3080がRTX 2080 TiやRTX 2080 SUPERに対して明確な差を付けることができたのは,ここでも3840×2160ドットのみだ。つまり,2560×1440ドット以下では,平均フレームレートの差はあまり大きくない。それは最小フレームレートも同様で,2560×1440ドットでもRTX 3080とRTX 2080 Tiとの差はせいぜい12%といったところ。
消費電力は大幅増加
GPUクーラーの冷却性能と静音性は良好
RTX 3080のTGP(Total Graphics Power,グラフィックスカードの消費電力)は公称320Wと,RTX 2080 SUPERから70Wも上昇してしまっている。では,実際の消費電力はどの程度なのだろうか。
今回,「4Gamer GPU Power Checker」(Version 1.1)が不調によりうまく動作しなかったため,ログの取得が可能なワットチェッカー「Watts up? PRO」を用いたシステム全体の最大消費電力のみを計測している。
テストにあたっては,Windowsの電源プランを「バランスに設定」。さらに,ゲーム用途を想定し,無操作時にもディスプレイ出力が無効化されないよう指定したうえで,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点をタイトルごとの実行時,OSの起動後30分放置した時点を「アイドル時」としている。その結果がグラフ33だ。
ピークの数値を取得するテストの性格上,数値はどうしても大きくなりがちだ。しかし,それでもRTX 3080の消費電力は530W前後と,RTX 2080 Tiから81
最後に,GPU-Zを用いて計測したGPU温度も確認しておきたい。ここでは,温度約24℃の室内で,テストシステムをPCケースに組み込まず,いわゆるバラックに置いた状態から,3DMarkの30分間連続実行時を「高負荷時」として,アイドル時ともども,GPU-Zから温度を取得することにした。
その結果はグラフ34のとおり。
RTX 2080 Tiが高負荷時に80℃を超えてしまう一方で,RTX 3080は80℃に届くことはなかった。NVIDIA自慢のフロースルー設計は,十分な冷却性能を発揮できていると考えてよさそうだ。なお,アイドル時にRTX 3080の温度だけ高めなのは,空冷ファンの回転が停止するためだ。
ちなみに,筆者の主観であることを断ったうえで,RTX 3080の動作音について述べると,このクラスのグラフィックスカードとしては,十分静かな印象を受けた。少なくともRTX 2080 TiやRTX 2080 SUPERよりは静かだ。
想定売価は10万9800円と安くはないものの
最高性能が享受できるGPUであることは間違いない
その一方で,消費電力の高さは問題点として指摘しておきたい。消費電力あたりの性能が向上しているとNVIDIAは言うものの,RTX 2080 Tiから80W以上も増加している点はいただけない。さらに,低解像度ではCPUが足かせになる場面が多い点も問題点として挙げられよう。とくに日本市場では,フルHD解像度で高リフレッシュレートの液晶ディスプレイの人気が高いのだが,そうした解像度では,RTX 3080の性能が宝の持ち腐れになることも懸念もあるだろう。また,レイトレーシングやDLSSといった新しい機能を実装するゲームが,今後ますます増えていく必要もあるだろう。
とはいえ,RTX 3080では4K解像度で真に快適なゲーム体験ができることは間違いなく,最高性能を欲するユーザーにとっては,垂涎の的となる存在だ。NVIDIAによる搭載カードの想定売価は10万9800円(税込)と決して安価ではないものの,4Kのような高解像度で描画オプションを最高設定にしてゲームを楽しみたいという需要は高く,そうした要望に応えることができるGPUと言えるだろう。
NVIDIA公式WebサイトのRTX 3080製品情報ページ
- 関連タイトル:
GeForce RTX 30
- この記事のURL: