お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
「GeForce RTX 3080 Ti」は“ほぼRTX 3090”の高性能GPUだ。NVIDIA基調講演から新GPUの仕様と魅力を紐解く
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2021/06/01 21:05

ニュース

「GeForce RTX 3080 Ti」は“ほぼRTX 3090”の高性能GPUだ。NVIDIA基調講演から新GPUの仕様と魅力を紐解く

GeForce RTX 3080 Tiのリファレンスカード
画像集#002のサムネイル/「GeForce RTX 3080 Ti」は“ほぼRTX 3090”の高性能GPUだ。NVIDIA基調講演から新GPUの仕様と魅力を紐解く
 既報のとおり,2021年6月1日,NVIDIAは,オンラインイベントとして開催中のCOMPUTEX 2021の基調講演内で,新GPUの「GeForce RTX 3080 Ti」と「GeForce RTX 3070 Ti」を発表した。
 本稿では,これらの新GPUの発表内容を整理してレポートしよう。


GeForce RTX 3080 Tiはゲーマー向けハイエンドGPUの真打ちか


 GeForce RTX 3080 Tiは,「GeForce RTX 3080」と「GeForce RTX 3090」の中間に来るハイエンド市場向けの製品で,GPUコアには,両GPUと同じ「GA102」コアを採用している。

GeForce RTX 3080 Tiの主な仕様
画像集#003のサムネイル/「GeForce RTX 3080 Ti」は“ほぼRTX 3090”の高性能GPUだ。NVIDIA基調講演から新GPUの仕様と魅力を紐解く

既存のGeForceと比較したGeForce RTX 3080 Tiの性能
画像集#004のサムネイル/「GeForce RTX 3080 Ti」は“ほぼRTX 3090”の高性能GPUだ。NVIDIA基調講演から新GPUの仕様と魅力を紐解く

 GA102では,ミニGPUクラスタ「Graphics Processor Cluster」(以下,GPC)が7基構成であった。1基あたりのGPCは,最大12基の「Streaming Multiprocessor」(以下,SM)で構成されており,SM 1基あたりのCUDA Core(≒シェーダープロセッサ)数は128基となっているので,フルスペック版GA102のCUDA core総数は以下のようになる。

  • 7 GPC×12 SM×128 CUDA Core=10752

 しかしGeForce RTX 3080は,GA102が備えるGPCのうち,1基分をまるごと無効化したGPC 6基構成であった。さらに,GPCのうち4基分はSM数12基の構成だが,残るGPC 2基分は,SM数が10基となっていた。つまり,GeForce RTX 3080の構成はこうなる。

  • (128 CUDA Core×12 SM×4 GPC)+(128 CUDA Core×10 SM×2 GPC)=8704

 これが最上位のGeForce RTX 3090になると,GA102のGPC 6基分がSM 12基の構成で,残るGPC 1基分だけはSM 10基としていた。つまり,GeForce RTX 3090の構成は以下のとおりだ。

  • (128 CUDA Core×12 SM×6 GPC)+(128 CUDA Core×10 SM×1 GPC)=10496

 これを踏まえたうえで,GeForce RTX 3080 Tiの構成はどうなっているのか,という話なのだが,残念なことにNVIDIAからの公式情報はない。しかし,CUDA Core総数は10240基(=SM総数は80基)と発表されているので,この情報から推測すると,おそらくは,GA102のGPC 6基分はSM 12基の構成で,残るGPC 1基分をSM 8基とした構成になっていると思われる。

  • (128 CUDA Core×12 SM×6 GPC)+(128 CUDA Core×8 SM×1 GPC)=10240

 GeForce RTX 3080 Tiの動作クロックは,ブースト最大クロックが1665MHzなので,その理論性能値は以下のようになる。

  • 10240×2 OPS×1665MHz=34.10 TFLOPS

 この値は,GeForce RTX 3080の29.77 TFLOPS,GeForce RTX 3090の35.58 TFLOPSの間に収まる……というか,かなりGeForce RTX 3090に近い値となっているのが興味深い。GeForce RTX 3080 Tiは,演算性能的にはGeForce RTX 3090とほとんど変わりないレベルにあるわけだ。

 さて,GPUにおけるグラフィックス性能を語るうえで欠かすことのできないグラフィックスメモリの性能だが,GeForce RTX 3080 Tiでは,ここを相当に強化しているのもホットトピックである。
 GeForce RTX 3080では,GA102自体のメモリインタフェースが384bitだったにもかかわらず,意図的にGA102内のメモリコントローラを2基無効化して,320bitバスとしていた。ところが,GeForce RTX 3080 Tiでは,上位のGeForce RTX 3090と同じくGA102の384bitバスをまるまる活用する構成になった。

 グラフィックスメモリのGDDR6X自体は,GeForce RTX 3080と同じくメモリクロック19GHz相当で据え置きとしているが,メモリインタフェースを384bit化したことでメモリバス帯域幅は向上しており,912GB/sにまで向上しているのだ。これはGeForce RTX 3080比で20%もの向上となる。
 ちなみに,GeForce RTX 3090のメモリバス帯域幅は936GB/sだ。ここも演算性能と同様に,GeForce RTX 3090に極めて近い値となっているのだ。

 GeForce RTX 3080 Tiのグラフィックスメモリ搭載量は12GBである。これは,GeForce RTX 3090の24GBから見て,ちょうど半分だ。この割り切りはかなり過激である。もっとも,搭載するGDDR6Xメモリチップの仕様により,384bitメモリインタフェースのままで24GBより小さい容量を実現するには,12GBしか選択肢がないので仕方ない。

 そのほかの機能面についてはGeForce RTX 3080/GeForce RTX 3090からの変更はない。
 レイトレーシングユニットの「RT Core」は,SM 1基あたりにつき1基なので,GeForce RTX 3080 TiのRT Core数は80基となる。実効性能は,先述したプログラマブルシェーダの理論性能値の話と同じで,わずかにGeForce RTX 3090には及ばないが,ほとんど変わらないレベルだ。

 一方,推論アクセラレータの「Tensor Core」は,SM 1基あたり4基あるので,GeForce RTX 3080 TiでのTensor Core総数は320基(※80 SM×4 Tensor Core)となる。実効性能についても同様で,GeForce RTX 3090をやや下回るが,ほとんど変わらないことになる。

 GPU組み込みのビデオコーデックエンジン「NVENC」は,GeForce RTX 20世代のものをそのまま継承しており,とくに変わりはない。外部映像出力インタフェースは,HDMI 2.1とDisplayPort 1.4に対応しており,どちらもに「Display Stream Compression」(DSC)技術に対応する。

 まとめると,GeForce RTX 3080 Tiは,

  • GPUとしてのトータル性能はGeForce RTX 3090に極めて近い
  • グラフィックスメモリを半分に削減

といったGPUと言えようか。

 GeForce RTX 3090が採用していた24GBという大容量グラフィックスメモリは,現状では「Microsoft Flight Simulator」のように,ごく限られたグラフィックスメモリバカ食いタイトルにしか恩恵が少ないので,「一般的なゲームタイトルで,レイトレーシング有効化かつDLSS有効化した4K解像度で楽しみたい」というゲーマーには,最良の選択となりそうだ。

 なお,性能がGeForce RTX 3090に極めて近いGeForce RTX 3080 Tiだが,リファンレスカードとなる「GeForce RTX 3080 Ti Founders Edition」(※国内発売予定なし)だと,占有スロット数が2スロットに収まっている(※GeForce RTX 3090のFounders Editionは3スロットだった)。この取り回しのしやすさも,GeForce RTX 3080 Tiの隠れた魅力ということになりそうだ。

 NVIDIA公式Webサイトによると,GeForce RTX 3080 Ti搭載カードは6月3日に発売となり,国内における搭載カードの想定売価は17万5800円から(※税込か税別かは未公開)という。ちなみに,NVIDIAによるGeForce RTX 3090搭載カードの想定売価は,22万9800円だった。
 ざっくりと,GeForce RTX 3080 Tiを「グラフィックスメモリ容量が半分となったほぼGeForce RTX 3090」と見なした場合,GeForce RTX 3090から5万円安いというGeForce RTX 3080 Tiの価格設定が妥当かどうかは,いろいろな意見が出てきそうではある。


GPU性能は微増&メモリ性能は爆増のGeForce RTX 3070 Ti


 もうひとつの新GPUであるGeForce RTX 3070 Tiの仕様を見ていこう。
 GeForce RTX 3070のGPUコアは「GA104」だったが,GeForce RTX 3070 Tiも同じGA104ベースのGPUである。

GeForce RTX 3070 Tiの主な仕様
画像集#005のサムネイル/「GeForce RTX 3080 Ti」は“ほぼRTX 3090”の高性能GPUだ。NVIDIA基調講演から新GPUの仕様と魅力を紐解く

 GA104コアのフルスペック仕様は,CUDA Core数が6144基だったわけだが,このうち5888基を有効化したモデルがGeForce RTX 3070だ。一方,GeForce RTX 3070 TiのCUDA Core数は6144基と発表されているので,GeForce RTX 3070 TiはGA104のフルスペック版と言えよう。

 GeForce RTX 3070 Tiは,ブーストクロックが1.77GHzと発表されているため,その理論性能値は以下のように計算できる。

  • 6144×2 OPS×1770MHz=21.75 TFLOPS

 GeForce RTX 3070の理論性能値は20.37 TFLOPSだったので,演算性能は微増という感じだ。

 GeForce RTX 3070 Tiの強化点はCUDA Core数だけかというと,もちろんそんなことはない。
 GeForce RTX 3070 Tiでは,グラフィックスメモリ容量が8GB,グラフィックスメモリのメモリインタフェースも256bitと,GeForce RTX 3070から据え置かれてはいるが,グラフィックスメモリタイプがGDDR6からGDDR6Xへと変更されているのだ。
 メモリクロックは未公表であるが,GeForce RTXシリーズ向けにGDDR6Xを提供しているMicron Technologyのスペック表(関連リンク)を見たところ,19GHz品が基本グレードであった。であれば,最低でも

  • 19GHz×256bit÷8byte=608GB/s

となる。GeForce RTX 3070のメモリバス帯域幅は448GB/sなので,GeForce RTX 3070 Tiは,約36%増しのメモリバス帯域幅を有することになる。

 近年のゲームグラフィックスレンダリングでは,メモリアクセス性能がボトルネックになっていることが多いため,メモリ帯域幅の向上は,フレームレート向上に大きく貢献するはずだ。

 NVIDIAの公式Webサイトによると,GeForce RTX 3070 Tiは6月10日に発売となり,国内での想定売価は8万9980円からになるという。ちなみに,NVIDIAによるGeForce RTX 3070搭載カードの想定売価は7万9980円となっているため,その価格差は1万円ということになる。価格対性能比的にはかなり魅力的だと言えよう。

 こうした魅力ある製品は,発売時にかなり争奪戦になりがちなので,購入を希望する人は,販売動向に注目しておきたいところである。

NVIDIAのGeForce RTX 3080シリーズ製品情報ページ

NVIDIAのGeForce RTX 3070シリーズ製品情報ページ

  • 関連タイトル:

    GeForce RTX 30

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
スペシャルコンテンツ
注目記事ランキング
集計:04月19日〜04月20日