レビュー
RT CoreもTensor Coreも搭載しないTuringが,新世代の鉄板GPUになる!?
GeForce GTX 1660 Ti
(ASUS ROG -STRIX -GTX1660TI -O6G -GAMING)
また,搭載グラフィックスカードの北米市場におけるメーカー想定売価が279ドル(税別)というのは,Turing世代ということを考えると文句なしに安価だったりもするのだが,ではその実力はゲーマーを満足させるものなのか。4GamerではASUSTeK Computer(以下,ASUS)製の搭載カード「ROG
※本稿ではGPUアーキテクチャの解説を米田 聡氏が,それ以外のすべての宮崎真一氏が担当します。
RT CoreだけでなくTensor Coreも持たない「TU116」ベース
最初に型番の話を済ませておくと,今回の製品が“GeForce GTX 1160 Ti”ではないことに,特段の理由はないそうだ。NVIDIAによると,「ほかの製品との違いを分かりやすくする」だけの意図から1660にしたとのことなので,「GeForce GTX 10シリーズでもGeForce RTX 20シリーズでもない型番」くらいに理解しておけば十分だろう。
なぜなら,GTX 1660 Tiが採用するGPUコア「TU116」は,Turing世代のGPUが統合するもう1つの固定ハードウェアで,深層学習アクセラレータとして機能する「Tensor Core」も持たないからだ。
付け加えると,TU116はRT CoreとTensor Coreをそもそも搭載していない。「搭載するが無効になっている」わけではないのである。なのでTU116ではどうやってもリアルタイムレイトレーシングの高速化は行えず,またDLSS(Deep Learning Super Sampling)機能を利用することもできない。
そしてTU106の場合,このSMを12基まとめて,CPUにおけるCPUコア的に機能するクラスタ「Graphics Processor Cluster」(以下,GPC)とし,さらにGPCを3基搭載してフルスペックとしていたのだ。なのでフルスペック(=RTX 2070)の総CUDA Core数は2304基(64×12×3)となる。
そしてここからが重要なのだが,TU116の場合,GPC数は3基でTU106と同じながら,GPCあたりのSM数は(「GeForce RTX 2080」と同じく)8基になっている。つまりTU116のフルスペックにおける総CUDA Core数は,
- 64(※SMあたりのCUDA Core総数)×8(※GPCあたりのSM総数)×3(※GPCの総数)
で1536基だ。GTX 1660 TiはTU116のフルスペックなので,この計算式そのままの理解で構わない。
……勘のいい読者はもう気付いただろう。TU116のトランジスタ数とダイサイズは,TU106比で,ほぼCUDA Coreが減った分しか小さくなっていないのだ。では,RT CoreとTensor Coreの代わりに何が入ったのか?
答えは,16bit半精度浮動小数点数(FP16)演算器である。
そこで,SMを構成する4ブロックの1つあたり32基,SMあたり128基のFP16演算器をTensor Coreの代わりに搭載したというわけなのである。
GPUの足回りとなるL2キャッシュ容量は1.5MBなので,これはRTX 2060の半分にして,GTX 1060 6GBと同じ。組み合わされるグラフィックスメモリはGDDR6で容量6GBとなり,メモリクロックは12GHz相当だ。基本仕様はRTX 2060を踏襲しつつ,メモリクロックのみ約86%になっているため,メモリバス帯域幅も約86%の288.1GB/sとなる。
ただしこの帯域幅は,GDDR5メモリを採用しているGTX 1060 6GBと比べると1.5倍という数字であり,従来世代比ではインパクトのあるスペック向上を果たしている。
なおNVIDIAによれば,グラフィックスカードメーカーの判断次第では,異なるグラフィックスメモリ容量の製品が登場する可能性はあるとのことだ。今後ひょっとすると,一部のカードメーカーからグラフィックスメモリ容量3GB版が登場するかもしれない。
気になる公称TDP(Thermal Design Power,熱設計消費電力)は120Wで,GTX 1060 6GBから変わっていないが,PCI Express外部電源は8ピン
表1は,そんなGTX 1660 Tiの主なスペックを,RTX 2060と「GeForce GTX 1070」(以下,GTX 1070),そして置き換え対象となるる「GeForce GTX 1060 6GB」(以下,GTX 1060 6GB)と比較したものになる。
なお,繰り返すが,RT CoreとTensor Coreを持たないだけで,TU116はあくまでもTuring世代のGPUだ。なので,
- FP32とINT32のオーバーラップ実行
- L1キャッシュと共有メモリを統合したUnified Cache Architectureの採用とクロック引き上げ
- FP32比で2倍のスループットが得られる16bit半精度浮動小数点演算性能
- 新世代のピクセルパイプラインレンダリング概念であるVariable Rate Shadingと,それを応用したContent Adaptie ShadingおよびMotion Adaptive Shading
といった「Turingならでは」の機能は,GeForce RTX 20と同じく活用できる。
NVIDIAはこれらの新要素が,とくに新世代のゲームタイトルで有効だとしている。たとえばFP16は「Far Cry 5」が水面のエフェクト処理に用いていたりするとのことで,積極的に新しい技術を採用しているタイトルであればあるほど,GTX 1660 Tiは旧世代のGeForce GTXに対して優位性を発揮できるそうだ。より正確を期せば,「積極的にNVIDIAの技術を採用しているタイトル」でより高い性能を期待できる,といったところか。
西川善司の3DGE:GeForce RTX 20完全理解。レイトレ以外の部分も強化が入ったTuringアーキテクチャにとことん迫る
リアルタイムレイトレーシング,そしてAI推論用の専用ハードウェアを搭載するGPU「GeForce RTX」。そのアーキテクチャ詳細がついに明らかとなった。連載「西川善司の3Dゲームエクスタシー」,今回は,「リアルタイムグラフィックスの再発明」とも呼ばれる新世代GPUの正体に,とことん迫ってみたい。
ブーストクロックはリファレンス比+90MHzに
まず動作クロックだが,ROG
一方のSilent modeは,ベースクロックは未公開で,ブーストクロックは1830MHzとGaming modeから30MHz低下し,電力目標も90%へ下がっている。これら動作モードは,付属アプリケーション「GPU Tweak II」(Version 1.9.4.4)を導入すれば簡単に切り替え可能だ。なお,メモリクロックはどの動作モードも12GHz相当と,リファレンスから変わらない。
なお,後述するテスト環境において,工場出荷時設定のGaming modeにおける動作クロックをGPU Tweak IIから追ってみたところ,最大2010MHzに達するの確認できた。
GPU Tweak IIは動作クロックの最適化機能である「NVIDIA Scanner」(以下,Scanner)にも対応しているので,こちらを併用することも可能だ。
テスト中の動作クロックを追ってみたところ。ROG |
GPU Tweak IIから「OC Scanner」をクリックするScannerを実行できる。Gaming modeでは平均で動作クロックを67MHz引き上げることができた |
カード長は30cm超級。ミドルクラスGPU搭載製品としては極めて大きい
また,“横と縦”にも大きく,マザーボードに装着したとき,マザーボードの垂直方向にI/Oブラケットから実測約24mmはみ出ている点,そしてGPUクーラーが2.5スロット仕様になっている点も押さえておく必要があるだろう。
この大型クーラーは90mm角相当のファンを3基搭載するが,ファンは,外枠と羽が一体化した「Axial-tech Fan」構造になっている。ASUSによると,同社の従来製品で採用している「Wing-Blade Fan」に比べて,エアフローが27%,風圧が40%それぞれ上昇するという。
GPUの温度が55℃以下になるとファンの回転を停止する「0dB Technology」が標準で有効になっていて,これはGPU Tweak IIから有効/無効の切り替えが可能だ。
さらに,GPU Tweak IIの「Advance Mode」を用いれば,左右の2基と中央の1基で別々に回転数を制御できる。左右の2基と中央の1基で設定できる内容に違いはなく,「Manual」を選択すれば回転数22〜100%の範囲を1刻みで固定できるほか,「User Define」ではコアの温度と回転数の関係を示したグラフから任意の5か所を自由にカスタマイズすることも可能となっている。
GPU Tweak IIで0dB Technologyを無効にしたところ。なお,無効化しても,GPU温度が55℃以下になると中央のファンは停止する |
左右のファンの回転数を60%に,中央のファンを30%に設定したところ。3基のファンを2ブロックに分けて管理できるのはありがたい |
プリセットの光り方は常時点灯の「Static」,ゆっくり明滅を繰り返す「Breathing」,さらにゆっくり明滅する「Strobing」,色が順次変化する「Color Cycle」,再生する音楽に合わせて点灯する「Music」,GPUの温度によって色を変える「GPU Temperature」の6とおりとなっている。
Pモードではファンの回転数を高めて冷却性能を引き上げ,一方のQモードでは静音性を高めるべくファンの回転数を下げる。ASUS製の「GeForce RTX 2080 Ti」搭載カード「ROG
補助電源コネクタはリファレンスどおりとなる8ピン
補助電源コネクタは一段低いところの実装となり,電源ケーブルがケースなどに干渉しないように配慮されている |
RTX 2060 Founders EditionではDual-Link DVI-D |
まず,GPUクーラーだが,GPUダイとの接地面積を従来比で2倍とすることで,熱を確実に受けるという「MaxContact Technology」を採用。そこから8mm径のヒートパイプ3本が3ブロック構成となっている放熱フィンへと伸び,熱を運ぶ仕様なのが分かる。
銅製の枕を介してGPUの熱をヒートパイプへと伝える,よくある構造だが,ASUSが以前採用していた,ヒートパイプがシリコンダイと直接触れる「DirectCU」よりも接地面積のロスが少ないという |
クーラーを底面側から見たカット。3本のヒートパイプが合計3か所の放熱フィンブロックへと熱を運ぶ仕様なのが分かる。これを3基のファンで冷却するわけだ |
というわけで基板だが,基板は表側を,ASUSが「Reinforced Frame」と呼ぶ金属製フレームで覆っている。これは基板のねじれやたわみを防ぐだけでなく,メモリチップや電源部のヒートシンクとしても機能する。
続いては基板だが,電源部は6+2フェーズ構成だ。RTX 2060のFounders Editionと同じ回路規模という理解でいい。
8Gbit品のチップを6枚搭載しているので,総メモリ容量は6GBだ。
ROG -STRIX -GTX 1660 TIの定格と「リファレンス相当」のクロックで検証
テストのセットアップに入ろう。
今回,比較対象としては,表1でもその名を挙げたRTX 2060とGTX 1070,そしてGTX 1060 6GBのいずれもFounders Editionを用意した。Turing世代の上位モデルに対してどの程度の性能があり,かつ前世代のGPUとの比較でどの程度の位置づけになるかを見ようというわけである。
なお,ROG
また,GPU Tweak IIから動作クロックをリファレンス相当にまで落とした状態でのテストも行うことにした。ROG
テストに用いたグラフィックスドライバは,NVIDIAから全世界のGTX 1660 Tiレビュワーに対して配布された「GeForce 418.91 Driver」だ。NVIDIAは北米時間2月13日付けで同じバージョンのドライバを公開済みだが,そのGTX 1660 Ti対応版という理解でいいだろう。
組み合わせるWindows 10では「October 2018 Update」を適用。また,とくに断りのない限り「電源プラン」は「高パフォーマンス」で統一した。そのほかテスト環境は表2のとおりとなる。
テスト方法は4Gamerのベンチマークレギュレーション22.1準拠。NVIDIAはGTX 1660 Tiのターゲット解像度を1920
RTX 2060比で8割強の3D性能。NVIDIAの言うとおり,新しめのタイトルではGTX 1070を上回る
以下,ベンチマーク考察段に限り,ROG
グラフ1は「Fire Strike」における総合スコアをまとめたものだ。GTX 1660 TiのスコアはRTX 2060の77〜83%程度なので,Turing世代のGPUとして8割というプロセッサ規模らしい数字が出ていると言える。
Pascal世代のGPUと比較すると,GTX 1070比で80〜92%程度,GTX 1060 6GB比で110〜127%程度なので,おおむね両者の間といったところになる。ただ,GTX 1660 Tiのターゲット解像度である1920
なお,ROG
続いてグラフ2は,Fire StrikeにおけるGPUテスト「Graphics test」の結果を抜き出したものになるが,全体としては総合スコアを踏襲するスコア傾向である。GTX 1660 TiはRTX 2060の75〜83%程度,GTX 1070の77〜92%程度,GTX 1060 6GBの107〜126%程度となる。
カードの定格動作時におけるスコア向上率は約3%だった。
やはりFire Strikeから,物理シミュレーション「Bullet Physics」をソフトウェア実行する事実上のCPUテスト「Physics test」のスコアを抜き出したものがグラフ3だ。
今回のテストではCPUを揃えているため,スコアはキレイな横並びとなった。
CPUとGPUの両方の性能がスコアに影響する「Combined test」の結果がグラフ4だが,ここでGTX 1660 TiはRTX 2060比71〜81%程度,GTX 1070比89〜93%程度,GTX 1060 6GB比126〜144%程度となり,RTX 2060からの「置いて行かれ度合い」とGTX 1060 6GBに対する「引き離し度合い」が大きくなっている。Combined testではスコア差がより顕著になるということなのだろう。
ちなみにROG
3DMarkのDirectX 12テスト「Time Spy」における総合スコアをまとめたものがグラフ5となる。
Time SpyではPascal世代のGPUに対してTuring世代のGPUが優勢に立ち回る傾向が強く出るのだが,果たしてTuring世代のGTX 1660 TiはGTX 1070に対して105〜108%程度,GTX 1060 6GBに対しては143〜145%程度いう,目を見張るスコアを残した。
なお,対RTX 2060のスコアは84〜85%程度なので,Fire Strikeと比べると若干縮んだことになる。ROG
続いてTime Spyの総合スコアからGPUテストの結果を抜き出したものがグラフ6である。
ここでGTX 1660 TiのスコアはRTX 2060の82〜83%程度,GTX 1070の106〜109%程度,GTX 1060 6GBの149〜151%程度で,Pascal世代のGPUに対する優位性はさらに広がった。
一方,CPUテストのほうだと,CPUが揃っているため,Fire Strikeと同じく横並びの結果となった(グラフ7)。
では,実際のゲームアプリケーションだとどうか。グラフ8〜10はTuringアーキテクチャにおけるFP16性能がメリットになるとNVIDIAがアピールしている「Far Cry 5」のテスト結果だが,平均フレームレートでGTX 1660 TiはRTX 2060の83〜88%程度,GTX 1070の100〜101%程度,GTX 1060 6GBの135〜141%程度というスコアを示した。対GTX 1070ではFP16性能,対GTX 1060 6GBではFP16性能とメモリバス帯域幅が奏功したと捉えるのが妥当だろう。
対RTX 2060で高解像度になるほどスコア差が開くのもメモリバス帯域幅の影響と見るべきだ。
なお,ROG
Far Cry 5と比べると比較的古いタイトルとなる「Overwatch」の結果がグラフ11〜13だが,案の定というかなんというか,ここでGTX 1660 Tiの平均フレームレートはGTX 1070の93〜94%程度で,届いていない。
ただ,それでもGTX 1060 6GBには平均フレームレートで30〜32%程度のスコア差を付けており,新世代ミドルクラスGPUとしてここは面目躍如と言っていいだろう。
対RTX 2060だと85〜86%程度といったところなので,ここはFar Cry 5とほぼ同じ傾向と言ってしまってよさそうだ。
ROG
グラフ14〜16の「PLAYERUNKNOWN'S BATTLEGROUNDS」(以下,PUBG)では,Overwatchと比べると多少Far Cry 5寄りの結果となった。平均フレームレートでGTX 1660 TiはRTX 2060の79〜91%程度,GTX 1070の98〜99%程度,GTX 1060 6GBの132〜135%程度だ。
最小フレームレートだとGTX 1660 TiのほうがGTX 1070より低いのが気になるかもしれないが,PUBGのテストでは実プレイを伴うので,この程度は測定誤差として生じうるレベルだと考えている。
「Fortnite」では,ここまでとまた異なる傾向が得られた。グラフ17〜19でGTX 1660 Tiは2560
メモリバス帯域幅が原因なのであればGTX 1070より高いスコアを示してしかるべきだが,そうなっていないことからするに,Fortniteで4Kを相手にするにはGPUの地力が足りていないような印象がある。
一方,GDDR6メモリ採用の効果がはっきり出たと言えるのが,グラフ20〜22にスコアをまとめた「Middle-earth: Shadow of War」(以下,Shadow of War)である。Shadow of Warでは,高解像度テクスチャパックを導入していることもあり,メモリ周りの負荷が非常に高くなっている。そのため,メモリ帯域幅でPascal世代の2製品を上回るGTX 1660 Tiが,順当に高いスコアを示す。平均フレームレートで対GTX 1070は約105%,対GTX 1060 6GBは108〜135%程度だ。
世代的には古いタイトルと言える「ファイナルファンタジーXIV: 紅蓮のリベレーター ベンチマーク」(以下,FFXIV紅蓮のリベレーター ベンチ)の総合スコアをまとめたものがグラフ23となる。
GTX 1660 Tiのスコアは,ここでRTX 2060の82〜91%程度,GTX 1060 6GBの123〜132%程度ながら,GTX 1070にはあと一歩届かなかった。このあたりは本稿の序盤で紹介したとおり,GTX 1660 Tiが最新世代のタイトルへ最適化されていることの証左と言えるのではなかろうか。
グラフ24〜26は,FFXIV紅蓮のリベレーター ベンチにおける平均フレームレートと最小フレームレートをまとめたものになる。
GTX 1660 Tiのターゲット解像度である1920
なお,ROG
「Project CARS 2」の結果がグラフ27〜29だが,GTX 1660 Tiの平均フレームレートはRTX 2060の84〜85%程度,GTX 1070の89〜91%程度,GTX 1060 6GBの125〜126%程度。数字を見る限りはProject CARS 2もTuring世代のGPUが真価を発揮にしにくいタイトルと言えそうだ。
GTX 1060 6GB比で消費電力は若干大きくなったGTX 1660 Ti
本稿の序盤で紹介したとおり,GTX 1660 TiのTDPは120Wで,GTX 1060 6GBから変わっていない。では,実際の消費電力も同程度なのだろうか。
「4Gamer GPU Power Checker」(Version 1.1)を用いて,FFXIV紅蓮のリベレーター ベンチ実行時におけるカード単体の消費電力推移をまとめたものがグラフ30となる。これを見ると,GTX 1060 6GBが100W強あたりで推移しているのに対し,GTX 1660 Tiは150W弱で推移しているように見受けられる。150Wを超える回数もGTX 1060 6GBの51回に対してGTX 1660 Tiは64回と明らかに増えていた。
そんなグラフ30における中央値を求めたものがグラフ31だ。GTX 1660 Tiのスコアは120W弱で,GTX 1060 6GBから15Wほど増加していた。
注意したいのは,今回GTX 1660 Ti搭載カードとして用いているROG
ただ,「同じ」とも考えられそうにはないというのも正直なところで,GTX 1060 6GBと比べて消費電力は増大していると見ておくのが安全だろう。消費電力はGTX 1070並みか,それより少し小さいくらいと考えておけば大きな失敗はしないはずだ。
念のため,ログの取得が可能なワットチェッカー「Watts up? PRO」を用いてシステム全体の最大消費電力も計測してみた。
ここでのテストにあたっては,Windowsの電源プランを「バランス」に設定。さらに,ゲーム用途を想定し,無操作時にもディスプレイ出力が無効化されないよう指定したうえで,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点をタイトルごとの実行時,OSの起動後30分放置した時点を「アイドル時」としている。その結果がグラフ32となる。
ピークを取得するこのテストではスコア差が広がりやすいが,ここでGTX 1660 TiとGTX 1060 6GBとの違いは各アプリケーション実行時で8〜28Wとなっている。ROG
最後にGPUの温度もチェックしておきたい。ここでは,温度を約24℃に保った室内で,テストシステムをPCケースに組み込まず,いわゆるバラックに置いた状態から,3DMarkの30分間連続実行時を「高負荷時」として,アイドル時ともども,「GPU-Z」(Version 2.16.0)から温度を取得することにした。
その結果がグラフ33となる。
GPUごとに温度センサーの位置は異なり,また,温度の制御法もGPUクーラーも異なるため,横並びの評価に意味はない。それを踏まえたうえでスコアを見ていくわけだが,ここではGTX 1660 Tiが高負荷時でも60℃強と非常に温度が低い点に注目したい。ROG
なお,アイドル時にGTX 1060 6GBの温度が高めなのは,0dB Technologyによりファンの回転が停止するためである。
筆者の主観であることを断りつつ,ROG
最新世代のゲームでGTX 1070+α程度で,将来的には鉄板となり得る。それだけに……
ブランドを問わなければ搭載カードを4万円台半ばから購入できるRTX 2060という「値下げ圧力」を受け,全体的に価格が下がってくると,将来的にGTX 1060 6GBの正統後継として新しい「鉄板」となる可能性も大いにあるだろう。
……今後,リアルタイムレイトレーシングおよびDLSSに対応したゲームが仮にどんどん増えていった場合,せっかくの新世代GPUなのに一切対応できない,というリスクを抱えることになる点だけは覚悟が必要だが。
しかし,NVIDIAはこれで舵取りが難しくなったはずだ。GTX 1660 Tiが売れれば売れるほど,「リアルタイムレイトレーシングにもDLSSにも対応しないGPU」の市場シェアが上がるわけで,それはゲームデベロッパにとって,リアルタイムレイトレーシングとDLSSに対応するモチベーションを大いに削ぐ要因となり得る。NVIDIAがそのバランスをいかに取るかによって,GeForce RTX 20シリーズの将来は決まることになるのではなかろうか。
GTX 1660 Tiカードをパソコンショップ アークで購入する
NVIDIAのGeForce製品情報ページ
- 関連タイトル:
GeForce RTX 20,GeForce GTX 16
- この記事のURL: