レビュー
「2688基のCUDA Coreを搭載して999ドル」の第2世代Keplerは速いのか?
GeForce GTX TITAN
(GeForce GTX TITANリファレンスカード)
「数値演算(≒GPGPU)に振ったGPUをGeForceとして用いる」というと,消費電力と発熱の割に3D性能が振るわなかったFermiアーキテクチャをイメージする読者も多いのではないかと思うが,第2世代Keplerアーキテクチャを採用するGTX TITANはそのイメージを払拭できるのか。そして,発表されている「北米市場における搭載グラフィックスカードの希望小売価格999ドル」という価格に見合った,超ハイエンドGPUらしさを見せてくれるのか。テストによって明らかにしてみたい。
GTX 680比でCUDA Coreは1.75倍,メモリ周りは1.5倍に
レビュワー向けドライバでテストを実施
NVIDIAはそのダイサイズを公表していないが,デジタルノギスでの実測値――計測法の都合上,どうしても実際より大きめに出る――は23.46(W)×24.32(D)mmだったので,ざっくり560〜570mm2程度のダイサイズはあると見ていいのではなかろうか。
また,3Dグラフィックス処理用のハイエンド市場向けGPUという観点では,ROPユニット数がGTX 680&690比で1.5倍の48基となり,また,メモリクロックが据え置きのままにメモリインタフェースが1.5倍の384bitに広がったことで,メモリバス帯域幅がGTX 680比で1.5倍に向上している点も見逃せないところだ。GTX 680は,グラフィックスメモリ負荷が極端に高い局面で失速する弱点を抱えていたが,GTX TITANではこの弱点が払拭されることは想像に難くない。
そんなGTX TITANのスペックを,GTX 680&690のほか,競合の現行最上位モデルとなる「Radeon HD 7970 GHz Edition」(以下,HD 7970 GE)とも比較したものが表1となる。
続いて,今回のテスト環境は表2のとおり。いま表1でその名を挙げたGPUを比較対象として用意した。また,GTX 680とHD 7970 GEでは,2-wayのSLIおよびCrossFire(以下,CF)テストも行う関係で,カードを2枚用意している。GTX 680とHD 7970 GEは表中,上に記したリファレンスカードをプライマリとして用いている。
テストに用いたグラフィックスドライバは,GTX TITAN用が,NVIDIAから全世界のレビュワーに配布された「GeForce 314.09 Driver」。ただ,この314.09ドライバはGTX TITAN専用だったため,GTX 680&690では日本時間18日夜に公開された「GeForce 314.07 Driver」を用いる。両者でドライババージョンは異なるが,いずれもRelease 313世代に属するものなので,大きな違いはないと見ていいだろう。
一方,HD 7970 GEのテストには,テスト開始時点における公式最新β版「Catalyst 13.2 Beta5」を用いる。
なお,CPUの「Core i7-3970X Extreme Edition/3.5GHz」は,テスト時の状況によって影響が異なるのを避けるため,自動クロックアップ機能「Intel Turbo Boost Technology」をマザーボードのUEFI(≒BIOS)から無効に設定している。
シングルGPUとしては間違いなく史上最速
一方,多くの場面でデュアルGPU構成には届かず
では,順にテスト結果を見ていこう。グラフ1は,「3DMark 11」の「Performance」および「Extreme」プリセットにおける総合スコアをまとめたものだ。
GTX TITANは,GTX 680に対して32〜49%程度,HD 7970 GEに対しても29〜51%程度高いスコアを示した。ほかのテスト結果を見るまでもなく,シングルGPUとしては疑いなく史上最速と断じてしまっていいだろう。ただし,シングルカードとしては,北米市場におけるNVIDIA希望小売価格がGTX TITANと同じ999ドルであるGTX 690に対しては83〜85%程度のスコアに留まった。また,GTX 680 SLIやHD 7970 GE CFといった2枚差し構成にはまったく届いていない。
新世代3DMarkのテスト結果がグラフ2となる。2013年2月時点だと,3DMarkはRadeon HD 7000シリーズが優勢な傾向にあり,実際,HD 7970 GEはGTX 680より12〜16%程度高いスコアを示しているが,GTX TITANは,そんなHD 7970 GEに対して25〜30%高いところにある。実力差は明らかと述べていいだろう。
GTX 690に対しては88〜92%程度で,3DMark 11のときよりギャップを縮めているのも評価できそうだ。もっとも,GTX 680 SLIがHD 7970 GE CFに圧倒されているあたりからすると,GTX TITANがGTX 690との差を縮めているというより,GTX 690がスコアを伸ばし切れていないと評したほうが適切な気はするが。
グラフ3,4は「Far Cry 3」のテスト結果となるが,ここでもシングルGPU同士の比較におけるGTX TITANの優位性は揺るがない。対GTX 680では18〜39%程度,対HD 7970 GEでは15〜35%高いスコアで,とくに高負荷設定ではGTX TITANのスコアが光る。
また,マルチGPU構成は描画負荷の低い局面でスコアを伸ばしづらいという弱点があり,実際,標準設定の1920×1080ドットではぱっとした結果になっていないのに対し,GTX TITANでそれがないのは,シングルGPUの強みといえそうだ。
「Battlefield 3」(以下,BF3)のテスト結果がグラフ5,6で,ここでは高負荷設定におけるGTX TITANのスコアがこれまで以上に高い。GTX 680に対しては最大約42%,HD 7970 GEに対しては最大約50%なので,圧倒と述べて差し支えないだろう。実フレームレートでも,高負荷設定の2560×1600ドットで平均67.2fpsというのはインパクトが大きい。
一方,BF3はマルチGPU構成の効果が高いこともあり,標準設定の1920×1080ドットを除くと,GTX TITANはGTX 690やGTX 680 SLI,HD 7970 GE CFに置いて行かれる。
続いて,DirectX 9世代の古いタイトルから,「Call of Duty 4: Modern Warfare」(以下,Call of Duty 4)の結果をまとめたものがグラフ7,8だ。Call of Duty 4ではテクスチャ性能がスコアに大きな大きな影響を与えるため,物理的にGPUの数が多いマルチGPU構成が有利となる。また,現在のGeForce DriverはCall of Duty 4でスコアが今ひとつ上がりきらないのだが,それでも,224基のテクスチャユニット数に物を言わせ,GTX TITANは,HD 7970 GEを振り切っている。
公式の高解像度テクスチャパックを導入することでグラフィックス周りの負荷を高めてある「The Elder Scrolls V: Skyrim」(以下,Skyrim)のテストの結果がグラフ9,10だ。2013年の超ハイエンド環境だと,標準設定ではCPUボトルネックによるスコアの頭打ちが生じるため,今回は「Ultra設定」のスコアを見ていくことになるが,グラフィックスメモリ周りの弱点が足を引っ張ってスコアを落としていくGTX 680と比べると,GTX TITANの「びくともしない感じ」は際立っている。
「Sid Meier's Civilization V」から,純然たる3Dグラフィックス処理性能だけでなく,ゲームにおけるGPGPU性能も見ることとなる「Leader Benchmark」でテストした結果をまとめたものがグラフ11,12だ。
現行世代のGPUで比較した場合,ゲームにおけるGPGPU性能で優れるのはRadeonのほうで,実際,HD 7970 GEとGTX 680の比較では前者が後者に大きなスコア差をつけているが,それでもGTX TITANは物量の違いで,HD 7970 GEに対して11〜22%高いスコアを示せている。チカラワザで何とかしているあたりは,NVIDIAのビッグチップらしいところかもしれない。
3D性能検証の最後は,グラフ13,14の「F1 2012」だ。F1 2012はSLIとCrossFireがいずれもスコアを伸ばしにくいタイトルなのだが,こうなると,シングルGPUのまま高スペック化を図ったGTX TITANの独擅場。GTX TITANはすべてのテスト条件ですべてのテスト対象より高いスコアを示した。ハイエンド市場向けのシングルGPUであることのメリットが最大限に出たといえるだろう。
性能向上に伴って消費電力は“順当に”増加
NVIDIA自慢のGPUクーラーはなかなかに優秀
テストにあたっては,ゲーム用途を想定し,無操作時にもディスプレイの電源がオフにならないよう設定したうえで,OSの起動後30分放置した時点を「アイドル時」,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点を,タイトルごとの実行時とした。その結果がグラフ15だ。
まずアイドル時から見てみると,GTX TITANとGTX 680,HD 7970 GEの間に大きな違いはなかった。もちろん,HD 7970 GEは無操作時にディスプレイの電源がオフになるよう設定した場合,「AMD ZeroCore Power Technology」(以下,ZeroCore)により86Wにまで低下するが,いずれにせよ,GTX TITANだけ極端に消費電力が高いということはない。
一方,各アプリケーション実行時だと,GTX TITANの消費電力は,GTX 680比で70〜110W高く出た。GTX TITANの登場前までは最も消費電力の高いシングルGPUだったHD 7970 GEに対しても7〜63W高いので,GTX TITANでは,シングルGPUとしての最高性能を得るため,ある意味で順当に消費電力が高まってしまったといえるだろう。
NVIDIAがその冷却能力に自信を見せるGPUクーラーの実力をチェックすべく,3DMark 11の30分間連続実行時点を「3DMark 11時」とし,アイドル時ともども,TechPowerUp製のGPU情報表示ツール「GPU-Z」(Version 0.6.7)からGPU温度を取得した結果がグラフ16だ。テスト時の室温は24℃で,システムはケースに組み込まない,いわゆるバラックの状態に置いてある。
各グラフィックスカードが搭載するGPUクーラーはバラバラなので,横並びの比較にそれほど大した意味はなく,スコアが低いからGPUの発熱が低いことを示すものでもない。その点はくれぐれも注意してほしいが,アイドル時,3DMark 11時ともに,GTX TITANのGPU温度はほかのGPUと大差ない結果となった。2688基ものCUDA Coreを集積したGPUを,GPUクーラーはしっかり冷却できているわけだ。
なお,HD 7970 GE CFでアイドル時にセカンダリGPUのスコアがN/Aなのは,ZeroCoreによりGPUへの電力供給が絶たれているため。また,高負荷時にHD 7970 GEのセカンダリGPU温度が極端に低いのは,Sapphire Technologyオリジナルのクーラーが搭載されているためだ。
気になるGPUクーラーの動作音だが,筆者の主観であることを断ったうえで続けると,GTX TITANのそれはさほど気になるレベルのものではなかった。「静音性が非常に高い」とはお世辞にも言えないが,このクラスのグラフィックスカードに搭載されるGPUクーラーとしては問題のないレベルといえる。
ただ,NVIDIAは「GTX 680より静か」と謳っているのだが,少なくとも筆者にはそうは感じられなかったことは付記しておきたいと思う。
温度ターゲットの変更で高クロックでの動作を確認
DPフルスピードモードではGPU Boost 2.0が無効化
ここで19日の記事で紹介したGTX TITANの挙動をいくつか確認しておきたい。
■GPU Boost 2.0では温度ターゲットが設定可能に
まずは,第2世代GPU Boostとなる「GPU Boost 2.0」だ。第1世代GPU Boost(以下,GPU Boost 1.0)についてはGTX 680のレビュー記事後編で細かくチェックしているが,GPU Boost 1.0と同様,GPU Boost 2.0においても,NVIDIA公式のNVIDIA公式のブーストクロック値はひとつの目安でしかないようだ。実際,今回のテスト環境において,GPUコアクロックは最大992MHzまで上昇したのを確認している。
また,「GPU Boostの各種設定を行うには,NVIDIAコントロールパネルではなく,グラフィックスカードメーカーが用意する外部ツールを使わねばならない」点にも変化はない。今回,レビュワー向けにはEVGA製のオーバークロックツール「Precision X」(Version 4.0.0)が提供されたので,本ツールを用いて,GPU Boost 2.0を見て行くことにしよう。
GPU Boost 2.0の目玉要素となる「Temperature Target」(温度ターゲット)は,Precision Xのメインメニュー中央,GPU Boost 1.0でキモだった「Power Target」(電力ターゲット)の設定スライダーの下に,同じく設定スライダーとして用意されている。初期設定は,Temperature Targetが78℃,Power Targetが100%(250W)だ。
Temperature Targetの設定幅は60〜95℃(※GTX TITANでは95℃以下で正常に動作するとされている)。Temperature TargetとPower Targetは標準状態だとリンクしており,たとえば前者を60℃に落とすと,後者も最小設定の60%(150W)に下がり,前者を95℃にまで上げたら後者も最大の106%(265W)にまで上がる,といった具合である。
そこで,試しにリンクを外したうえで,Temperature Targetのみを95℃に設定してみたところ,コアクロックの最大値は992MHzと78℃のときと変わらず。ただ,標準の78℃設定だと,まず992MHzまでGPUコアクロックが上がり,その後,GPUコア温度が78℃に達するとクロックはめまぐるしく変わり,テスト開始1分後には915MHz程度にまで落ちたのに対して,95に設定した状態では,992MHzに達したあとも,GPUコア温度に余裕があるため,1分経過時点でも980MHz程度を維持した(グラフ17)。
もっともGPU Boost 1.0でも,設定変更によってスコアが大きく向上したのは,GPUクロックオフセットによってGPUコアのベースクロックを引き上げ,ファン回転数も合わせて引き上げたときだった。Temperature Targetだけ引き上げても,大きな違いが生じないというのは納得できる話である。
■OverVoltageと「K-BOOST」
[VOLTAGE & TWEAKS]ボタンを押すと開く小ウインドウ。ここからGPUコア電圧の変更を行える | |
GPUコア電圧を変更しようとすると表示されるダイアログ。[Accept]ボタンを押した場合,あとはすべて自己責任となる |
もちろん,GPUコア電圧設定はヘタに弄ると故障の原因になるので,変更はあくまでも自己責任だ。小ウインドウで[OVERVOLTAGE]ボタンをクリックすると,保証外であることを注意するダイアログも表示される。
さて,この小さなウインドウ上に[K-BOOST]という,気になるボタンがあるのに気づいただろうか。実のところこのボタンは,最大ブーストクロックでGPUコアクロックを固定する機能を有効化するためのもので,今回のテストシステムでは,K-BOOSTを有効化すると,コアクロックは常時992MHzで固定されるようになる。グラフ17と同条件でK-BOOST有効時の動作クロック推移を追ったグラフ18でも,確かに動作クロックは固定されていると分かる。
ただし,K-BOOSTを有効化した状態でも,Far Cry 3の平均フレームレートは67.4fpsで,K-BOOST無効時からの明確な違いは生じなかった。なお,K-BOOSTの有効化にあたってはシステムの再起動が必要で,また,SLIでは利用できないという制限があったので,この点は付記しておきたい。
■Display Overclockingは,対応ディスプレイの存在が不明
Pixel Clock OCでは,その名のとおり,スライドバーでピクセルクロックを任意に変更可能だが,これには少し補足説明が必要だろう。ピクセルクロックというのはパネルの各画素を表示するクロックのことで,「ドットクロック」とも呼ばれるもの。計算式は「解像度×リフレッシュレート×ディスプレイごとに異なる定数(※概ね1.2前後)」となっており,1920×1080ドット解像度でリフレッシュレートが60Hz,定数が1.2の場合,ピクセルクロックは149.3MHzになる計算だ。
そこで,垂直リフレッシュレート120Hzに対応するAcer製ディスプレイ「GD245HQ」を接続し,あえてNVIDIAコントロールパネルからリフレッシュレートを60Hzに固定してVsyncを有効にしたところ,ピクセルクロックを初期値の148.5MHzから(80fps化を狙って,3分の4にあたる)198MHzあたりにまで上げてみると,Vsyncが有効な状態でも,NVIDIAコントロール側の設定を超えて,80Hz表示することができた。つまり,Display Overclockが機能すること自体は確認できたわけだ。
ただ,3007WFPではぴくりともしなかったわけで,本当に垂直リフレッシュレート60Hzのディスプレイで,それを超える表示が可能になるのかは,正直,分からないままである。NVIDIAのレビュワーズガイドにも,「すべてのディスプレイに対応しているわけではない」「ユーザー側で試してみる必要がある」と,かなり丸投げ気味のメッセージがあるのだが,「できる」という以上,NVIDIAは対応ディスプレイのリストを示す必要があるのではなかろうか。
なお,EVGAPixelClockOC.exeは,GTX 680カードが導入されたシステムでは動作しなかったことを付記しておく。
■DPフルスピード時はGPU Boost 2.0が無効に
さて,グラフ19は,GTX TITANとしての標準状態,すなわち,「DPの動作クロックがコアクロックの8分の1」とされる動作モードと,DPフルスピードモードの2パターンで,SiSoftware製ベンチマークツール「Sandra 2013 SP1a」(Version 19.29)に用意されたGPGPUテスト「GP(GPU/CPU/APU) Processing」を実行した結果だ。「Aggregate Shader Performance」が総合スコアで,「Native Float Shaders」が単精度浮動小数点演算性能,「Native Double Shaders」が倍精度浮動小数点演算性能を見るテストとなっているが,ここで注目したいのはもちろんNative Double Shaders。DPをフルスピードモードにしたときのスコアは,GTX TITAN標準状態と比べて約5.7倍というスコアを叩き出した。
倍精度浮動小数点演算性能が8倍に届いていない理由は,Native Float Shadersのスコアから読み取れそうだ。DPフルスピードモードのスコアは,ここで標準状態と比べて約83%に留まっており,確認してみると,DPをフルスピードモードにした状態では,GPU Boost 2.0が無効化され,GPUコアクロックが836MHzで固定されていたからである。
実際,DPをフルスピードモードにした状態で3DMark 11のExtremeプリセットを実行すると,そのスコアは標準状態で得られた4985から4300へと,約86%に落ち込んだ。またGPGPU性能もテスト対象となるCiv 5においても,1920×1080ドットの標準設定で平均332.5fpsから平均315.4fpsへと,約95%に下がった。ゲーム用途を前提とした場合には,DPをフルスピード化するメリットは,まずないと述べていいだろう。あくまでも,Tesla K20X的な使い方をしたい人向けの機能ということになりそうである。
史上最速のGPUだが,ネックはその価格
Teslaとして使うなら超バーゲン品!?
その実力は,シングルGPUとしては疑いなく史上最速。マルチGPU構成ではなく,あくまでもシングルGPU構成での性能にこだわりたい人には,かなり魅力的な製品が登場してきたといえるだろう。
問題は1にも2にもその価格である。北米市場におけるメーカー希望小売価格の999ドルでもGTX 680やHD 7970 GEとの性能差を考えると高すぎるくらいだが,国内での販売価格は当初,10万円を大きく超えてくると見られており,この点は相当に大きなネックとなるはずだ。すでにGTX 680やHD 7970 GE(あるいは「Radeon HD 7970」)カードを持っているなら,もう1枚買い足してマルチGPU構成としたほうが,投資に対するリターンは大きいというのも,GTX TITANにとっては逆風となる。
ただ,DPをフルスピードで動作させ,Telsa K20X的に使うことまで考えるなら,むしろ投資効果は非常によくなる。Tesla K20Xカードの価格は北米市場においても3000ドルを超えているため,「Teslaとしての動作保証がなく,ECCもない代わりに,トンデモないバーゲン価格になっているTesla K20X」としての価値はかなり高くなるのだ。
その意味で,GTX TITANをオススメできる対象は,予算に糸目をつけず,純粋に最高性能が欲しい人と,できる限り安価にTesla K20X相当の製品を手に入れたい人ということになるだろう。実に特殊でニッチな製品であり,安易に“GeForce GTX 7xx”の型番を与えなかったNVIDIAは正しかったといえるかもしれない。
スケジュールの都合により,本稿ではひとまず,シングルGPUでのテスト結果をお伝えするに留めたが,GTX TITANが,3-way SLIでどれだけの高みへ到達できるかは,後日,あらためてお伝えする予定だ。ちなみに予告がてらお知らせしておくと,Core i7-3970XをCPUとして採用するドスパラのGTX TITANの3-way SLIで3DMark 11のExtremeプリセットのスコアは12474。シングルGPU構成時の4985からは約2.5倍のスコア向上を示した。
NVIDIAのGeForce GTX TITAN製品情報ページ
- 関連タイトル:
TITAN
- 関連タイトル:
NVIDIA RTX,Quadro,Tesla
- この記事のURL:
キーワード
Copyright(C)2013 NVIDIA Corporation
Copyright(C)2010 NVIDIA Corporation