レビュー
税込39万8000円の「Volta」はゲームでどれだけ速いのか
NVIDIA TITAN V
2018年2月,NVIDIAのAI研究者向けグラフィックスカード「NVIDIA TITAN V」(以下,TITAN V)が国内で発売となった。
TITAN Vは,GPUアーキテクチャ「Volta」世代のGPUを搭載するPCI Express x16接続型拡張カードとして史上初めてグラフィックス出力に対応することで大いに注目を集めてきたが,北米の直販ページ「NVIDIA Store」における価格は2999ドル(税別)と,極めて高価。NVIDIAの国内代理店である菱洋エレクトロの直販価格も39万8000円(税込)で,一般のゲーマー向けとはとても言えない設定だ。
とはいえ,GeForce Driverを導入でき,ゲームでも利用できるとなれば,Volta世代のGPUに秘められたゲーム性能が気になるという4Gamer読者は多いことだろう。今回,菱洋エレクトロから実機を貸し出してもらうことができたので,AI研究者向けグラフィックスカードがゲーム用途でどの程度の性能を発揮できるのか,詳しく見ていきたい。
GTX 1080比で2倍のCUDA Core,そしてTensor Coreも集積し,HBM2と組み合わせたビッグGPUを搭載
Voltaアーキテクチャで,CPUで言うところの「コア」に相当するミニGPUクラスタ「Graphics Processor Cluster」(以下,GPC)は6基構成となる。これは「GeForce GTX 1080 Ti」(以下,GTX 1080 Ti)や「NVIDIA TITAN Xp」「NVIDIA TITAN X」が採用するGPUコア「GP100」と同じだ。
- GV100:6(GPC)
×14(SM) ×64(CUDA Core)=5376 - GP100:6(GPC)
×10(SM) ×64(CUDA Core)=3840
ということで,規模としては1.4倍という計算である。
歩留まり向上のためGV100では4基のSMが無効化されているので,総CUDA Core数は5120基に減るものの,同様にGTX 1080 TiやTITAN Xも2基のSMが無効になって総CUDA Core数は3584基に減っているため,規模感は依然として約1.4倍になっている(※GP100のフルスペックであるTITAN Xpとの規模差は約1.3倍に縮まる)。
ちなみに5120基というCUDA Core数は,「GP104」コアを採用する「GeForce GTX 1080」の,ちょうど2倍だ。
GV100では,SMあたり8基の「Tensor Core」(テンサーコア)を搭載し,フルスペックで664基,TITAN Vでは640基を利用可能になっている点にも注目しておきたい。Tensor Coreは行列同士の積和算を行うための専用プロセッサで,ゲーム用途では少なくとも今のところ無用の長物だが,このTensor Coreを搭載することも,GV100のGPU規模を大きくしている一因であることは押さえておきたい。
GV100は容量128KBのL1キャッシュを持ち,そこから96KBまでをキャッシュメモリとして利用可能となった点もトピックだ。要するに,「L1キャッシュとキャッシュメモリを,目的に合わせて柔軟に使い分けられるようになった」わけである。
なお,6基のGPCで共有するL3キャッシュの容量はフルスペックだと6MBだが,TITAN Vでは一部が無効になって4.5MBとなっている。
TITAN VにおけるHBM2のメモリバスインタフェースは3072bitで,メモリクロックは1.7GHz相当となるため,メモリバス帯域幅は652.8GB/s。これはGTX 1080 Tiの484GB/sに比べると約35%も広い。
なお,後述するテスト環境において,MSIのオーバークロックツール「Afterburner」(Version 4.4.2)からコアクロックを追ってみたところ,ブースト最大クロックは1770MHzに達するのを確認できている。
大規模な電源回路が目を引く基板デザイン。カード上にNVLinkインタフェースあり?
カード長は実測約267mm(※突起部含まず)で,これはGTX 1080 TiやGTX 1080のFounders Editionと同じ。ポリゴンをイメージしたと思われる,三角形状の凹凸が付いた外排気クーラーの外装もそっくりだ。ただ,その外装は銀ではなく金になっているため,見ためはやや豪華な印象である。
補助電源コネクタはGTX 1080 Ti Founders Editionと同じ8ピン+6ピンという構成。外部出力インタフェースも同じくDisplay
GPUクーラーの取り外しはメーカー保証外の行為であり,取り外した時点でメーカー保証は失効することを断りつつ,今回はレビューのため,特別にクーラーを取り外して基板を見ていきたい。
冷静になって確認してみると,VRMはGPUパッケージを挟み込むような形で16+2フェーズ分あり,GPU用と思われる部分のMOSFETには,ドライバICを1パッケージに収めたスマートパワーステージモジュール(=Driver MOSFET,DrMOS)であるON Semiconductor(旧Fairchild Semiconductor)製の「FDMF3170」を,フェーズごとに1基実装する仕様になっている。
GPUとインタフェースとの間に並ぶ,7フェーズ分のVRM。面積を電源部でフル活用している印象がある |
基板裏面にはチップタンタルコンデンサも多数実装。かなり大がかりな電源部であることが見てとれる |
GTX 1080 Ti,そしてCUDA Core数で揃うGTX 1080 SLIと比較。CUDA 9.0ベースのテストも軽く
テスト環境のセットアップに入ろう。
今回は,GTX 1080 Tiのほか,2枚合計でのCUDA Core数がTITAN Vと同じ5120基になる,2-way SLI構成のGTX 1080も,比較対象として用意した。現行のGeForce最上位モデル,そして,GTX 1080のユーザーがもう1枚買い足したケースと比較することで,Volta世代初のグラフィックスカードが持つ実力に迫ってみようというわけである。
利用したグラフィックスドライバは,テスト開始時の最新版である「GeForce 390.77 Driver」。テスト終了とほぼ同時にRelease 390世代の,より新しいドライバが出てしまったが,タイミングの都合ということでこの点はご了承を。
そのほかのテスト環境は表2のとおりだ。マザーボードのUEFI(=BIOS)。そして64bit版Windows 10 Proに対しては,俗に「Spectre」「Meltdown」と呼ばれる3つの脆弱性に対する修正を適用している。
テスト方法は4Gamerのベンチマークレギュレーション21.0に準拠。解像度はTITAN Vのスペックを前提に3840
ccminerは多くの仮想通貨のマイニングに対応しており,マイニングツールとしてCUDA 9.0にもいち早く対応を果たしている。さすがにマイニングではTITAN Vが持つTensor Coreを利用していないようだが,それでもCUDA 9.0に対応したことで,マイニングに用いるアルゴリズムのうちいくつかは高速化を果たしているという。
そこで今回は,CUDA 9.0で高速化したとされるアルゴリズムの中から「Feathercoin」という仮想通貨のマイニングに用いられる「Neoscrypt」,「Maxcoin」のマイニングに使う「Keccak」,「Vertcoin」のマイニングで用いる「Lyra2RE」の3つを取り上げ,マイニング開始から30分後のハッシュレートをスコアとして採用することにした。
テストは,PCでマイニングを行うにあたって一般的に利用される「プールマイニング」で行い,複数のユーザーが協力してマイニングを行う場となる「プール」には,上で挙げた3つをはじめ,多くのアルゴリズムに対応した「MINING POOL HUB」を利用している。
実際には日時やアルゴリズムによってDiff値(難易度)が動的に変化するため,今回のテストも,厳密には横並びの比較にならない。しかし,Diff値が急激に変化することはそれほど多くないため,今回の結果からある程度の傾向は見えてくると考えている。
GTX 1080 Tiをおおむね圧倒するTITAN V。不安定なSLI次第ではトップに立つ
順にテスト結果を見ていきたい。
グラフ1は「3DMark」(Version 2.4.4264)の「Fire Strike」における総合スコアをまとめたものだ。TITAN VはGTX 1080 Tiに対して12〜23%程度高いスコアを示す一方,GTX 1080 SLIの81〜87%程度という位置に甘んじてもいる。
前段でもお伝えしているとおり,TITAN VとGTX 1080 SLIでは総CUDA Core数が揃っているので,3DMarkのSLI最適化度合いと,両者の間にあるGPUコアクロックの違いがこのような結果を生んだという理解でいいのではなかろうか。
続いてグラフ2はそのFire StrikeにおけるGPUテスト結果「Graphics score」を抜き出したものとなる。
Graphics scoreにおけるTITAN Vのスコアは,対GTX 1080 SLIで77〜79%程度,対GTX 1080 Tiで119〜126%程度となり,総合スコアと比べて,GTX 1080 SLIからの「引き離され度合い」が大きくなっている。CPUのスコアへの影響がなくなったことで,GPUコアクロックの違いが色濃く出たということなのだろう。
3DMarkのDirectX 12ベンチマークである「Time Spy」,その総合スコアはグラフ3に,Graphics scoreはグラフ4にまとめた。
ここで注目したいのは,総合スコアでTITAN VがGTX 1080 SLI比90〜97%程度にまでスコア差を詰め,GTX 1080 Tiに対しては28〜35%程度とスコア差を詰めていることだ。DirectX 12タイトルではGPUアーキテクチャが同じ場合は規模勝負になりやすいので,この結果はさもありなんといったところである。
グラフ5〜7は「Prey」の結果だが,解像度2560
GTX 1080 SLIのスコアが伸び悩んでいるのは,3DMarkほどにはPreyがSLIへ最適化されていないためだと思われるが,それでもTITAN Vが最も高いスコアというのは衝撃的である。
それに対し,ゲーム側がSLIへきちんと最適化できている場合,TITAN Vは動作クロックなどの理由でGTX 1080 SLIから置いて行かれることの好例となったのが,グラフ8〜10にスコアをまとめた「Overwatch」である。ここでTITAN Vは,GTX 1080 Tiに対して23〜26%高いスコアを示す一方,GTX 1080 SLIに対しては74〜82%程度に留まった。
ただ,ここで注目すべきは力関係よりむしろ,1920
そもそもSLIに対応していないゲームを前にするとどうなるか。それが分かるのが「PLAYERUNKNOWN'S BATTLEGROUNDS」(以下,PUBG)である(グラフ11〜13)。1920
Preyと同様,高解像度になるにしたがって平均フレームレートでGTX 1080 Tiとのギャップを広げていき,3840
グラフ14〜16にスコアをまとめた「Middle-earth: Shadow of War」(以下,Shadow of War)でも,傾向はPUBGをおおむね踏襲しているのが分かる。
SLIが逆効果になって振るわないGTX 1080 SLIを尻目に,TITAN VはGTX 1080 Tiに対して平均フレームレートで17〜35%高いスコアを示した。ちなみに,ベンチマークレギュレーションが合格ラインとする「最小30fps」を3840
「Tom Clancy’s Ghost Recon Wildlands」(以下,Wildlands)のテスト結果がグラフ17〜19だ。
WildlandsではGTX 1080 SLIが再び息を吹き返し,結果として,TITAN Vのスコアはその88〜91%程度に落ち着いた。対GTX 1080 Tiでは105〜111%程度で,やはり,高解像度ほどスコア差は広がっている。
続いてグラフ20は「ファイナルファンタジーXIV: 紅蓮のリベレーター ベンチマーク」(以下,FFXIV紅蓮のリベレーター ベンチ)の総合スコアとなる。
FFXIVはSLIに対応するため,スコアとしては2番手になるが,GTX 1080 Tiに対して6〜30%程度高いスコアを示し,3840
グラフ21〜23はFFXIV紅蓮のリベレーター ベンチにおける平均フレームレートと最小フレームレートをまとめたものだが,ここで注目したいのは,GTX 1080 SLIで最小フレームレートが明らかに落ち込んでいることだ。平均フレームレートを見ただけだと問題ないように見えて,実プレイ時にカクついたりすることがあるのは「SLIあるある」なのだが,ここでもその傾向は出ているというわけである。
翻って主役のTITAN Vは,3840
グラフ24〜26は「Forza Motorsport 7」(以下,Forza 7)の結果だが,Forza 7もSLIに対応していないため,GTX 1080 SLIはGTX 1080のシングルカード動作的なスコアに落ち付き,結果としてTITAN Vのスコアが抜きん出た格好になっている。対GTX 1080 Tiでは,平均フレームレートで4〜14%,最小フレームレートでは安定的に42〜43%高いスコアだ。
性能検証の最後はccminerの結果だが,ここでSLIは意味をなさないので,「2基のGTX 1080を並列動作させたもの」と捉えてほしい。
Lyra2REのみスコアの数字が残る2条件と比べて大きく異なるため,見やすさの観点からグラフ27,28の2つに分けたが,NeoscryptとKeccakだとTITAN VはGTX 1080 Tiに対して32〜36%程度高いスコアを示すものの,GTX 1080
一方,Lyra2REではTITAN Vが逆転を果たし,GTX 1080×2に対して約11%高いスコアを示した。
Lyra2REでTITAN VがGTX 1080×2を上回っているのはなかなか衝撃的だが,ではなぜ,TITAN Vが上回ったのだろうか。想像の域を出ないものの,NVIDIAはGV100で,1クロックで同時に仕掛けられるデータスレッド数を2倍にしているので,それがLyra2REの処理で奏功したのかもしれない。
消費電力はおおむねGTX 1080 Tiと同じ。ただ瞬間的に300Wを超える頻度が高い
TITAN Vの消費電力と,クーラーの冷却能力もチェックしておきたい。
グラフ29は,「4Gamer GPU Power Checker」(Version 1.1)を用いて,FFXIV紅蓮のリベレーター ベンチ実行中におけるカード単体の消費電力を測定したものになる。なお,4Gamer GPU Power Checkerはシングルカードの消費電力計測に特化したシステムなので(関連記事),GTX 1080 SLIのスコアがない点はご了承を。
さて,波形を見てみると,TITAN V,GTX 1080 Tiともに,消費電力はおおむね200W台を推移していると分かる。このグラフデータから中央値を求めたグラフ30を見ても,TITAN Vの消費電力はGTX 1080 Tiとだいたい同じということが言えるだろう。
ただ,あらためてグラフ29に戻ってみると,300W超級のスコアを示す頻度は,GTX 1080 Tiと比べて,TITAN Vのほうが明らかに高い。どちらもTDP(Thermal Design Power,熱設計消費電力)は250Wだが,消費電力的にはTITAN Vのほうがやはりシビアという理解でよさそうだ。
参考までに,ログの取得が可能なワットチェッカー「Watts up? PRO」を用い,システム全体の最大消費電力で比較したものがグラフ31だ。テストにあたっては,ゲーム用途を想定し,無操作時にもディスプレイの電源がオフにならないよう指定したうえで,OSの起動後30分放置した時点を「アイドル時」,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点を,タイトルごとの実行時としている。
GTX 1080 SLIはPUBGやForza 7でSLIがうまく機能していない影響が出ているものの,全体としては頭一つ抜けた印象だ。
続いては金色のGPUクーラーが持つ冷却能力だ。ここでは3DMarkの30分間連続実行時点を「高負荷時」とし,アイドル時ともども,TechPowerUp製GPU情報表示ツール「GPU-Z」(Version 2.8.0)からGPU温度を取得することにした。テスト時の室温は約24℃。テスト環境は机上に,いわゆるバラックの状態で置いているが,その結果がグラフ32だ。
温度センサーのデータ取得方法がテスト対象のすべてで同じとは断言できず,横並びの評価にあまり意味はない。その点はくれぐれも注意してほしいが,TITAN Vの搭載するクーラーは,現行世代のGeForceを搭載するFounders Editionと同様の温度制御をしていると信ずるに足るデータが出ている。アイドル時だけは若干高めなので,ひょっとするとファン回転数の制御周りは何か異なっている可能性もあるだろう。
というのも,筆者の主観であることを断ってから続けると,ファンの動作音に大きな違いを感じなかったためだ。TITAN Vの動作音はGTX 1080 Ti Founders Editionと変わらない印象で,もっと言えば,それほどうるさくは感じない。
価格対性能比の観点からはとても勧められないが,史上最速のグラフィックスカードであることは間違いない
以上,TITAN Vのテストを行ってきたが,TITAN Vの評価よりも先にしなければならないのは,一昔前と同じようには,2-way SLIの効果が得られないことへの指摘のほうではなかろうか。それこそWindows 7〜8時代だと,世界規模の主要なタイトルはかなりの割合で2-way SLIに対応していたが,いまやNVIDIAが開発に関わっていたり,マーケティング活動を共同で行っていたりするようなタイトルですら,SLIに対応していないものが増えてきているのだ。
「GTX 1080カードを持っているなら,あと1枚購入して,SLIで性能ブースト」と気楽に言うことはできなくなってきている。この点は押さえておきたい。
ただそれは,テストする前,もっと言えば北米市場の直販価格が明らかになった時点ですでに分かっていたことであり,今さらそんなことを言っても始まらないだろう。2018年3月時点における史上最速のグラフィックスカードはTITAN Vであると理解したうえで,遠く足音の聞こえだしてきている次世代GeForceの登場を待つというのが,一般的なPCゲーマーの正しい姿勢かもしれない。
NVIDIAのTITAN V製品情報ページ
菱洋エレクトロのTITAN V 製品情報ページ
- 関連タイトル:
TITAN
- 関連タイトル:
Volta(開発コードネーム)
- この記事のURL:
Copyright(C)2013 NVIDIA Corporation