レビュー
249ドルの新世代ミドルクラスGPUも,絶対性能と消費電力対性能比がインパクト大
GeForce GTX 1060
(GeForce GTX 1060 Founders Edition)
7月7日の記事でお伝えしているとおり,国内市場ではカードメーカー各社のオリジナルデザイン版カードのみが正規流通することとなりそうだが,今回4Gamer.netでは,北米市場限定のNVIDIA直販版となる「Founders Edition」を入手できたので,これを事実上のリファレンスカードとして扱いつつ,GTX 1060という注目のGPUが持つ性能に迫ってみたい。
※本稿はカード概観パートを米田 聡氏,GPU仕様解説パートとテストパートを宮崎真一氏が担当しています。
GP104の6割強という規模になるGTX 1060。GTX 1070より高いブーストクロックにも注目
そのプロセッサ規模はGeForce GTX 980(以下,GTX 980),そしてGTX 1060が直接置き換えることになる「GeForce GTX 960」(以下,GTX 960)と比較したほうがいいだろうということで,トランジスタ数とダイサイズを以下のとおりまとめてみた。
- GTX 1060(GP106):トランジスタ数44億個,ダイサイズ約200mm2
- GTX 1080&1070(GP104):トランジスタ数約72億個,ダイサイズ約314mm2
- GTX 980(GM204):トランジスタ数約52億個,ダイサイズ約398mm2
- GTX 960(GM206):トランジスタ数約29.4億個,ダイサイズ約227mm2
Pascalアーキテクチャでは,シェーダプロセッサ「CUDA Core」32基とスケジューラやロード/ストアユニット,超越関数ユニット(以下,SFU),L1キャッシュ,テクスチャユニット,そしてジオメトリエンジン「PolyMoprh Engine 4.0」を組み合わせて演算ユニット「Streaming Multiprocessor」(以下,SM)を構成したうえで,5基のSMをひとまとめにして,そこにラスタライザ「Raster Engine」を加えたものをミニGPUコア「Graphics Processing Cluster」(以下,GPC)として扱うわけだが,そのGPC数はGP104の半分となる2基だ。当然のことながら,総シェーダプロセッサ数もGT104のフルスペック比で半分の1280基となる。
ただし,L2キャッシュ容量はGP104の2MBに対して1.5MBとなり,32bitメモリコントローラを6基搭載する192bitインタフェース仕様といった具合に,メモリ周りの規模だけは上位モデル比で75%の規模となっている。これはL2キャッシュ容量が1MBで,メモリコントローラが128bit仕様というGTX 960に対する明確な差別化ポイントと言えるだろう。
ちなみに,後述テスト環境で,MSI製のオーバークロックツール「Afterburner」(Version 4.3.0 Beta)からGTX 1060 Founders Editionの動作クロックを追ったところ,GTX 1060の最大クロックは1885MHzに達していた。
表1は,そんなGTX 1060のスペックを,GTX 1070とGTX 980,GTX 970,GTX 960,それに競合製品となる「Radeon RX 480」(以下,RX 480)および「Radeon R9 390X」(以下,R9 390X)とともにまとめたものとなる。
ファンコネクタの特殊レイアウトがどうなっているかを分解して確認
背面側から確認すると,基板長は実測約174mm(※突起部除く)しかないのもポイントだ。クーラーがカード後方に延びた格好となっているため,カード長は同249mmとなっているが,カードメーカーの工夫次第で,短尺カードが市場を賑わすという可能性は大いに考えられよう。
7月7日の記事でお伝えしているとおり,GTX 1060 Founders Editionでは,6ピンの補助電源コネクタが基板上になく,カード後方に引き回されている。その理由をNVIDIAは「基板の後方に6ピンコネクタはあったほうが,補助電源ケーブルを引き回しやすいから」としているが,おそらくはそのために,こういうクーラー構造を採用する必要があったのではなかろうか。
クーラーを完全に取り外した状態から,この特殊な6ピンコネクタを確認してみると,“引き出し元”の基板側では,ファン用の4ピン電源コネクタを挟むような格好で,6ピンコネクタを引き出すケーブルががっちりと基板に半田付けしてあるのが分かる。
基板に対するケーブルの半田付けは手作業による工程となるケースが多く,ほとんどの場合においてコストアップ要因となる。なので,メーカー的にはあまり採用したくない構造なのだが,2本の12V合計10A以上が流れるだけに,半田付けがベストではある。
コネクタにはわずかとはいえ接点抵抗があり,それによる電圧降下と発熱が生じるため,コネクタの数はできるだけ少ないほうがいい。だからこそ,わざわざコストを掛けてまで半田付けしているのだろう。
一方,GPUの放熱を担うヒートシンクはかなり小ぶりだ。一見するとごく普通のヒートシンクに見えるが,GPUと接する銅のプレートから2本のヒートパイプがヒートシンク全体に熱を運ぶ仕様になっている。
それなりに手の込んだヒートシンクではあるものの,上位モデルの「Vapor Chamber」(ヴェイパーチャンバー)採用モデルと比べると,明らかにシンプルだ。GTX 1060のTDP(Thermal Design Power,熱設計消費電力)は120Wなので,この程度の放熱システムで十分に処理できるということなのだと思われる。
基板全景 |
Samsung Electronics製のK4G80325FB-HC25。256Mx32(8Gbit)のメモリチップを,GTX 1060 Founders Editionは6枚搭載している |
メモリチップはSamsung Electronics製の「K4G80325FB-HC25」(8Gbit,8Gbps品)だった。GTX 1060のメモリクロックは8GHz相当なので,スペックどおりの仕様を持つGDDR5メモリを搭載するということになる。
x32bitのメモリチップが6枚で,対するGP106コア側のメモリバス幅は192bitなので,こちらもスペックどおりだが,気になるのはメモリチップ用の空きランドが2個ある点だ。
この空きランドについて,NVIDIAはこれといった説明を行っていないのだが,最も可能性が高いのは,「x16のGDDR5メモリ8枚を使った,グラフィックスメモリ容量4GBモデルを,同じ基板デザインで展開できるようにしている」というシナリオだ。その場合,GP106のメモリコントローラは余ってしまうが,メモリコントローラを2基潰して128bit接続とした下位モデル――devicequerydrv.exeの実行結果から推測するに“GeForce GTX 1060 4GB”か?――が控えているというのは,十分にあり得る話だろう。
採用するキャパシタやインダクタはGTX 1080およびGTX 1070のFounders Editionのそれとあまり変わらない。おそらく高価かつ高性能なタンタル電解コンデンサと思われる,「330」刻印入りコンデンサを多めに盛っているあたりがFounders Editionの証といったところか。
NVIDIAの説明によると,上位モデルのFounders Editionと同様にGTX 1060 Founders Editionでも電源の低インピーダンス化を図っており,2GHzを超えるオーバークロックにも耐えられるとのことだ。
HDMIのトランスミッタやDisplayPort関連のLSIは見当たらないので,GP106側に集積しているのであろう。16nm FinFETプロセスにこれらの機能を詰め込むのはそれなりに大変な気もするが,結果として外付け部品はかなり少なく済んでおり,だからこそ低コストで,かつ小さい基板を実現できているのだと思われる。
GTX 1070やGTX 980など6製品と比較。DX12のテストではTime Spyを追加
さて,テストの準備に入ろう。
今回,GTX 1060の比較対象には,表1でその名を挙げたGPUを用意した。ただし,GTX 960カードとして用意したGIGA-BYTE TECHNOLOGY製「GV-N960WF2OC-2GD」と,R9 390XカードのTul製「PowerColor PCS+ R9 390X 8GB GDDR5(AXR9 390X 8GBD5-PPDHE)」は,メーカーレベルで動作クロックを引き上げられたクロックアップモデルであるため,Afterbunerを用いてリファレンスレベルにまで動作クロックを引き下げて利用している。
クーラーの性能が異なるため,リファレンスカード相当の性能が完全に得られるわけではないというか,多少なりとも高いスコアは出るはずだが,そもそもGTX 960もR9 390Xもリファレンスカードの存在を確認できていないので,ここはやむを得ないものとして話を進めることをお断りしておきたい。
また,RX 480は,性能が最大となるよう「Compatibility Mode」(互換モード)を無効化したまま使う。「Compatibility Modeとは何か」という話は7月8日掲載のテストレポートを参照してほしいが,簡単にいえば,RX 480のテストでは,ドライバの標準設定を用いるということである。
GeForceシリーズのテストにあたって用いるグラフィックスドライバは,NVIDIAから全世界のレビュワーに対して配布となった「GeForce 368.64 Driver」だ。NVIDIAからはそれよりも新しい「GeForce 368.81 Driver」が北米時間7月15日付けでリリース済みだが,368.81ドライバはGTX 1060をサポートしないため,今回は368.64ドライバで統一する。
一方のRadeonでは,テスト開始時の最新版となる「Radeon Software Crimson Editon 16.7.2 Hotfix」を用いる。
そのほかテスト環境は表2のとおり。CPUの自動クロックアップ機能「Intel Turbo Boost Technology」は,その挙動がテスト状況によって変わる可能性を排除すべく,同機能をマザーボードのUEFI(≒BIOS)から無効化した。
テスト方法は基本的に4Gamerのベンチマークレギュレーション18.0準拠。ただし,DirectX 12のテストとして,「3DMark」(Version 2.1.2852)の「Time Spy」と「Ashes of the Singularity」(以下,AotS)のテストを追加し,さらにVR(Virtual Reality,仮想現実)関連のテストとして「SteamVR Performance Test」も用意している。
Time Spyは,GPUあたり連続して2回実行し,高いほうの総合スコアを採用する(関連記事)。AotSでは,グラフィックス設定プリセット「Standard」あるいは「Extreme」を選択し,ゲーム側に用意されたベンチマークモードを用いる。AotSを用いたGPU検証記事における手法を踏襲するという理解でいい。
SteamVR Performance Testは,Valveの「Apertureロボット修理 VRデモ」を使って,視覚忠実度がどのくらいかを見るものだ。本テストのみ,グラフではなく,スクリーンショットで比較することになる。
なお,GTX 1060がGTX 980と同等の性能とされていることから,テスト解像度は1920
NVIDIAの言い分どおり,GTX 980と同等のスコアを示すGTX 1060。GTX 1070とは大差が付く
以下,いずれのグラフも,GTX 1060を一番上に置き,その下には比較対象のGeForceとRadeonをいずれもモデルナンバー順で並べている。ただし,グラフ画像をクリックすると,より負荷の高いテストにおけるスコア順に並び替えたもう1つのグラフを表示するようにしてあるので,適宜そちらも参照してほしいと述べつつ,テスト結果を順に見ていこう。
3DMarkの結果は,グラフ1にレギュレーション18.0準拠となるDirectX 11版テスト,グラフ2にDirectX 12版テストと,個別にまとめているが,GTX 1060のスコアはDirectX 11版テストでGTX 980の約98%,DirectX 12版テストでは約103%なので,ほぼ互角と述べていい。
それ以外のGPUと比較してみると,まず,対GTX 1070では大差を付けられており,カードメーカーのクロックアップモデルが登場したとしても,このギャップを埋めるのはほぼ不可能であろうということが言える。置き換え対象となるGTX 960に対しては63〜69%程度という圧倒的なスコア差を示し,GTX 970に対しても12〜17%高いスコアである。
競合製品との比較だと,まず,北米市場におけるメーカー想定売価でいい勝負となる対RX 480で,DirectX 11版テストにおいて7〜12%,DirectX 12版テストにおいて約4%高いスコアを示している。ただ,意地悪く言えば,後者ではスコア差を詰められているわけで,ここはちょっと気になるところだ。
対R9 390Xだと,スコアは一進一退といったところ。DirectX 11版テストで97〜102%程度,DirectX 12版テストで約98%だから,いい勝負と述べていいのではなかろうか。
グラフ3,4は「Far Cry Primal」の結果だ。
ここで注目したいのはGTX 1060とGTX 980の力関係で,言ってしまえば3DMarkと同じ傾向なのだが,相対的に描画負荷の低い「ノーマル」プリセットだとGTX 1060はGTX 980の92〜94%程度で,「同等のスコア」と呼ぶには厳しい感じなのだが,描画負荷が高くなる「最高」プリセットだと,逆に約105%と,「むしろGTX 980に対して優勢」といったスコアを示すのである。
スペックとして出ている数字だけで比較すると,GTX 1060がGTX 980より優れているのはGPUコアクロックとメモリクロック,メモリ容量くらいで,高負荷環境におけるスコアを左右するメモリバス帯域幅でも192GB/s対224.3GB/sでGTX 1060はGTX 980に及ばないのだが,「GP104でGM204の約1.2倍」とされるメモリバスの利用効率などが,GP106でもプラスに働いているということなのだろう。
GTX 970やGTX 960,そしてRX 480との関係も同様で,GTX 1060のスコアが良好なのは最高プリセットのほうだ。とくに対RX 480で7〜10%程度高いというのはなかなか感慨深い。
ただ,512bitメモリインタフェースを持つR9 390Xにはそれでもさすがに歯が立たなかった。
続いて「ARK: Survival Evolved」(以下,ARK)の結果がグラフ5,6となる。ARKに対してはRadeon Software側の最適化が不足しており,とくに「Low」でスコアが荒れるため,モデルナンバー順のグラフは少々見づらい。ぜひグラフ画像をクリックして,スコア順のグラフを見てもらえればと思うが,GTX 1060とGTX 980の関係に着目すると,傾向そのものは「描画負荷が高くなればGTX 1060が優勢」という点で,Far Cry Primalと比較的似た印象を受ける。
ただ,GTX 1070とのギャップがかなり開き,「High」設定の1920
グラフ7,8は「Tom Clancy’s The Division」(以下,The Division)の結果となる。
The DivisionでGTX 1060は,GTX 980およびR9 390Xとほぼ同等のスコアを示し,GTX 970に対しては6〜11%程度,GTX 960に対しては54〜62%程度引き離した。ただ,先のレビュー記事でもそうだったように,RX 480はThe Divisionで良好なスコアを示すこともあり,GTX 1060は対RX 480だと97〜100%程度のスコアと,北米市場におけるメーカー想定売価が249ドル対239ドル(いずれも税別)で,「10ドル高い分」のメリットを示すことができていない。
「Fallout 4」の結果がグラフ9,10だ。
Fallout 4では1920
「ファイナルファンタジーXIV:蒼天のイシュガルド ベンチマーク」(以下,FFXIV蒼天のイシュガルド ベンチ)でも,GTX 1060とGTX 980は似たようなスコアになっている(グラフ11,12)。GameWorksタイトルということもあり,対RX 480では15〜31%程度,対R9 390Xでは9〜28%程度と,かなり大きなスコア差を付けている点にも注目しておきたい。
スクウェア・エニックスの示すスコアの見方だと,最高指標である「非常に快適」のラインはおおむねスコア7000。GTX 960はおろか,GTX 970でも若干届いてないところを,GTX 1060が悠々と超えている点は評価できるだろう。
平均フレームレートでスコアを確認したいという人のため,平均フレームレートベースのグラフ11’,12’も載せておくので,必要に応じて参照してほしい。
グラフ13,14にスコアをまとめた「Project CARS」では,Radeon Software側の対応が不十分なこともあって,RX 480とR9 390Xのスコアが伸び悩んでおり,結果,GTX 1060は競合製品に対して有意に高いスコアを示すことができている。
GeForce同士の比較だと,解像度1920
DirectX 12版のテストとなるAotSのスコアがグラフ15,16で,GTX 1060は,RX 480に対して1〜10%程度高いスコアを示す一方,R9 390Xに対しては85〜95%程度と,やや離されている。
もっとも,より実態に則した評価はおそらく,「トップがGTX 1070,2番手がR9 390X」で,GTX 1060とRX 480,GTX 980は3番手グループを形成している」というものだとは思う。
最後に,SteamVR Performance Testの結果を,スクリーンショットで示す。GTX 1060のスコアは「レディ」の枠内で,「平均忠実度」は8.1と,7.7のGTX 980を上回った。SteamVR Performance Testの場合,レディの枠内でも,より高い「高忠実度のVRに必要な推奨のパフォーマンスを上回っています」と「高忠実度のVRに必要な推奨のパフォーマンスに十分です」と2つの指標があるのだが,今回,前者の枠に入ったのはGTX 1060とGTX 1070,R9 390Xの3製品のみだった。
置き換え対象のGTX 960はレディにすら入れていないわけで,VR性能もミドルレンジ市場向けGPUとして十分に高いと言っていい。RX 480ともども,VR環境の裾野を広げる存在になってくれそうだ。
GTX 1060の消費電力はGTX 960+α程度。GTX 980と比べると数十Wは低い
本稿の序盤でもお伝えしたとおり,GTX 1060のTDPは120Wで,これはGTX 960と同じスペックである。また,これは消費電力周りが話題を集めたRX 480と比べると30W低い数字でもあるわけだが,実際のところ,GTX 1060は本当に,GTX 960並みの消費電力で済んでいるのか。ログの取得が可能なワットチェッカー「Watts up? PRO」を用い,システム全体の消費電力で比較を行ってみよう。
テストにあたっては,ゲーム用途を想定し,無操作時にもディスプレイの電源がオフにならないよう指定したうえで,OSの起動後30分放置した時点を「アイドル時」,各アプリケーションベンチマークを実行したとき,最も高い消費電力値を記録した時点を,タイトルごとの実行時とすることにした。
その結果はグラフ17のとおりだ。GTX 1060は,アイドル時にテスト対象の中で唯一50Wを下回っただけでなく,アプリケーション実行時の消費電力もGTX 960と比べて3〜19W高いだけだ。GTX 980と比べると56〜69W,そして直接の競合であるRX 480と比べても27〜54W低い。TDP 120Wの枠内で,GTX 960より消費電力が若干増したのは間違いないが,それでも,GTX 980並みの3Dゲームベンチマークスコアを示すGPUとしては,驚異的なスコアだと言っていいだろう。
最後にGPUの温度も確認しておきたい。3DMarkの30分間連続実行時点を「高負荷時」とし,アイドル時ともども,TechPowerUp製のGPU情報表示ツール「GPU-Z」(Version 1.9.0)からGPU温度を取得した結果がグラフ18だ。
テスト時の室温は24℃で,システムはPCケースに組み込まず,いわゆるバラック状態に置いている。また,GPUごとに温度センサーの位置も温度の制御法,GPUクーラーすら異なるため,横並びの比較に意味はない点は注意してもらいたい。
というわけでGTX 1060のスコアだが,アイドル時に30℃台前半,高負荷時に70℃台前半と,まったく危なげない。大口径ファンを搭載するオリジナルクーラーを搭載したモデルなら,さらに低い温度や高い動作クロックを実現したり,あるいはカードサイズを小さくしたりといったことも容易だろうと窺わせるスコアだ。
気になる動作音だが,筆者の主観であることを断ったうえで述べると,「静音性が高い」とまでは言えないものの,ミドルクラス市場向けとして比較的静かな印象を受けた。少なくともGTX 1070よりも動作音が小さいことは間違いない。
価格的にはGTX 960の後継と言いがたいが,高いだけの価値はあるGTX 1060
GTX 1060の発表時に掲載した記事で,日本でGTX 1060 Founders Editionが登場する予定はなく,カードメーカー各社のカードがいきなり店頭に並ぶという話はお伝え済みだが,気になるその“初値”は,税込でざっくり3万円台後半から約4万円にまとまるようだ(関連記事)。
北米市場におけるメーカー想定売価は249ドル(税別)なので,さすがにちょっと高い。とくに,置き換え対象となるはずのGTX 960は税込2万円台前半の値付けも珍しくないだけに,「GTX 960を置き換える後継製品」と考えるのは難しいのではなかろうか。2016年7月19日現在,税込3万円台後半から4万円くらいまでの市場には,流通在庫となったGTX 970がいるので,むしろGTX 970の後継と考えたほうがいいかもしれない。
いずれにせよ,「ミドルクラス市場向けGPUが税込で4万円近い価格」というのに,抵抗を覚える人はいると思う。
それでいて消費電力はGTX 980と比べて数十Wというレベルで低く,GTX 960より少し高い程度に収まっている。GTX 960が動いているようなPCからでも,電源ユニットの容量不足をあまり考えることなく差し替えられるのを歓迎する人は多そうだ。
そういうわけで,GTX 1060は,ミドルクラス市場向けの新GPUとしては高い価格設定ながら,一世代前のハイエンド市場向けGPUと同じ性能が,カードメーカー各社のオリジナル設計込み4万円以下で手に入る存在として,価値があるということにもなるだろう。
店頭価格があともう少し下がると,人気に火が点くのではなかろうか。
NVIDIAのGTX 1060製品情報ページ
- 関連タイトル:
GeForce GTX 10
- この記事のURL: