ニュース
AMD,Northern Islands世代のハイエンドGPU「Radeon HD 6900」を発表。コアアーキテクチャの刷新がキモ
最大の特徴は,先に発表されたRadeon HD 6800シリーズから,「Thread Processor」(スレッドプロセッサ)の構成を変更したこと。シェーダプロセッサ「Streaming Processing Unit」(「Stream Processor」ともいう。以下 SP)あたりの演算能力を向上させた「VLIW4」エンジンの採用により,ハードウェア仕様の改良が図られている。
実際のパフォーマンスは別途掲載しているレビューを参照してもらうとして,本稿では,AMD担当者の独占インタビューも交えながら,新製品の概要を説明してみたい。
HD 6970とHD 6850,両GPUの主なスペックは下記のとおりだ。
●Radeon HD 6970
- Streaming Processing Unit数:1536基
- Texture Unit数:96基
- GPUコアクロック:880MHz
- メモリクロック:5.5GHz相当(実クロック1.375GHz)
- グラフィックスメモリ:容量2GB,GDDR5 SDRAM
- ROP数:32基
- ディスプレイインタフェース:DVI-I×2(Dual-Link,Single-Link各1),Mini DisplayPort×2,HDMI×1
- 電源供給:8ピン×1 + 6ピン×1
- 最大消費電力:250W
- ゲームプレイ時の典型的な消費電力:190W
- アイドル時の消費電力:20W
- 市場想定価格:369ドル
●Radeon HD 6950
- Streaming Processing Unit数:1408基
- Texture Unit数:88基
- GPUコアクロック:800MHz
- メモリクロック:5GHz相当(実クロック1.25GHz)
- グラフィックスメモリ:容量2GB,GDDR5 SDRAM
- ROP数:32基
- ディスプレイインタフェース:DVI-I×2(Dual-Link,Single-Link各1),Mini DisplayPort×2,HDMI×1
- 電源供給:6ピン×2
- 最大消費電力:200W
- ゲームプレイ時の典型的な消費電力:150W
- アイドル時の消費電力:20W
- 市場想定価格:299ドル
VLIW4コアアーキテクチャの採用で
総SP数を減らしつつ性能を引き上げる
- 浮動小数点演算と整数演算,論理演算,比較演算を担当する4基の32bit浮動小数点スカラ演算器
- 指数や対数,三角関数などの複雑な演算機能をサポートする超越関数(Transcendental Function)ユニット1基(※AMDはこれを「T-unit」と呼んでいる)
という,4+1仕様で,SPを実装。これに,分岐ユニット(Branch Unit),汎用レジスタ(General Purpose Register)群を組み合わせたものになっていたというのは,記憶している読者も多いだろう。
誤解を恐れずに少々乱暴な言い方をしてしまえば,VLIW5ベースの製品に対して5分の4となるコア数で,同等の性能を実現しようというのが,VLIW4コアアーキテクチャのキモだ。
Radeon HD 6900シリーズは,Radeon HD 6800シリーズやATI Radeon HD 5000シリーズと同じTSMCの40nmプロセスで製造され,26億4000万トランジスタを集積。ダイサイズは389mm2なので,ATI Radeon HD 5800シリーズの21億5000万トランジスタ,334mm2と比べれば,SPのサイズが20%程度大きくなったことになり,辻褄が合う計算だ。
ここしばらく,GPUの新製品発表と同時にダイ写真を公開してきたAMDが,開発コードネーム「Barts」(バーツ)ことRadeon HD 6800シリーズや,今回のRadeon HD 6900シリーズの発表にあたってもダイ写真は一切公開していないのは,なかなか気になるところである。
ともあれ,Radeon HD 6970の1536基というSP数は,1600 SP仕様だった「ATI Radeon HD 5870」(以下,HD 5870)の性能を上回るには十分な数とも言えそうだ。実際,GPUコアクロックとメモリクロックの引き上げ効果もあって,HD 6970の3D性能はHD 5870比で20%程度の向上を実現できたと,AMDはアピールしている。
完全なるデュアルコアデザインを実現
ROPや電力制御周りにも重要な拡張が
Radeon HD 6900シリーズでは,VLIW4コアアーキテクチャの採用以外にも,アーキテクチャ面で改良が加えられている。それが,ブロックダイアグラムを示したとき軽く触れた“デュアルコアデザイン”だ。
Caymanコアでは,Bartsコア(まで)で1基だった「Graphics Engine」(グラフィックスエンジン)の数を2基に増やした。これにより,「Command Processor」(コマンドプロセッサ)の後段,Graphics Engineから「Ultra-Threaded Dispatch Processor」(ウルトラスレッド・ディスパッチプロセッサ),「SIMD Engine」クラスタまでが完全な2系統に分かれ,2つのSIMD Eigineクラスタをより効率的に制御できるようになったのだ。完全なデュアルコアGPUデザインを実現したというわけである。
また,搭載されるテッセレーションユニット「Tessellator」(テッセレータ)も第8世代へ進化し,第6世代のそれを搭載していたATI Radeon HD 5800シリーズと比べて最大3倍のテッセレーション性能を発揮するようになったという。
さらに,「Render Back-End」(レンダーバックエンド)も強化され,複数の命令を同時書き込みできるようにすることで,16bit整数演算で2倍,32bit浮動小数点演算では2〜4倍の性能向上を果たしているとのことだ。
EQAAのサンプリングイメージ。,8x EQAAでは8つのカラー値と16のZ値によるアンチエイリアシング処理を可能にする |
EQAAは,Catalyst Control CenterのAAモードから設定可能。パフォーマンスへのインパクトは最小限に抑えられるという |
現在,一般的なデスクトップPC向けGPUでは,2Dモードと最大動作クロックの2段階か,負荷の低い3Dアプリケーションに向けた動作モードも含めた数段階程度にしか動作クロックを切り替えられない。そのため,高解像かつ高精度のアンチエイリアシングを適用した環境で最新のゲームをプレイしたり,ベンチマークソフトを実行したり,それこそ「OCCT」や「FurMark」のような,通常の3Dアプリケーションでは生じ得ない状況を作り出すソフトウェアを実行したりした場合,ときとして規定されたTDP値を超えた消費電力で動作してしまう場合がある。
ただ,こうした状況を続けると,GPUの温度が上がりすぎ,保護回路が働いて動作クロックががくっと落ち,いきおい,性能も大きく落ちることになる。
Radeon HD 6900シリーズの投入に合わせて投入された「Catalyst 10.12」では,「Catalyst Control Center」に,GPUの最大消費電力値を設定するスライドバーが加わり,これによってユーザーは,GPUの消費電力上限を,定格±20%の範囲で設定できるようになる。
Catalyst Control Centerから消費電力のリミットを+5%,+10%といった具合に引き上げると,PowerTuneによるフレームレート向上率が変化 |
消費電力が気になる場合は,リミット値をマイナス方向に振ると,フレームレートをそれほど下げずに消費電力を大幅に低減できると謳われる |
なお,AMDはRadeon HD 6900シリーズで,最大消費電力値を,PowerTuneにおける最大リミット値,つまり規定のTDP+20%のところに設定し,それとは別に,一般的なゲームプレイ時における典型的な消費電力と,アイドル時の消費電力を公開している。
この「一般的なゲームプレイ時の消費電力」は,HD 6970が190W,HD 6950が150Wとされ,HD 5870や「ATI Radeon HD 5850」と同程度。Hoff氏は,「PowerTuneから+20%に設定しても,グラフィックス負荷が低い場合は,コアクロックが下げられるだけでなく,パワーゲーティングにより,SIMD Engine単位で動作するユニット数を減らせるため,省電力性が損なわれることはない」とアピールしている。
気になる市場価格は,Radeon HD 6970が4万7000円前後,Radeon HD 6950が3万7000円前後で,競合となる「GeForce GTX 580」「GeForce GTX 570」より安価なラインで落ち着きそう。これで2010年に登場するGPU製品は打ち止めになる見込みなので,別途掲載してあるレビューを参考に,どれを買うか,じっくり検討してほしいと思う。
Radeon HD 6970&6950レビュー記事
AMDのRadeon HD 6000シリーズ製品情報ページ(日本語)
- 関連タイトル:
Radeon HD 6900
- この記事のURL: