Radeon HD 7970リファレンスカードのイメージ。2012年1月9日以降,カードベンダー各社から搭載グラフィックスカードの販売が始まる予定だ
|
日本時間2011年12月22日14:01,AMDは,新世代GPU「
Radeon HD 7970」を発表した。同社が「
Graphics Core Next」と呼ぶ新世代GPUコアアーキテクチャを採用する製品にして,開発コードネーム「
Southern Islands」(サザンアイランド)と呼ばれてきたシリーズの,シングルGPU構成最上位に当たるモデルでもある。
4Gamerでは,米テキサス州オースティン市にあるAMDの「Lone Star」キャンパスで開催された事前説明会「Tech Day」に参加してきたので,今回はその内容を基に,Radeon HD 7970の詳細へ迫ってみたい。
Tech Dayの会場となった,米テキサス州オースティン市のAMD・Lone Starキャンパス |
Tahitiコアを採用したRadeon HD 7970のチップ。ダイサイズは365mm2とされる |
Southern Islandsを構成するのはTahiti,Pitcairn,Cape Verdeの3コア。Southern Islandsということで,南太平洋の島々からその名が付けられている
|
AMDでグラフィックス関連ビジネスを統括するMatt Skynner(マット・スキナー)副社長は,Radeon HD 7970の発表にあたって,Southern Islandsシリーズを構成するGPUが3つあり,その開発コードネームが上位モデルから順に「
Tahiti」「
Pitcairn」「
Cape Verde」(順にタヒチ,ピトケアン,ケープベルデ)であることを明らかにした。Radeon HD 7970はTahitiベースであり,PitcairnとCape Verdeはそれぞれ「
Radeon HD 7800」「
Radeon HD 7700」のシリーズ名が採用される見込みだ。
氏によれば,そんなRadeon HD 7000シリーズが置き換える予定の従来製品は以下のとおり。いずれも2012年第1四半期中に市場へ投入される計画だ。なお,Radeon HD 6700シリーズ以下の製品は継続販売されるという。
- Radeon HD 7900(Tahiti):Radeon HD 6970以上
- Radeon HD 7800(Pitcairn):Radeon HD 6950とRadeon HD 6870
- Radeon HD 7700(Cape Verde):Radeon HD 6850とRadeon HD 6770
Radeon HD 7000シリーズの製品移行計画。Radeon HD 6000シリーズの下位モデルは継続販売となる見通しだ
|
さらにSkinner氏は,Tahitiチップを2基搭載するデュアルGPU製品を投入予定であり,その開発コードネームが「
New Zealand」(ニュージーランド)であることをシルエットで示唆している。
Southern Islandsシリーズの最上位モデルとなるデュアルGPUカードの登場もTech Dayでは予告された。詳細は明らかになっていないが,示された島の形から,開発コードネームがNew Zealandであることは推測できる
|
|
ピーク浮動小数点演算性能は3.79TFOPS
世界初のPCIe 3.0&DX 11.1対応カードに
Radeon HD 7970は,世界初の28nmプロセス採用GPUというだけでなく,PCI Express Gen.3やDirectX 11.1対応でも世界初となる
|
新型アーキテクチャを採用したSouthern Islands世代。その第1弾となるRadeon HD 7970は,TSMCの28nmプロセス技術を採用し,43億1000万トランジスタを集積してきたGPUだ。搭載する「
Radeon Core」(もしくは「Stream Processor」「Streaming Processor」,以下 SP)数は
2048基。
384bitメモリインタフェースを採用し,浮動小数点演算のピーク性能は
3.79TFLOPSに達する。「
Radeon HD 6970」と比べると,ピーク演算性能は1.4倍という計算だ。
また,
世界で初めて,PCI Express 3.0,そして,Windows 8で採用される「DirectX 11.1」に対応することもトピックである。
Radeon HD 7970の概要。2048基のSPを搭載し,GDDR5メモリインターフェースを384bit幅へと拡張してきた。Radeon HD 7000シリーズのタグライン(≒キャッチコピー)は「Never Settle」(進化は止まらない)
|
Radeon HD 7970とRadeon HD 6970の主なスペックを
表にまとめてみたので参考にしてほしい。詳細は後段で述べる。
GCNアーキテクチャについて説明するEric Demers氏(CTO and Corporate Vice President, Graphics Business Unit, AMD)
|
さて,AMDがSouthern Islandsシリーズで採用してきた新アーキテクチャたるGraphics Core Next(以下,GCN)は,命令発行やスケジューリングの負荷を低減し,より効率的な並列演算処理を可能にするものだ。
同社でグラフィックスアーキテクチャの開発を統括するEric Demers(エリック・デメル)CTOは,ATI Radeon HD 2000以降で長らく採用されてきたVLIW(Very Long Instruction Word)方式を引き合いに出しつつ,「依存関係にない複数の命令を1命令としてまとめて実行できるVLIW方式も,グラフィックス用途では十分に活用できるアーキテクチャだが,GCNは汎用コンピューティング用途などでも優れたパフォーマンスを発揮できるアーキテクチャだ」と,GCNを位置づけている。
AMD(および旧ATI Technologies)のグラフィックスコアアーキテクチャ変遷。VLIW時代以前にはSIMDアーキテクチャを採用していたので,ある意味,戻ってきたことになる
|
根幹の設計を維持しつつ
それ以外を大きく拡張したGCN
GCNアーキテクチャの概要
|
GCNで採用されるSPについて,AMDでGCNアーキテクチャの開発を担当したMike Houston(マイク・ヒューストン)フェロー・アーキテクトは「
GCNと,Radeon HD 6900で採用されたVLIW4のALUは基本的に同じもの。GPUの内部構成を大幅に見直すことでスループットを引き上げたのがGCNだ」と紹介している。
ALUというのはArithmetic Logic Unit(演算論理装置)のことで,要するにSPのこと。つまり,GCNでSPの演算機能に手は入っておらず,単精度の浮動小数点積和演算・積和算・乗算・加算と整数演算のみをサポートしたものだということだ。言い換えると,
VLIW5アーキテクチャにおける“ビッグSP”のような,倍精度演算や超越関数演算に対応した特別機能ユニットは搭載されていない。
GCNの最小単位となる「
GCN Compute Unit」(以下,GCN CU)は,16基のSPからなる「
Vector Unit」(ベクトルSIMDユニット)を4基と,1基の「
Scalar Unit」(スカラユニット),4基のテクスチャフィルタリングユニット,容量16KBのL1キャッシュを搭載。GCN CUごとに命令発行ユニットやロード/ストアユニットを搭載するほか,4基のGCN CUで共有する容量16KBの命令キャッシュと同32KBのデータキャッシュも持ち(※詳細は後述),GCN CU単体でカーネル処理を行えるようになっているのが特徴だ。
|
GCNの中核をなすGCN CUのブロック図。16SP(16-wayのベクトル演算ユニット)でVector Unit(ベクトルSIMDユニット)を構成したうえで,これを4基搭載する。また,1基のスカラ演算ユニットと,4基のテクスチャフィルタリングユニットなども統合される |
|
AMDは,GCNにおいてGCN CUに4基のVector Unitを搭載することを「Quad SIMD」と位置づける。従来のVLIW4と比較すると,GCNのQuad SIMD方式のほうが,命令発行のスケジューリングが容易になり,GPUの利用効率も向上させやすいという |
GCN CUに搭載されたScalar Unitは,完全な整数演算機能を備え,コントロールフローや,AMD製GPUの演算実行単位である「Wavefront」(※64スレッドをまとめたもの。32スレッドを1つの演算実行単位とするNVIDIAの「Warp」と似た単位)の制御を行うことで,Vector Unitを効率よく機能できるようにするものである。
Radeon HD 7970が2048基のSPを搭載するというのは上で述べたとおりだが,GCN CUあたり64基のSPを搭載するため,GCN CU数は32基ということになる。32基のGCN CUは,16基のGCN CUブロックごとにジオメトリエンジンが用意されるので,Radeon HD 7970は2基のジオメトリエンジンを搭載する計算だ。
Tahitiコアのブロックダイアグラム。「GCN」と書かれているのがGCN CUだ。16基のGCN CUを1ブロックとして,ブロックごとにジオメトリエンジンなどが搭載される
|
Radeon HD 7000シリーズで,テッセレータは第9世代へと進化
|
GCNアーキテクチャで採用されたジオメトリエンジンには,AMDにとって第9世代となるテッセレータが統合されている。新しいテッセレータでは,頂点データの再利用率を引き上げたり,より大きなパラメータキャッシュを搭載したりすることで,第8世代のテッセレータを搭載するRadeon HD 6900シリーズと比べて,テッセレーション処理のスループットが最大4倍に達したという。
ベンチマークテスト結果を示したDemers氏によれば,テッセレーションによるポリゴン分割数が多ければ多いほど,Radeon HD 6900シリーズよりも優れた性能を発揮できるとのことだ。
テッセレーション性能は大幅に向上。ゲームアプリケーションでも,数十パーセントというレベルで,Radeon HD 6970からのスコア向上があるという
|
L2キャッシュ容量は768KB。で,メモリインタフェースと対になる仕様のため,L2キャッシュは128KBごとにパーティションが切られる
|
GCNでは,4基のGCN CUを1組として,16KBの命令キャッシュと32KBのデータキャッシュを供えるというのは先ほど述べたが,さらにTahitiでは,32基のGCN CUで容量768KBのL2キャッシュを共有。各GCN CUはL2キャッシュからのデータ読み出しだけでなく書き込みにも対応しており,GCN CU間のデータ共有効率を向上させている。
序盤で384bit幅と紹介したメモリインタフェースは,ブロックダイアグラムからも見て取れるように64bit×6。このあたりは競合の「
GeForce GTX 580」と同じだが,組み合わせられるメモリチップがデータレート5.5GbpsのGDDR5となるため,メモリバス帯域幅は競合の最大192GB/sを大きく上回る
264GB/sに達する。
Radeon HD 7900シリーズのRender Back-End。Radeon HD 6970と見かけ上のスペックは変わらないが,Render Back-Endとメモリコントローラのクロスバー接続化によって,性能は向上しているとされる
|
3Dゲーム性能に大きく影響する「Render Back-End」(レンダーバックエンドは,Radeon HD 6970と同じ8基構成で,クロックあたり32カラーROP,128 Z/ステンシルというスペックも同じだ。ただし,Radeon HD 7970のプロダクトマネージャーを務めるDevon Nekechuk(デヴォン・ネケチャク)氏は,「メモリインタフェースの改良と,Render Back-Endの効率引き上げにより,同じROP数ながら,性能はRadeon HD 6970からかなり向上している」と述べている。
従来,メモリインタフェースとROPユニットは対になっていた――Radeon HD 6970の場合,2基のRender Back-Endが64bitメモリコントローラとペアになっている――のに対し,Tahitiでは,メモリインタフェースの拡張に伴って,
Render Back-Endとメモリコントローラとがクロスバー接続されるよう,設計変更がなされている。これにより,より柔軟な負荷配分ができるようになり,ROPの利用効率を引き上げているのが大きそうだ。
GCNアーキテクチャのキャッシュ構成。先ほど後述するとした「GCN CU×4で16KBの命令キャッシュと32KBのデータキャッシュを備える」構造は,この図から見て取れる。容量768KBのL2キャッシュは,メモリコントローラと対になって128KBごとにパーティションが切られている
|
明らかになったRadeon HD 7970のスペック
3D性能だけでなく省電力性,静音性も向上
「Radeon HD 7970は1GHz以上のオーバークロック動作も可能であり,社内では1.2GHzでも安定動作を確認している」とAMD
|
前段でも紹介したとおり,Radeon HD 7970のコアクロックは925MHzで,メモリクロックは5.5GHz相当(実クロック1375MHz)。カードレベルの最大消費電力は260Wだ。だが,Nekechuk氏は「Tahitiコアはオーバークロック耐性に優れている。将来的には,コアクロックを1GHz超に設定して投入するパートナーも出てくるだろう」と述べ,Radeon HD 7900シリーズでは,電力管理機能の強化により,オーバークロック耐性を引き上げられたとしている。
モバイルGPUの電力管理技術としておなじみのPowerTuneを,Radeon HD 7970では高性能化にも活用
|
実は,「
AMD PowerTune Technology」(以下,PowerTune)として知られる,AMDの電力管理機能が,Southern Islandsシリーズで一新されたのだ。
具体的には,GPUコアに複数のデジタルセンサーを搭載し,より厳密に電力を制御できるようにしつつ,従来よりも細かなステップで動作クロックを変更できるようにして,電力効率を向上させるようになっている。AMDはこの新しいPowerTuneを使い,消費電力をできる限り引き下げるとともに,カード設計上の最大電力をフルに使って,性能を向上させることにも役立てようとしているのである。
|
Radeon HD 7900シリーズで採用された最新のPowerTuneにより,きめ細かなクロックゲーティング(=クロック変更)が可能になった |
|
一般的な3Dアプリケーションは,動作にGPUの最大消費電力を必要としない。その余力をクロックアップに振り分け,パフォーマンス向上を果たすという。「AMD Turbo CORE Technology」に似たものと言えるかもしれない |
ゲームアプリケーションの多くは,GPUの最大消費電力を必要しないとDemers氏
|
Demers氏いわく「ほとんどのアプリケーションは,GPUの最大消費電力を使っていない。そこで新しいPowerTuneでは,TDPの余裕分で自動的にオーバークロック動作させるようにすることで,性能を向上させる」。一方,「Furmark」や「OCCT」といった,TDP(Thermal Design Power)を超えた動作をGPUに強いるアプリケーションに対しては,GPUを保護するために動作クロックを引き下げ,常にTDPの枠内で動作させるようになっているとも,氏は説明している。
この電力制御は,アプリケーションごとに独自の電力プロファイル――AMDはこれを「
Power Signature」と呼んでいる――を付与することで実現するとDemers氏は述べているので,「Catalyst Control Center」から設定できるようになる可能性が高そうだ。
Power Signatureと呼ばれる電力プロファイルにより,ゲームプレイ時はGPUのクロックをTDPの上限まで引き上げたり,TDPを超えて負荷をかけるようなストレスツールを実行するような場合はクロックを引き下げてTDPの枠内で動作するようにできるという
|
ZeroCoreの採用により,ディスプレイがの電源がオフとなるロングアイドルモードでは,カードの消費電力を3W以下に抑えられるという
|
|
また,Southern Islands世代のPowerTuneでは,待機電力を大幅に引き下げる「
AMD ZeroCore Power Technology」(以下,ZeroCore)も追加される。
ZeroCoreは,Windowsの待機状態が長時間続き,ディスプレイの電源がオフになった「ロングアイドルモード」時に,カード上にある回路のうち,PCI Expressインタフェースを除く部分への電力供給をカットすることで,
待機電力を3W以下に抑えられるという機能だ。Nekechuk氏は,「ZeroCoreを使えば,CrossFireX環境における消費電力を大幅に低減できるため,もっと気軽にマルチGPU環境を試せるようになるのでは」との期待を口にしていた。
なお,同氏によれば,ディスプレイがオンのままの,いわゆる一般的なアイドル時における消費電力は,「28nmプロセスの採用によって
15W以下に抑えられている」とのことだ。
CrossFireX構成においては,ZeroCoreにより,アイドル時にセカンダリ以降のグラフィックスカードがロングアイドルモードへ移行。そのため,(シングルカード+3W×カード枚数分)しか電力を消費しないとAMDはアピールしている
|
カード設計面では,「第6世代となるVapor Chamber(ヴェイパーチャンバー)の採用や,ブレードの形状を変更してやや大型化させたファンの採用により,冷却能力と静音性を向上させている」とNekechuk氏のアピールするGPUクーラーが見どころだ。
ファンの排気は「ケース内部に排気されたりすることなく,ファンの後方のみに排気されるよう,設計を変更した」(Nekechuk氏)そうで,Radeon HD 6000シリーズに対するユーザーの意見を受けて,冷却機構の改善が施されている(※厳正を期せば,電源コネクタなど,排気が漏れる部分もあるが)。
カードデザインの特徴がまとまったスライド
|
リファレンスデザインの電源コネクタはPCI Express用の8ピンと6ピン各1系統。「ボードの電源部は最大300Wに対応できるように設計している」と,Nekechuk氏は,260WのTDPを超えたオーバークロック動作を行えるようデザインしていることを示唆する。
なお,2個のBIOS ROMを搭載し,切り替えられるようになっている「Dual BIOS Toggle Switch」を標準で用意していたり,接続方法次第で最大6画面のEyefinity出力に対応していたりするのは,Radeon HD 6900シリーズから変わっていない。
AMDが示した3DMark 11のベンチマークスコア
|
さて,4Gamer読者が最も気になる3D性能だが,AMDの公開しているデータによると,「3DMark 11」では,「SP数の増加分とメモリバス帯域幅の向上により,1.4倍以上の性能向上が可能」とDemers氏が言うとおりの結果が出ているようだ。「
Battlefield 3」や「
The Elder Scrolls V: Skyrim」といった最新世代のタイトルでも,競合となるGeForce GTX 580と比べて高いスコアが出ているのを確認できる。
こちらはBattlefield 3(左)とThe Elder Scrolls V: Skyrim(右)のスコアだ。いずれも参考までに
|
|
2枚構成のCrossFire X環境では,シングルカードと比べて約2倍の性能が得られるとされる
|
また,詳細はあらためてお伝えしたいと思うが,CrossFireX構成時は,新世代アーキテクチャの採用によって効率的なデータ共有が可能になったこともあってか,主要タイトルでシングルカード構成時と比べて2倍近い性能を発揮できるようになっているいう。
残念ながら,発表時点ではカードを入手できていないため,“大本営発表”以外のスコアをお伝えするには少し時間が必要だが,「新しいアーキテクチャを採用したこともあり,Radeon HD 7970の性能チューニングは,まだ十分と言える状態ではない」(Nekechuk氏)とのこと。その意味で,GCNという新世代アーキテクチャには期待が膨らむところである。
何はともあれ,カードを入手し次第,レビュー記事をお届けしたい。また,CrossFireXやそのほかの注目要素に関しては,後日,あらためて紹介したいと思う。
※2011年12月22日18:15追記
3D性能速報記事を掲載しました。
ちなみにTech Dayでは,Radeon HD 7000シリーズ用に制作されたテクノロジデモ「Leo」が動く,謎の17インチノートPCがデモ展示されていた。もっとも,本ノートPCの正体は明らかにされていない
|
|
AMDは2012年,ゲーマーのための環境整備に,いままで以上に注力すると宣言している
|