ニュース
「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
仮想空間上におけるGPUとCPUのデータ共有を実現
GPU内部に2基のアレイを持たせるアプローチは,CaymanコアのRadeon HD 6900シリーズやCypressコアのATI Radeon HD 5800シリーズでもとられてきたが,Tahitiでは,よりGPUコンピューティング性能を発揮できやすくなるよう改良されているのが特徴だ。
改良における最大のポイントは,TahitiのGCNアレイが,メインメモリへの直接アクセスを可能にするDMAエンジン(Direct Memory Access Engine)をそれぞれ持つことにより,PCI Express 3.0 x16の帯域幅をフルに使ってCPUとのデータ共有を行えるようになることである。
AMDは,2011年6月に米ワシントン州ベルビュー市で開催した「Fusion Developer Summit 2011」において,GCNでGPUにアドレス変換キャッシュ(ATC:Address Translation Cache)を搭載することで,CPUとGPUが同じ仮想アドレスに64bitポインタでアクセスできるようにすると明らかにしていた。
CPU側のIOMMU(Input/Output Memory Management Unit,Intel製CPUでいうところの「Vt-d」)がGPU側の仮想メモリアドレスを物理アドレスに変換。一方,GPU側のMMU(Memory Management Unit)も,ATCを用いてCPUの仮想アドレスを物理アドレスに変換し,OSがIOMMUとMMUを管理下に置けるようにする。これにより,仮想メモリ空間上でCPUとGPUのデータ共有を実現するというわけだ。
さらにGCNでは,GPUとCPUとの間でキャッシュのスヌープ(snoop,プロセッサキャッシュのデータ書き換えに伴うシステムメモリ上のデータ更新があった場合,当該データを共有しているほかのプロセッサコアに通知し,そのデータを参照する必要がある場合はメモリ上のデータをキャッシュに再読み込みすること)もサポートする。Tahitiが2基のDMAエンジンを搭載してきたのは,そのようなデータ共有の効率化を行うためなのである。
こういった小難しいGPUコンピューティング向けの機能も,ゲームのグラフィックス品質や処理性能向上に役立つと,AMDでアーキテクチャ開発を指揮するEric Demers(エリック・デメル)CTOは述べている。
氏いわく,「Radeon HD 7970では,GPUの仮想メモリ機能を使うことで,高解像度のテクスチャを前にしても優れた性能を発揮できる『Partially Resident Textures』(PRT)が可能になる」。グラフィックスメモリをテクスチャキャッシュの拡張エリアとして利用することで,id SoftwareのJohn Carmack(ジョン・カーマック)氏が提唱するMega Textureなど,高解像度のテクスチャを利用したゲーム表現などにおいても,GPUアクセラレーションができるようになるとのことだ。
「いくつかのゲームデベロッパが,PRTの採用に前向きである」とDemers氏は述べているので,次世代ゲームエンジンでのサポートも期待されるところである。
Leoでは,何十という光源が入り組んだ世界のレンダリングが行われる。ちなみにここで見えている線はすべて光源や反射を表している |
Leoで利用しているテクスチャのキャッシュ内容。こんな感じでテクスチャデータはグラフィックスメモリに格納され,高速な読み出しに寄与する |
ちなみに,Radeon HD 7970のプロダクトマネージャーを務めるDevon Nekechuk(デヴォン・ネケチャク)氏は,「PCI Express 3.0対応とデュアルDMAエンジンの採用は,CrossFireXによるマルチGPU性能の向上にも役立つ」と述べていたりする。
マルチGPU環境では,複数のGPUでデータを共有したり,負荷分散したりするときにもPCI Expressインタフェースを用いている。そのとき,リンク帯域幅だけでなくメインメモリとのデータ帯域幅も広がれば,マルチGPU環境におけるボトルネックが軽減されるのは当然の流れだろう。
3D立体視対応を果たすEyefinity 2.0
Eyefinity 2.0では最大3台構成でHD3Dベースの3D立体視が可能に |
2012年に半ばの市場投入が予定されているMSTを用いれば,1基のMini DisplayPortから最大4台のDisplay Port出力が可能になる |
6基のディスプレイインタフェースが搭載され,最大6画面出力が可能なのはRadeon HD 6900シリーズと同じだが,Tahitiコアでは,すべてのディスプレイインタフェースにサウンド出力機能が追加され,DiplayPortやHDMI出力時に利用できるようになっている。
AMDはこの機能を「Discrete Digital Multi-point Audio」(DDM Audio)と呼んでおり,Radeon HD 7970のリファレンスデザインでは,Mini DisplayPort×2とHDMI×1でDDMを利用可能。また,「2012年半ばの市場投入が予定されている,DisplayPort 1.2対応の「Multi-Stream Transport hub」(MST)を用いれば,最大6台のDDM出力が可能になる」(Nekechuk氏)とのことだ。
「Deus Ex: Human Revolution」を用いた3画面3D立体視のデモ |
Radeon HD 7970と4Kディスプレイを用いた「DiRT 3」のデモ |
もう1つ,ゲームと直接の関係はないが,ビデオ再生支援機能の大幅な強化も紹介しておきたい。
まず,UVD(Unified Video Decorder)は,MPEG-4やDivXのデコードに対応。さらにH.264のフルエンコード機能を備える「VCE」(Video Codec Engine)の追加によって,HD+SDのデュアルストリームを2系統同時再生できるようになったり,エンコードの高速化が図られたりしている。
また,ビデオの動き検出やパターンマッチングなどに用いられる「SAD」(Sum of Absolute Difference,絶対値誤差)をGCN CU側で処理するとき,16×16ピクセルのマイクロブロックを4×4ブロックに分割して演算処理するQSAD(Quarter SAD)をサポートすることで,より高速な動き検出やパターンマッチングを実現したともされている。
QSADの採用により,家庭用ビデオカメラで撮影したビデオの手ブレを再生時に補正する「AMD Steady Video」のバージョンも2.0へ進化し,より高精度かつ高速な補正が可能になったとのことだ。
Radeon HD 7000シリーズでは,SADに加えQSADをサポート。高精度かつ高速な動き検出やパターンマッチングを実現するとされる |
AMD Steady Video 1.0と同2.0の機能比較。補正機能が強化されたほか,サイドバイサイドのデモモードも追加されている |
再びゲーム市場への注力を誓うAMD
Neal Robison氏(Director, ISV Relationship Management, AMD) |
2012年は,「2010年に宣言したマニフェスト『ゲーマー第一主義』をより一層強化していく」とAMD |
同氏は「2011年末にリリースされたメジャータイトルで,我々の製品が十分な性能を発揮できなかったり,不具合が生じたりしたことは,(ユーザーに)大きなショックをもたらした」として,「2010年に立ち上げた『ゲーマー第一主義』のマニフェストを,きちんと堅持できる体制を作り上げる」と宣言。Southern Islands世代のRadeon HD 7000シリーズを,最高のゲーマー向けGPUとする意向を示している。ゲームデベロッパにPRTやEyefinity 2.0,HD3Dなどといった新技術の採用を働きかけていくほか,ドライバの最適化やデバッグなどにおいても,これまでより積極的に情報交換していくという。
もう1つ,AMDが推し進めるFusionにおいても,GPUコアを積極的に利用したアプリケーションを,APUだけでなく,CPUとGPUによるシステムでも利用できる環境を整備していくとしている。Robinson氏は「2012年には,ナチュラルユーザーインタフェースなどでも,GPUのパワーを使った製品などが登場する見込みだ」と述べ,ゲームタイトル以外でもGPUの役割は重要になっていくとの見通しを示している。
CPUとの連携を想定した新世代アーキテクチャを採用するSouthern Islands世代のRadeon HD 7000シリーズが,AMDのFusionを加速させるえで重要な役割を果たすことはまず間違いない。
AMDのRadeon HD 7970製品情報ページ(英語)
AMD,新世代ハイエンドGPU「Radeon HD 7970」を発表――Southern Island世代のGPUアーキテクチャを整理する
Radeon HD 7970レビュー(前編)。アーキテクチャとプロセス技術の進化で,シングルGPU世界最速の座を奪還
Radeon HD 7970レビュー(後編)。OCとPCIe 3.0&2.0比較,そしてZeroCoreの挙動から,その素性を確認する
- 関連タイトル:
Radeon HD 7900
- この記事のURL:
(C)2011 Advanced Micro Devices, Inc.