パッケージ
Radeon HD 7900公式サイトへ
  • AMD
  • 発表日:2011/12/22
お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2012/01/07 00:00

ニュース

「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする

Radeon HD 7970リファレンスカードのイメージ。秋葉原ショップ筋の情報によると,カードメーカー各社の製品は,当初,5万円台中盤〜6万円台中盤の価格で店頭へ並ぶこととなりそうだ
画像集#002のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
 北米時間2012年1月9日とされる「Radeon HD 7970」の発売が迫ってきた。同製品は,AMDが「Graphics Core Next」(以下,GCN)と呼ぶ新世代のコアアーキテクチャを採用してきたGPUだ……というのは,2011年12月22日の解説記事で紹介したとおりだが,実のところRadeon HD 7970では,GPUコンピューティングに向けたさまざまな工夫も盛り込まれている。また,ディスプレイインタフェースやビデオ再生支援機能などにも手が入っているので,本稿ではそのあたりをまとめてみたいと思う。


仮想空間上におけるGPUとCPUのデータ共有を実現


Tahitiコアでは,命令発行の効率化やキャッシュアルゴリズムの改良などによって,SMの利用効率が高められている。これにより,コア数増加以上の性能向上を実現できたと謳われる
画像集#003のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
 Southern Islands世代のTahitiコアを採用するRadeon HD 7970は,GPUアーキテクチャ解説記事のとおり32基の「GCN Compute Unit」(以下,GCN CU)を搭載するが,GCN CUは16基で1アレイを構成し,それぞれが「Asynchronous Compute Engine」(ACE)と呼ばれる制御エンジンと組み合わされている。
 GPU内部に2基のアレイを持たせるアプローチは,CaymanコアのRadeon HD 6900シリーズやCypressコアのATI Radeon HD 5800シリーズでもとられてきたが,Tahitiでは,よりGPUコンピューティング性能を発揮できやすくなるよう改良されているのが特徴だ。

Tahitiコアでは,16基のGCN CUをひとまとめにしたアレイの独立性が高められ,アレイごとにACEを組み合わせることでスケジューリングや命令発行の効率化が図られている
画像集#004のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする

 改良における最大のポイントは,TahitiのGCNアレイが,メインメモリへの直接アクセスを可能にするDMAエンジン(Direct Memory Access Engine)をそれぞれ持つことにより,PCI Express 3.0 x16の帯域幅をフルに使ってCPUとのデータ共有を行えるようになることである。

 AMDは,2011年6月に米ワシントン州ベルビュー市で開催した「Fusion Developer Summit 2011」において,GCNでGPUにアドレス変換キャッシュ(ATC:Address Translation Cache)を搭載することで,CPUとGPUが同じ仮想アドレスに64bitポインタでアクセスできるようにすると明らかにしていた
 CPU側のIOMMU(Input/Output Memory Management Unit,Intel製CPUでいうところの「Vt-d」)がGPU側の仮想メモリアドレスを物理アドレスに変換。一方,GPU側のMMU(Memory Management Unit)も,ATCを用いてCPUの仮想アドレスを物理アドレスに変換し,OSがIOMMUとMMUを管理下に置けるようにする。これにより,仮想メモリ空間上でCPUとGPUのデータ共有を実現するというわけだ。

GCNアーキテクチャでは,仮想メモリ技術の採用により,GPUとCPUとがシームレスかつ効率的にデータ共有できるようになっている
画像集#016のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする 画像集#017のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする

 さらにGCNでは,GPUとCPUとの間でキャッシュのスヌープ(snoop,プロセッサキャッシュのデータ書き換えに伴うシステムメモリ上のデータ更新があった場合,当該データを共有しているほかのプロセッサコアに通知し,そのデータを参照する必要がある場合はメモリ上のデータをキャッシュに再読み込みすること)もサポートする。Tahitiが2基のDMAエンジンを搭載してきたのは,そのようなデータ共有の効率化を行うためなのである。

 こういった小難しいGPUコンピューティング向けの機能も,ゲームのグラフィックス品質や処理性能向上に役立つと,AMDでアーキテクチャ開発を指揮するEric Demers(エリック・デメル)CTOは述べている。
 氏いわく,「Radeon HD 7970では,GPUの仮想メモリ機能を使うことで,高解像度のテクスチャを前にしても優れた性能を発揮できる『Partially Resident Textures』(PRT)が可能になる」。グラフィックスメモリをテクスチャキャッシュの拡張エリアとして利用することで,id SoftwareのJohn Carmack(ジョン・カーマック)氏が提唱するMega Textureなど,高解像度のテクスチャを利用したゲーム表現などにおいても,GPUアクセラレーションができるようになるとのことだ。

画像集#005のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
Radeon HD 7900シリーズがサポートするPRTは,高解像度のテクスチャを効率よく利用できるよう,グラフィックスメモリを拡張キャッシュとして使えるようにするもの
画像集#006のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
PRTの仕組み。より高解像度のテクスチャデータが必要になる場合,通常はメインメモリから高解像度のデータを読み出さねばならないが,PRTでは,高解像度テクスチャを容量64KBのタイルとしてグラフィックスメモリに格納することで,高解像度テクスチャ利用時の遅延を低減する

 「いくつかのゲームデベロッパが,PRTの採用に前向きである」とDemers氏は述べているので,次世代ゲームエンジンでのサポートも期待されるところである。

画像集#007のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
 ちなみにAMDは,このPRTを用いたRadeon HD 7900シリーズの技術デモとして「Leo」(レオ)を用意している。これは,Walt Disney Animation Studiosがアニメ映画制作で用いている「Ptex」(Per-face Texture Mapping)技術を用い,ポリゴンごとに高解像度テクスチャデータをあてがいつつ,複雑な光源処理を組み合わせたアニメーションをリアルタイムでレンダリングするというものだ。

PRT技術を採用したRadeon HD 7900シリーズ用技術デモたるLeoでは,ディズニーがアニメ映画制作で採用しているPtex技術を基にリアルタイムレンダリングを実現
画像集#008のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする 画像集#009のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
メインキャラクターのベースメッシュ(上段)と,ディスプレースメントマッピング適用後(下段)。少々分かりづらいかもしれないが,ディスプレースメントマッピングによってポリゴンが分割されたときには,テクスチャの解像度も引き上げられている
画像集#010のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする 画像集#011のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
画像集#012のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする 画像集#013のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
画像集#014のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
Leoでは,何十という光源が入り組んだ世界のレンダリングが行われる。ちなみにここで見えている線はすべて光源や反射を表している
画像集#015のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
Leoで利用しているテクスチャのキャッシュ内容。こんな感じでテクスチャデータはグラフィックスメモリに格納され,高速な読み出しに寄与する

 ちなみに,Radeon HD 7970のプロダクトマネージャーを務めるDevon Nekechuk(デヴォン・ネケチャク)氏は,「PCI Express 3.0対応とデュアルDMAエンジンの採用は,CrossFireXによるマルチGPU性能の向上にも役立つ」と述べていたりする。
 マルチGPU環境では,複数のGPUでデータを共有したり,負荷分散したりするときにもPCI Expressインタフェースを用いている。そのとき,リンク帯域幅だけでなくメインメモリとのデータ帯域幅も広がれば,マルチGPU環境におけるボトルネックが軽減されるのは当然の流れだろう。

Radeon HD 7900シリーズでは異方性フィルタリングの品質も向上したとされる
画像集#018のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする 画像集#019のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする


3D立体視対応を果たすEyefinity 2.0


画像集#020のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
Eyefinity 2.0では最大3台構成でHD3Dベースの3D立体視が可能に
画像集#021のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
2012年に半ばの市場投入が予定されているMSTを用いれば,1基のMini DisplayPortから最大4台のDisplay Port出力が可能になる
 Radeon HD 7970では,AMD独自のマルチディスプレイ出力技術「Eyefinity」も,「Eyefinity 2.0」へと進化した。
 6基のディスプレイインタフェースが搭載され,最大6画面出力が可能なのはRadeon HD 6900シリーズと同じだが,Tahitiコアでは,すべてのディスプレイインタフェースにサウンド出力機能が追加され,DiplayPortやHDMI出力時に利用できるようになっている。

 AMDはこの機能を「Discrete Digital Multi-point Audio」(DDM Audio)と呼んでおり,Radeon HD 7970のリファレンスデザインでは,Mini DisplayPort×2とHDMI×1でDDMを利用可能。また,「2012年半ばの市場投入が予定されている,DisplayPort 1.2対応の「Multi-Stream Transport hub」(MST)を用いれば,最大6台のDDM出力が可能になる」(Nekechuk氏)とのことだ。

Eyefinity 2.0では,すべてのディスプレイインタフェースがサウンド出力機能を持ち,Display Port 1.2またはHDMIを介して音声出力できるDDM Audioをサポート(左)。DDM Audioを使えば,画面を切り替えたとき,サウンド設定をいちいち変えなくても,音声が画面の出力に追従する
画像集#022のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする 画像集#023のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする

ケーブル1本での4Kディスプレイ出力をサポート
画像集#024のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
 さらに,Eyefinity 2.0では,「AMD HD3D Technology」(以下,HD3D)との組み合わせによって最大3台のディスプレイによる3D立体視に対応するほか,DisplayPort 1.2もしくは3GHz HDMIにより,ケーブル1本での4K解像度出力にも対応。2012年2月版Catalystグラフィックスドライバとなる「Catalyst 12.2」では,Eyefinityの解像度を任意の値に設定できるようにしたり,Eyefinity構成時にWindowsタスクバーの位置を中央のディスプレイへ移動できるようにする機能もを追加するとも,AMDは予告している。

Eyefinity 2.0のアップデート計画
画像集#025のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする 画像集#026のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
画像集#027のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
「Deus Ex: Human Revolution」を用いた3画面3D立体視のデモ
画像集#028のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
Radeon HD 7970と4Kディスプレイを用いた「DiRT 3」のデモ

 もう1つ,ゲームと直接の関係はないが,ビデオ再生支援機能の大幅な強化も紹介しておきたい。
 まず,UVD(Unified Video Decorder)は,MPEG-4やDivXのデコードに対応。さらにH.264のフルエンコード機能を備える「VCE」(Video Codec Engine)の追加によって,HD+SDのデュアルストリームを2系統同時再生できるようになったり,エンコードの高速化が図られたりしている。

UVDの機能強化。MPEG-4やDivXへの対応が追加された
画像集#029のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
VCEの特徴(左)。複数のH.264 HDストリーム処理に対応した。右はVCEを使ったエンコードの流れだ。ビデオエンコードの高速化もGPUのみで実現可能になっている
画像集#030のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする 画像集#031のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする

 また,ビデオの動き検出やパターンマッチングなどに用いられる「SAD」(Sum of Absolute Difference,絶対値誤差)をGCN CU側で処理するとき,16×16ピクセルのマイクロブロックを4×4ブロックに分割して演算処理するQSAD(Quarter SAD)をサポートすることで,より高速な動き検出やパターンマッチングを実現したともされている。
 QSADの採用により,家庭用ビデオカメラで撮影したビデオの手ブレを再生時に補正する「AMD Steady Video」のバージョンも2.0へ進化し,より高精度かつ高速な補正が可能になったとのことだ。

画像集#032のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
Radeon HD 7000シリーズでは,SADに加えQSADをサポート。高精度かつ高速な動き検出やパターンマッチングを実現するとされる
画像集#033のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
AMD Steady Video 1.0と同2.0の機能比較。補正機能が強化されたほか,サイドバイサイドのデモモードも追加されている



再びゲーム市場への注力を誓うAMD


画像集#034のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
Neal Robison氏(Director, ISV Relationship Management, AMD)
画像集#035のサムネイル/「Radeon HD 7970」ではメガテクスチャ処理のGPUアクセラレーションが可能に!? GPUコンピューティング向けの工夫やディスプレイ周りをチェックする
2012年は,「2010年に宣言したマニフェスト『ゲーマー第一主義』をより一層強化していく」とAMD
 AMDでゲームデベロッパのサポートを統括するNeal Robison(ニール・ロビソン)氏は,「2012年は,より一層のゲームデベロッパサポートを行い,すべてのゲーマーがAMD製品で最高の性能を享受できるようにする」と予告している。
 同氏は「2011年末にリリースされたメジャータイトルで,我々の製品が十分な性能を発揮できなかったり,不具合が生じたりしたことは,(ユーザーに)大きなショックをもたらした」として,「2010年に立ち上げた『ゲーマー第一主義』のマニフェストを,きちんと堅持できる体制を作り上げる」と宣言。Southern Islands世代のRadeon HD 7000シリーズを,最高のゲーマー向けGPUとする意向を示している。ゲームデベロッパにPRTやEyefinity 2.0,HD3Dなどといった新技術の採用を働きかけていくほか,ドライバの最適化やデバッグなどにおいても,これまでより積極的に情報交換していくという。

 もう1つ,AMDが推し進めるFusionにおいても,GPUコアを積極的に利用したアプリケーションを,APUだけでなく,CPUとGPUによるシステムでも利用できる環境を整備していくとしている。Robinson氏は「2012年には,ナチュラルユーザーインタフェースなどでも,GPUのパワーを使った製品などが登場する見込みだ」と述べ,ゲームタイトル以外でもGPUの役割は重要になっていくとの見通しを示している。
 CPUとの連携を想定した新世代アーキテクチャを採用するSouthern Islands世代のRadeon HD 7000シリーズが,AMDのFusionを加速させるえで重要な役割を果たすことはまず間違いない。

AMDのRadeon HD 7970製品情報ページ(英語)

AMD,新世代ハイエンドGPU「Radeon HD 7970」を発表――Southern Island世代のGPUアーキテクチャを整理する

Radeon HD 7970レビュー(前編)。アーキテクチャとプロセス技術の進化で,シングルGPU世界最速の座を奪還

Radeon HD 7970レビュー(後編)。OCとPCIe 3.0&2.0比較,そしてZeroCoreの挙動から,その素性を確認する

  • 関連タイトル:

    Radeon HD 7900

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
スペシャルコンテンツ
注目記事ランキング
集計:11月04日〜11月05日