ニュース
AMD,「ATI Radeon HD 4870」正式発表。GPUアーキテクチャ詳細を明らかに
同社は併せて,開発コードネーム「RV770」とされてきたATI Radeon HD 4800シリーズのGPUアーキテクチャを公開。そこで本稿では,6月16日に米カリフォルニア州サンフランシスコ市で開催された,ATI Radeon HD 4800シリーズの技術説明会「Technical Deep Dive Event」の内容を軸に,新世代GPUの強化ポイントを紐解いていきたいと思う。
なお,ATI Radeon HD 4870の下位モデルとなる「ATI Radeon HD 4850」は,発売スケジュールが突然前倒しされ,先週末には秋葉原を中心として,PCパーツショップの店頭に製品が並んでいる。4Gamerでも23日にレビュー記事をお届けしているので,同製品についてはそちらも併せて参照してもらえれば幸いだ。
ATI Radeon HD 3000/2000の弱点を克服した
ATI Radeon HD 4800シリーズ
旧ATI Technologies時代の開発コードネームルールでは,「RV」は前世代,もしくは同一世代GPUの機能制限版という位置付けにあったため,その性能を疑問視する向きもあったRV770。だがフタを開けてみれば,(確かに基本となるストリーミングプロセッサの構成自体は従来から変わっていないものの)ATI Radeon HD 2000/3000シリーズの「R600」アーキテクチャが持つ弱点を徹底的に改良したものになっている。
その最大の特徴は,汎用シェーダユニットとなるStream Processor(ストリームプロセッサ,以下SP)数がATI Radeon HD 3800シリーズの320基から800基へと増やされている点。トランジスタ数は従来製品の6億6600万個から9億5600万個へ増えているが,1.4倍強のトランジスタ数増加で,SP数を2.5倍にできているのを考えるに,かなり効率的な半導体設計がなされたと述べるべきだろう。
なお,製造プロセスは従来どおりTSMCの55nmプロセスを採用しており,ダイサイズ(半導体そのもののサイズ)は190mm2から260mm2に増えている。
AMDでは,5基のSPと1基の分岐実行ユニットを一つの「Stream Processing Unit」(ストリームプロセッシングユニット)とし,これを16基(つまりは80ストリームプロセッサ1組)まとめてSIMDコア1基としている。ATI Radeon HD 3800シリーズの場合,SP数は320基なので,SIMDコア換算では4基。ATI Radeon HD 4800シリーズではこれが10基となっているわけだ。
SIMDコアが増えたことを受け,各SIMDコアに命令を発効する「Ultra-Threaded Dispatch Processor」(ウルトラスレッド・ディスパッチプロセッサ)には,各SIMDコアをコントロールする「Thread Sequencer」(スレッドシーケンサ)が設けられ,より効率的なSIMDコアの制御を実現しているとのこと。また。各SIMDコアには「Local Data Share」(ローカルデータシェア)と呼ばれる共有メモリが設けられ,頻繁に利用されるデータはこの共有メモリに格納されることで,各Stream Processing Unitから利用できるようになった。
テクスチャユニットとL1テクスチャキャッシュも,ATI Radeon HD 4800シリーズでは各SIMDコアに従属する形がとられた。L1テクスチャキャッシュはSIMDコア単位で頻繁に利用するデータを格納できるようになったため,テクスチャ処理の効率は上昇する。さらに,各SIMDコアの連携を高めるため,「Global Data Share」と呼ばれる容量16KBの共有メモリが設けられている。SIMDコア間のシームレスなデータ共有を実現し,スループットパフォーマンスを向上させる狙いだ。
テクスチャユニットは従来製品比でやや簡素化されているものの,パフォーマンスは従来モデルから大きく引き上げられている。
テクスチャキャッシュからテクセル(※テクスチャを構成する画素)を読み出す「Texture Sampler」(テクスチャサンプラ)は各ユニットに16基搭載され,これらに4基の「Texture Filter Unit」(テクスチャフィルタユニット)が組み合わされる。AMDでATI Radeon HD 4800シリーズの開発を担当したScott Hartog氏(Chief Architect, ATI Radeon HD 4800 Series, AMD Graphics Product Group)は,「ATI Radeon HD 4800シリーズのテクスチャキャッシュ帯域幅は,HD 3000シリーズの倍に向上し,32bitフィルタリングレートは2.5倍に向上している」と,(テクスチャユニットは簡素化されても)パフォーマンスそのものは大幅に向上していると説明する。
なお,これは言うまでもないかもしれないが,増強されたL1テクスチャキャッシュを有効に機能させるため,L1とL2の間の帯域幅は最大384GB/sに高められている。ATI Radeon HD 4870のテクスチャ性能は,「GeForce GTX 280」を上回るとAMDは謳う。
ATI Radeon HD 4870のテクスチャ性能は,GeForce 280 GTXを上回り,もちろん「GeForce 9800 GTX」を圧倒するとAMD |
こちらはATI Radeon HD 3800シリーズとの比較。SP数が2.5倍になった“だけ”に留まらず,テクスチャ性能なども大幅に向上 |
そしてもう一つ,3Dゲーマーにとって重要な強化点がある。それは,「ATI Radeon HD 3000/2000シリーズ最大の弱点」とされた「Render Back-Ends」(レンダーバックエンド)だ。
ATI Radeon HD 4870では,もう一つ特筆すべき強化ポイントがある。それが次世代グラフィックスメモリといわれるGDDR5のサポートだ。旧ATI Technologiesは,グラフィックスメモリの標準化で業界の牽引役を果たしてきたが,それはAMDになっても変わらない。
GDDR5の駆動電圧は1.5Vで,最大28GB/sの帯域幅を実現する。GDDR5ではGDDR3/4の2倍となる二つのDQ(Data Queue,データキュー)ラインを持ち,従来比4分の1の動作クロックで同じデータレートを実現する。つまり,メモリの実動作クロックが1GHzのとき,GDDR3ならデータレートは2GHz相当(2Gbps)になるところが,GDDR5なら4GHz相当(4Gbps)に達するというわけだ。
GDDR5のGDDR4との比較。比較的低消費電力で駆動できるほか,GDDR4と比べて4分の1のデータレートコマンドクロックを実現するのがGDDR5の特徴だ |
DRAMチップそのものがタイミングやクロックを補正できるため,カードデザイン時にチップからメモリへの配線長などをシビアに追求する必要がない |
一方,メモリコントローラではGDDR5対応以外にも,最適化が施された。とくに,PCI ExpressインタフェースやATI CrossFireX,UVD2,ディスプレイコントローラのメモリアクセスを仲介するハブが,メモリへのアクセスを最適化することでメモリアクセスの負荷を軽減させている。これにより,ATI Radeon HD 4800シリーズではメモリ帯域幅の実効占有率をピーク時に95%まで高めることが可能になったとのことだ。
データ読み出し時にエラーが生じた場合にリトライをかけるなど,高速なデータ転送をサポートするだけでなく,それ以上にデータ転送時の信頼性アップに配慮されているGDDR5 |
アーキテクチャの改良とメモリ周りのシステム変更によって,ATI CrossFireXにおけるマルチグラフィックス環境のパフォーマンスアップが飛躍的に向上したという |
EAとセガ,NHNがDirectX 10.1対応タイトルを計画
R700の3DMark Vantageスコアも公開に
ここまではNVIDIAと非常によく似たアプローチ。しかしAMDはここで,これらの取り組みに当たって,あくまでオープンスタンダードを支持するというスタンスを強調する。GeForceベースの並列コンピューティングに向けた開発環境「CUDA 2.0」を用意して,対応アプリケーションの充実を図るNVIDIAとは対照的だ。
ただ,肝心のタイトルがほとんどない状況はどうなのか。そんな疑問に応える形で,Electronic Arts(以下,EA),SEGA of America,NHN Gamesの3社から,DirectX 10.1タイトルの発売計画が明らかにされた。とくにEAは,2008年内の発売を予定しているファンタジーオンラインRTS「BattleForge」のデモを行ったので,以下のとおりムービーでお伝えしたい。またNHN Gamesは,MMORPG「Cloud 9」において,ATI Radeon HD 4800/3800シリーズが搭載するテッセレータを用い,さらに高品位なビジュアル表現を実現すると予告していた。
このほか説明会では,DirectX 10.1やテッセレータ,TFLOPSの演算能力を生かしたAI機能など,ATI Radeon HD 4800シリーズが持つ機能をすべて活用する新しいデモ「Froblines」が公開されたほか,ピクチャ・イン・ピクチャ(PinP)などのデュアルストリームデコード処理をサポートする第2世代の高解像度ビデオ再生機能「UVD2」なども語られたが,本稿では割愛する。
ハードウェア構成は明らかにされなかったが,3DMark VantageのExtremeプロファイル(解像度1920×1200ドット)において,スコアは「X12515」。GPU-Zの情報を見る限り,R700は“ATI Radeon HD 4870×2”構成になりそうだが,8週間以内に市場投入されるというウルトラハイエンド製品も要注目だろう。
- 関連タイトル:
ATI Radeon HD 4800
- 関連タイトル:
BattleForge
- この記事のURL:
(C)2008 Advanced Micro Devices, Inc.