ニュース
「Tonga」コアに隠された機能が明らかに。インドでのイベントでAMDがFireProシリーズの最新事情と「R9 285」の新情報を公開
FirePro W9100・W8100を披露
映画大国インドの映画産業を狙う
両製品はいずれも,Graphics Core Next(以下,GCN)世代のGPUコア「Hawaii」を採用するものだ。W9100は44基のCompute Unit(CU)を備えており,シェーダプロセッサ数(※AMDではStream Processor)は2816基となる。単精度浮動小数点演算性能は5.24TFLOPS,倍精度浮動小数点演算性能は2.62TFLOPSに達するという。
一方のW8100は,44基のCUでシェーダプロセッサ数は2560基。単精度浮動小数点演算性能は4.2TFLOPSで,倍精度浮動小数点演算性能は2.1TFLOPSというスペックとなっている。
AMDにてビジュアルコンピューティング部門担当副社長を務めるRaja Koduri氏は,ワークステーションブランドのFire Proシリーズが10年間に250倍もの性能向上を実現したことを「感慨深い」と振り返る。そして,この性能向上は「これからも続くであろう」と自信を示していた。
Raja Koduri氏(Corporate Vice President,Visual Computing,AMD) |
AMDのワークステーション向けGPUラインナップ |
ちなみに,彼女はコアゲーマーなのだそうで,お気に入りのゲームは「Temple Run」と「Angry Birds」とのこと。……まるっきりAMDとは関係ないゲームだが,インド流のジョークだろうか。
FirePro W9100・W8100の発表に続けて,プロ向けグラフィックスに関する話題が2つアナウンスされた。
なお,SIGGRAPH 2014で発表されたものから,内容,デモともに更新された情報はなかったので,詳しく知りたい人はSIGGRAPH 2014のレポート記事を参照してほしい。
2つめの話題は,インドの映像制作産業とAMDが強いパートナーシップを結んでビジネスを展開しているという話だ。その具体事例としては,2つのケースが紹介された。
ちなみに,超人的な能力を持つ蠅の活躍を描いたホラーコメディ「Eega」は,2013年度のインド映画賞で最優秀特殊効果賞(Best Special Effects)を獲得している。
このRajamouli監督は,CGを効果的に活用した作風が特徴であるそうだが,実はKoduri氏の従兄弟にあたるのだという。その関係で,10年以上前からKoduri氏は,Rajamouli監督作品のCG特殊効果に関する技術アドバイザーを務めているのだそうだ。そんなバックグラウンドもあり,Rajamouli監督の映画で使われるCG特殊効果は,AMDのFireProシリーズで制作されているのだという。
2つめの事例は,インドの映像制作者向け専門学校「MAAC」での採用事例だ。登壇した同校のRam Warrier氏は学校の機材としてAMD GPUを積極的に採用していると語っていた。
AMDがインド映画産業へのビジネス展開に肩入れするのは,別にAMDのキーパーソンがインド映画産業に太いパイプを持っているからではない。聞いたことのある人もいると思うが,インドは映画大国で,年間の制作本数はハリウッドの2倍近くもあるのだ。そうしたインド映画でも,CGが活用されるようになってきているとあれば,AMDが新興市場として注目するのも自然な流れなのである。そのインドにおける積極的なセールス活動が一定の効果をもたらしているというのが,今回のアピールというわけだ。
Tongaコア採用「Radeon R9 285」の詳細情報が公開
ワークステーション向けGPUに続いての話題は,2014年8月に発表された新GPU「Radeon R9 285」(以下,R9 285)である。
既存の「Radeon R9 280」は,型番こそ「Radeon R9」シリーズではあるものの,その中身はRadeon HD 7900系のGPUコア「Tahiti」をリネームしたものであった。それに対して,Radeon R9 285は,新しいGPUコア「Tonga」を採用している。
Radeon R9 285を解説するRichard Huddy氏 |
Radeon R9 285の特徴をまとめたスライド |
Radeon R9 285とともに発表されたゲームバンドルキャンペーン「Never Settle: Space Edition」(左)。R9 285を購入すると対象のゲームを3タイトル,無料で入手できる。目玉は「Alien: Isolation」と「Star Citizen」の2本だ(右) |
Tongaコアは,GCNアーキテクチャのGPUコアであるが,R9 280のTahitiコアはもちろんのこと,「Radeon R9 290」に採用された「Hawaii」コアよりも世代が新しいと,解説を担当したRichard Huddy氏は述べる。R9 285の詳細についてはレビュー記事を参照してもらうこととして,ここではHuddy氏が語ったTongaコアの新たな特徴を説明していこう。
まずTongaコアでは,テッセレーションステージの性能が向上しているとHuddy氏は述べる。これは,ジオメトリパイプラインの内部バッファを強化増量したことによるものとのこと。テッセレーションの分割因子(Tessellation Factor)が増えれば増えるほど――つまり,ポリゴンを細かく分割すればするほど――,R9 280よりも優れた性能を発揮できるそうだ。
次の改良点は,「Lossless Delta Color Compression」機能の搭載だ。これは,ピクセルデータを可逆圧縮して,実効メモリ帯域幅を向上させる機能である。
競合であるNVIDIAは,第2世代Maxwellコアを採用した「GeForce GTX 980」を発表したときに(関連記事),Lossless Delta Color Compression機能の改良によって,「GK104※1と比べて,メモリバスの消費量を約25%低減できた」とアピールしていた。
※1 「GeForce GTX 680」や「GeForce GTX 770」のGPUコア。
Tongaコアでは,Lossless Delta Color Compression機能をレンダーバックエンド側に搭載している。これにより,レンダリング結果の書き出しだけでなく,テクスチャユニット経由の読み出しにも対応できるという。Tongaコアではこの機能でも負けていないとアピールしているわけだ。
ちなみに,Delta Color圧縮とは差分量子化圧縮のことであり,ベストケースとワーストケースで性能差が生じる。Huddy氏によれば,ベストケースでの性能は,メモリバス幅が384bitのR9 280より,約1.4倍も実効帯域が向上するという。R9 285のメモリバス幅は256bitなので,R9 280の384bitと比べれば3分の2しかない。ベストケースとはいえ、この差を覆して約1.4倍もの性能向上を実現できるというのは,なかなか驚くべきものがある。
16bitデータを扱う命令は,演算の精度よりも速度を重視したアプリケーション,あるいは映像や音声などのメディア処理向けに拡張されたもので,SIMDレーンをまたいだ並列演算命令は,特定のGPGPU用途に向けた新命令である。
ただし,ディスプレイエンジン周りの仕様は,R9 280から据え置かれているそうで,HDMIによるRGB各8bitの4K/60Hz(60fps)出力や,YUV444の4K/60Hz出力といったHDMI 2.0に必要な仕様には対応していないそうだ。また,AMDが推進しているディスプレイ同期技術「FreeSync」(VESAの規格名「Adaptive-Sync」)に対応している。
TongaコアRadeon R9 285はGPU主動のディスプレイ同期技術「FreeSync」に対応する |
AMDが誇るハードウェアビデオエンコーダ/ハードウェアビデオデコーダもTongaコアでアップデートが施された。ただし,4K解像度の映像で使われると見込まれているコーデック「H.265」には未対応で,既存のH.264対応エンコーダとデコーダの性能が強化されたのだという。
まず,ビデオデコーダの「Unified Video Decoder」(以下,UVD)は,H.264の最上位プロファイルである「High Profile Level5.2」に対応した。これにより,4Kで60Hz(※3840×2160ピクセルで最大66.8Hzまで)に対応するほか,1920×1080ドットでは,最大172Hzという高フレームレートの動画再生に対応できるとのことだ。
ビデオエンコーダの「Video Coding Engine」も,H.264対応とはいえ4K/60Hzのリアルタイムエンコードに対応している。動作クロックの向上などによって性能が大幅に向上しており,理論上は3ストリーム分の4K/60Hz映像を同時エンコードできるという。
R9 285はTongaコアの全能力を開放したものではない
隠された機能や仕様をひもとく
これまで,GCN世代のAMD GPUは,同一コンテクストで異なるカーネルを同時に動かすことはできたが,異なるコンテクストの実行をかける(発行する)ことはできなかった。Tongaではこれが可能になったというのだ。
もう少し分かりやすくたとえると,「アプリケーションA」のカーネルをGPUコアが実行中に,「アプリケーションB」のカーネルを実行するよう,GPUコアに対して命じられるようになった。ここで重要な点は,「同時に実行できる」のではなく「実行を発行できる」ということだ。
アプリケーションAのカーネルを実行中にアプリケーションBのカーネルが発行されると,GPUが「アプリケーションBのカーネルを実行する必要がある」と判断した場合,アプリケーションAのカーネル実行に関連した情報を退避したのち,アプリケーションBのカーネルを実行するように動作する。GPUコア内のCUに手の空いているものがあれば同時実行もできるという。
こうした機能がなんの役に立つのかといえば,GPU仮想化の実現だ。ゲーム寄りの説明をするなら,クラウドゲーミングのために複数の仮想マシンを動作させる必要があるGPUサーバーを実現するために,極めて有用な機能である。
またTongaコアでは,条件分岐の処理をより効率的に行う改良も施されているようだ。
CPUが条件分岐を処理する場合,「結果が正なら命令Aを,否なら命令Bを実行」という形での処理が一般的だ。プログラム経験のある人には,「IF 条件 THEN 命令A ELSE 命令B」といえば分かりやすいだろう。
一方,GPUでの条件分岐はこれと異なり,「周辺ピクセルをひとまとめにして,結果が正の場合の命令Aと,結果が否の場合の命令Bを両方とも実行する」という処理を行うのだ。命令Aと命令Bの両方を実行しなくてはならないので,CPUの条件分岐処理と比べて,どうしても処理に時間がかかる。GPUによる条件分岐処理が遅いのはこれが理由でもあるのだ
そこでTongaコアでは,「結果が正の場合」を処理するCUとは別のCUに,「結果が否の場合」だけの処理を渡して実行させる機能が導入された。この方式なら,それぞれのCUは命令A,または命令Bだけを実行すればいいので処理時間を短縮できる。分岐後に処理すべき命令が長いほど,この効果は大きくなるわけで,全体の処理効率が大きく改善できるというわけだ。
ただし,R9 285でこれらの機能が有効化されるかどうかは不明である。
たとえばKoduri氏は,Tongaコアが備えるすべてのCUやレンダーバックエンド,メモリコントローラが,R9 285で有効化されているわけではないと,明言はしないまでも匂わせていた。つまり,R9 285はTongaコアのフルスペック版ではないというのだ。
現在のR9 285は,CUが28基でシェーダプロセッサ数は1792基,レンダーバックエンドは4基で,256bitのメモリインタフェースという構成となっている。だが,同じTongaコアをベースとしながら,CUが32基でシェーダプロセッサ数2048基,レンダーバックエンドが6基,384bitメモリコントローラという上位モデルが登場するという可能性もあり得る。R9 285のレビューでの推測が,Koduri氏によって裏付けられたといえよう。
AMDはそう遠くないうちに,別のイベントを計画しているという。フルスペック版のTongaコアを採用するGPUは,そこで発表される可能性がある。4Gamerのレビューで,「1920×1080ドットまでの解像度で使うなら,非常にバランスの取れたGPU」と評されたTongaコアがフルスペックで登場したならば,どれくらいの性能を発揮できるのだろうか。今から楽しみでならない。
AMDのRadeon R9シリーズ製品情報ページ
- 関連タイトル:
Radeon R9 200
- この記事のURL: