NVIDIA,GeForce 6200向けにTurboCacheアーキテクチャ発表
3DMark03でのパフォーマンス比較。オンボードビデオやローエンドビデオカードとは一線を画す性能を謳う
|
NVIDIAはローエンドGPUのパフォーマンスを向上させる新たなシステムとしてTurboCacheというテクノロジを発表した。
GPUの処理では,画像書き込みやテクスチャ読み出し,Zテストなど,ビデオメモリに対するアクセスが非常に多く発生する。大量のデータを扱うのでキャッシュが効きにくく,メモリ自体の性能が問われてくる。GPUの処理性能はビデオメモリの速度が握っているといっていいだろう。256ビットアクセスやGDDR3メモリなど,CPUがアクセスするメインメモリより数段高度なテクノロジが投入されているのもそのためだ。結果として,ビデオカードの価格は,大部分がビデオメモリの値段といってよいほどになっている。
高速なメモリは当然ながら高価で,それがローエンドGPUの処理速度を上げる障害になっていた。安価なメモリで安価なビデオカードを作ると,どうしても性能に限界がある。一方で,大画面やフルスクリーンアンチエイリアシング,アニソトロピックフィルタリングなどを使用しないならば,現在のローエンドGPUでもかなりの性能が出せることは,各種ベンチマークなどでご存じの人も多いだろう。メモリアクセス量が莫大になる処理(とくに画像の品位を上げる処理)では,メモリ帯域の狭いローエンド機種に対応策はなかった。
さて,ここでPCI Expressの登場である。ビデオカードはPCI Expressの16レーンで接続されることが多く,実に5GB/secのメモリ帯域を持っている。しかし,テクスチャ転送など,普通の処理ではそんなに必要がないのが実情だ。そこで,PCI Expressの余った帯域(4GB/sec)を利用し,システムメモリ上にもレンダリングしてしまえというのが,今回のTurboCacheテクノロジの概略となる。ビデオカード上のメモリ帯域は逆に削って(3.2→2.8GB/sec)単純化しながらも,全体的なメモリ帯域は7.2GB/secから10.8GB/secに向上できる。ビデオカードはますます安くしながら,性能は最大6割向上させられる可能性が出てきた。 現状のGeForce 6200もローエンド製品としてはかなりよいパフォーマンスを出すことで知られている(5200の後継とは思えぬほど)。これがTurboCacheでさらに強化され,ビデオカードの性能は全体的に大きく底上げされることとなるだろう。 TurboCacheの実現には,ハードウェアとソフトウェアの両面での対応が必要ということで,これまでとは違った製品ラインアップが展開されることになる。GeForce 6200製品を買うときには注意が必要になるだろう。
理論的にはハイエンド機種のメモリ帯域も増やせる可能性がある技術なので,今後の展開も楽しみだ。 (aueki)
→公式解説ページは「こちら」
左が従来型,右がTurboCache時のシステム構成図。ビデオカード上のメモリ構成はデュアルチャンネルアクセスをやめてシンプルになっている。ビデオカード上での帯域幅は狭くなっているがトータルでのメモリ帯域は向上しているという
|
|
|
|