連載
西川善司の3DGE:NVIDIAが「GeForce GTX 1080」の発表会で語ったこと,語らなかったこと
氏はこの場で,「New King」としてGTX 1080を紹介していたが,それとは別に,「New Art Form」「New Sound」「New Tech」の3テーマでも発表を行っている。その一部は4Gamerでも速報としてお伝え済みだが(関連記事1,関連記事2),ここでは,現地からのレポートとして,NVIDIAの総帥が語った内容と,それに基づく筆者なりの考察をまとめてみようと思う。
GTX 1080とGTX 1070の要点
GTX 1080は,GPU Technology Conference 2016(GTC 2016)でデビューした数値演算用途の「GP100」とは異なるGPUコアを採用するGPUで,そのCUDA Core数は2560基。Maxwell世代のGM200ベースとなる「GeForce GTX TITAN X」(以下,GTX TITAN X)だとCUDA Core数は3072基,「GeForce GTX 980 Ti」(以下,GTX 980 Ti)だと同2880基なので,それらと比べるとシェーダプロセッサ数は少ない。ただ,直接の置き換え対象となる「GeForce GTX 980」(以下,GTX 980)だとCUDA Core数は2048基なので,そちらと比べると25%増しという計算だ。
採用する製造プロセス技術はGP100と同じ16nm FinFETで,総トランジスタ数は約72億個。GM200だと約80億個,GM204だと52億個だから,規模感としてはGM200により近い。
イベントには,Unreal Engine 4の開発元であるEpic Gamesの創設者(の1人)にして,今なお最前線でカリスマプログラマーとして活躍するTim Sweeney(ティム・スウィーニー)氏が登壇。新作タイトル「Paragon」のデモをGTX 1080で動作させた |
デモ実行時におけるGTX 1080のランニングステータスがこちら。GPUクロックは2.114GHz,メモリクロックは5508MHz相当で,GPU温度は67℃となっていた |
ちなみにHuang氏は,GTX 1080の理論性能値となる単精度浮動小数点演算性能を9 TFLOPSとしているが,これは2560基の1.75GHz動作時に得られる値となる。
また,メモリインタフェースは256bitで,こちらもGM200の384bitより狭いが,GTX 1080ではGDDR5Xを採用することで,この“負い目”を補おうとしている。GDDR5Xの詳細は大原雄介氏による解説記事を参照してほしいが,簡単に言えば,制御系はそのままに,データ転送レートだけをGDDR5比2倍に高めた高速改良版だ。
もっとも,GTX 1080におけるメモリクロックは10GHz相当で,メモリバス帯域幅は320GB/sと,GTX TITAN XやGTX 980 Tiの336.5GB/sにはちょっと足りない。ただし,GTX 980の224GB/sに対しては圧倒的に高い数字となっている。
ここまでをまとめると,GTX 1080というGPUは,製造プロセスのシュリンクを活かしてより高クロックで動作させることにより,前世代のトップエンドGPUを圧倒する演算性能を稼ぎ,同時に,GDDR5Xの採用でメモリバス帯域幅も稼いだ製品,ということになる。
Huang氏はGTX 1080が採用するGPUコアの開発コードネームもダイサイズも明らかにしなかったが,製造プロセス技術が28nmから16nm FinFETへと大きくシュリンクされるため,コスト的な優位なのは間違いないだろう。ゲートの作り方が異なるので一概には言えないものの,製造プロセス技術が28nmから16nmへシュリンクすると,同じトランジスタ数ならばダイ面積は約3分の1になるからだ。
GTX 1080搭載カードは北米時間5月27日に,北米市場におけるメーカー想定売価599ドル(税別)で発売予定だ。デビュー時の価格で比較すると,GTX 980は同549ドルだったので,50ドル高いスタートとなる。また,NVIDIAは今回,より高いブーストクロックでの動作を期待でき,よりよい部材も採用しているという高品位なリファレンスデザイン版カード「Founders Edition」も用意すると言うのだが,そちらは同699ドルと,GTX 980 Tiがデビューしたときの同649ドルより50ドル高い。このあたりは,国内における販売価格をイメージするときの参考になりそうだ。
なお,北米時間6月10日に発売予定のGTX 1070は,GDDR5XではなくGDDR5メモリを搭載し,搭載グラフィックスカードの想定売価が379ドル(税別)となる。Founders Editionは449ドルだ。「GeFore GTX 970」だと同299ドルだったので,「7系」としてはMaxwell世代よりも高い設定ということになる。
ちなみにGTX 1070のCUDA Core数は明らかになっていないが,6.5 TFLOPSという動作クロックが仮に1.75GHz動作時のものだとすると,1856基という計算だ。実際にはもう少し動作クロックが低く,CUDA Core数は多くなるのではないかと思うが。
……と,性能指標と価格,発売時期を明らかにしたHuang氏だが,一方で「GP100ではない」新コアの詳細など,アーキテクチャ周りについては何も語っていない。Founders Editionの詳細に関する公式の言及もない状態で,このあたりは,世界中のレビュワーに対する情報開示とその解禁を待つ必要があるだろう。
ゲーム画面キャプチャ機能の新形態「Ansel」
New Art Formは,「ゲーム画面のキャプチャ機能の新形態」となる新機能「Ansel」(アンセル)のことだ。
従来のゲーム画面キャプチャツールは,ディスプレイへ表示するフレームが描き込まれているバッファを保存するようなアプローチによる実装となっていた。そのため,取得できる画面ショットは当然のことながら,見えているものそのものということになる。
それに対してAnselでは,ゲーム内のシーンを別の角度からキャプチャできるだけでなく,ポストプロセスフィルタによる簡易的なレタッチを行ったり,オリジナルとは異なる色深度でキャプチャし,それを「OpenEXR」形式で書き出したりできる。さらには,ゲームランタイムの設定解像度から独立した,まったく別の解像度でキャプチャすることすら可能だ。
驚かされるのは,対応ゲームタイトルでAnsel機能を発動させると,ゲームの進行が止まって,視点制御までがAnsel側に移ってしまう点である。ある瞬間のゲーム世界やキャラクターを,別の角度からキャプチャできるようになるのだ。
キャプチャ画角は最大360度で,全周画像としてキャプチャできるため,その画像をVR(Virtual Reality,仮想現実)対応のヘッドマウントディスプレイ(以下,HMD)で楽しめるようになる。
レタッチ機能は,色調変更といった基本機能だけでなく,3Dグラフィックスらしい被写界深度表現をはじめとした光学エフェクトにまで及ぶ。
ゲーム世界の360度キャプチャにも対応する |
ポストエフェクトでレタッチ可能。Vignetteとは,周辺減光効果のこと |
OpenEXRというのは,Star Wars(スター・ウォーズ)で知られるGeorge Lucas(ジョージ・ルーカス)監督が設立した映画スタジオ「Lucasfilm」のCG特殊効果部門「Industrial Light&Magic」(ILM)が規定した色深度フォーマットのこと。要するに,RGB各コンポーネントを16bit浮動小数点で表現できるハイダイナミックレンジでのキャプチャが行えるというわけである。
これらAnselの機能は,Pascal世代のGPU専用というわけではなく,従来のGeForceでも利用可能という。実装形態は明らかになっていないが,視点の移動にも対応している以上,「GeForce Experience」から誰でも簡単に,どのタイトルでも……というわけにはいかないだろう。5月7日掲載の記事でもお伝えしているとおり,当初の対応タイトルは7本だが,これら7本では,ゲーム(エンジン)側と強く連携することで実現していると推測される。
そもそも視点移動は,実質的にはプレイヤーキャラクターの移動にも相当するわけで,動かしすぎると,ゲームエンジンが処理しているシーンの範囲を超えてしまう可能性もある。また,画角を最大の360度に設定した場合は,本来は描かない背面側オブジェクトや,全周の影も生成しなくてはならない。
Ansel機能は,果たして「ゲームエンジン側から,ジオメトリやテクスチャ,シェーダなどといったレンダリングリソースのすべてをもらって再レンダリングする仕組み」なのか。あるいは「ゲームエンジンをオーバーライドしてしまう仕組み」なのか。この点を,Huang氏は明らかにしていない。いつ実装するのかも,である。
ちなみに,イベント後に話を聞いたNVIDIA関係者によれば,Anselという名称は「有名な写真家から拝借した」そうだ。おそらくは20世紀に活躍した写真家,Ansel Adams(アンセル・アダムス)のことを指しているものと思われる。
GeForce.comのAnsel概要説明(英語)
レイトレーシングエンジン「OptiX」をサウンド処理に応用した「VRWorks Audio」
VRにおいて,ユーザーは全天全周の映像が楽しめるわけだが,その映像と「辻褄の合う音」が,いま求められている。
現在のところ,多くのVR対応サウンドエンジンは,音の定位を全天全周に対応するだけで留まっている。言い換えると,行われているのは音源の位置とユーザーの位置との相対位置関係に基づく定位計算だけであり,音源がシーン内のオブジェクトによって遮蔽されたり,あるいは音が反射したりする要素はサポートされていないのだ。現状の「VRサウンドシステム」は,360度定位に対応するものの,ユーザーはその直接音しか聞けていないのである。
それに対して今回のVRWorks Audioは,遮蔽や反射をサポートする。そしてその計算には,NVIDIAが誇るCUDAベースのプログラマブルレイトレーシングエンジン「OptiX」を利用するという。
NVIDIAは,レイトレーシングエンジンOptiXを,物理シミュレーションにおける衝突判定に応用できることを予告してきたが,それをサウンド処理に応用してみた結果が,VRWorks Audioというわけなのだ。
Huang氏は,プレゼンテーションにおいて,「音源の位置から1000以上のレイ(ray,線)を投げて,その反射波に対して畳み込み演算を行う」と,VRWorks Audioの概要説明を行っていた。全天全周に定位した音の反射音(=位相が逆転した音)や,遮蔽音(=特定の周波数が減退した音)を,VRWorks Audioでは再現できると見られる。
レイトレーシングにおける「レイの処理」が,粒子としての処理になるのを知っている人も多いだろう。レイトレーシングでグラフィックスを描画するときは,波としての光が持つ性質は無視するか,陰影計算時にBRDF(Bidirectional Reflectance Distribution Function:双方向反射率分布関数)などを用いて近似的にエミュレーションすることとなる。
レイトレーシングで音を取り扱うVRWorks Audioでは,反射音や遮蔽音以外を,果たしてどのレベルまでサポートするのか。たとえば,誰もが知る音響効果の1つ,ドップラー効果――過ぎ去る救急車のサイレンの音程が下がって聞こえる現象――などは,音を波動レベルで計算しなければ再現できないわけだが,こういう具体例をHuang氏は挙げなかった。
なお,NVIDIAは,VRWorks AudioのデモとしてVRコンテンツ「VR Funhouse」を近日中にリリースするとしている。VRWorks Audio,そしてVR Funhouseも,Pascal世代だけでなく,従来のGeForceをサポートするとのことだ。
GeForce.comのVRWorks Audio概要説明(英語)
新技術「Simultaneous Multi-Projection」とは?
最後のNew Techとして紹介されたのは,「Simultaneous Multi-Projection」(サイマルテイニアス・マルチプロジェクション)というものである。直訳すると「同時複数投射」機能だが,これは何だろうか。
しかし,VR対応HMD向けに2眼分描画するケースでは,この投射処理を1つのシーン描画につき2回行わなければならない。また,単なるマルチディスプレイ表示ではなく,オブジェクトの形や配置に応じた表示をマルチディスプレイ環境に対して行いたい場合も,ディスプレイ枚数分だけ投射を行う必要がある。
投射回数が複数あるというのは,レンダリングパイプラインをその回数だけ回さなければならないことと同義だ。しかし,1回のレンダリングパイプラインで,異なる投射(=異なるビューポート)を実現できれば,間違いなくレンダリング効率は向上する。だから「同時複数投射」機能なのである。
しかも,話はここで終わらない。
VRの場合,拡大光学系の接眼レンズによって映像が歪むわけだが,その歪みを吸収するために逆歪みを与えて描画することで,接眼レンズを通して見たとき正常な視界を得られるようにしているのが,今日(こんにち)におけるVR HMDの描画手法となる。そしてそのとき,拡大光学系ではレンズ外周が大きく歪むことが知られているのだが,それなら,映像外周を低解像度で描画し,中央を高解像度で描画するような投射系を実装すれば,さらに効率は上がるのではないか?
このSimultaneous Multi-Projection機能は,GeForce GTX 1000シリーズ専用機能として提供するとのこと。両GPUでは最大で16個の投射系を1回のレンダリングパイプラインで適用できるという。
Multi-Res Shadingは,ジオメトリシェーダの活用により,1ポリゴンを異なる方向に投射する処理系を実装することで実現していた機能だ。そのため,Simultaneous Multi-Projection機能も発想としては同じモノではないかという推測は成り立つのだが,しかし今回,Huang氏はその技術的な詳細を明らかにしていない。
もしかすると,Simultaneous Multi-Projection機能は,ジオメトリシェーダを活用するのではなく,ポリゴンからピクセルに分解する機能ブロックであるラスタライザ(Rasterizer)をプログラマブルに拡張したものなのかもしれない。プログラマブルラスタライザは新世代GPUへの搭載が見込まれてきた機能なので,ひょっとすると,NVIDIAが先陣を切って搭載してきた可能性がある。
そしてその場合,DirectXなどから標準機能としてサポートされなければならない。NVIDIA単独の機能拡張では,ゲーム開発者やアプリケーション開発者が積極的に活用する機能にはなり得ないからである。
Simultaneous Multi-Projection機能がどういう仕組みで実装されているのかは,注視していく必要があるだろう。
……といったところで,Huang氏は見事に,技術面の核心に関する言及を避けたというのが,発表会を通じての感想だ。今回残された「謎」については,取材を進め,あらためて解説したいと思う。
NVIDIAのGTX 1080特設ページ
- 関連タイトル:
GeForce GTX 10
- この記事のURL: