イベント
[GTC 2014]デュアルGK110のTITAN Zから組み込み向けTegra K1まで,上へ下へとCUDAを広げるNVIDIAの戦略を読み解く
なお,基調講演レポートの1本めと2本めは以下に掲載しているので,まだ読んでいない人は合わせて参照してほしい。
[GTC 2014]Maxwellの次に来る次世代GPU「Pascal」。「NVLink」と3次元メモリがその“次世代性能”を切り開く
[GTC 2014]賢い人工知能はGPUで作る。NVIDIAが取り組むGPGPUの新たな活用分野「機械学習」とは何か?
ビジュアルコンピューティングを加速させるTITAN Z登場
まずは速報で報じたGeForce GTX TITAN Z(以下,TITAN Z)の話題から。
Jen-Hsun Huang氏(以下,Huang氏)は基調講演の中で,2基の「GK110」を1枚のカードに搭載するTITAN Zを発表した。「ゲームユーザーにとっては,地球上に存在するあらゆるゲームを,最高のセッティングと解像度,最高のフレームレートで楽しめる。ビジュアルコンピューティングユーザーには,小さなフォームファクターで最強の演算パワーを提供する」と,TITAN Zを掲げたHuang氏は誇らしげに語る。
TITAN Zの仕様は速報でも報じているが,おさらいを兼ねて記しておこう。
TITAN Zは,「GeForce GTX TITAN Black」に相当するGPUを2基搭載するといわれるカードで,搭載するCUDA core総数は5760基,グラフィックスメモリ容量は計12GBで,総演算性能は8TFLOPSに達する。
価格は2999ドルと,さすがに高い。これまでのデュアルGPU搭載GeForceと比べても高価だが,これは「Tesla」ブランドのGPUと同じく,倍精度浮動小数点演算機能に制限がないためだと予想されている。
だからこそHuang氏は,TITAN Zの発表にあたり,ビジュアルコンピューティング面でのメリットに重点を置いた説明を行っている。たとえば,前回のレポートで言及した,スタンフォード大学とNVIDIAの共同開発によるGPUベースの機械学習用人工知能なら,「TITAN Zを3枚装着したサーバー1台で実現できるだろう」と,Huang氏はそのパワフルさをアピールしていた。
映画「ライフ・オブ・パイ」にインスパイアされた,海面のCGデモを披露
TITAN Zを手にしたHuang氏は,リアルタイムグラフィックスの歴史を振り返りながら,現代のGPUが実現するグラフィックス表現についても語った。
まず氏が取り上げたのは,1986年のアカデミー賞でショートフィルム部門にノミネートされた,CGの歴史に名を残すショートムービー「Luxo Jr」だ。擬人化されたランプの親子によるコミカルなやりとりを描いたムービーで,制作したのはCGアニメーション映画で名高いPixarだ。このムービーに出演(?)したランプは,その後もPixarのシンボルマーク的に使われているので,目にしたことがある人もいるだろう。
Luxo Jrが制作された当時は,Computer Consoles Inc製の「Power 6/32」という高価なミニコンを使っていたものの,1フレームをレンダリングするのに1時間半かかっていたという。それが2001年に登場した「GeForce 3」では,リアルタイムで動作させられるようになったと,Huang氏は振り返る。
この映画で,CGシーンを担当したVFX制作会社のRhythm and Hues Stu
余談だが,R&Hは,アカデミー賞を受賞する直前に経営不振で倒産に追い込まれ,CG業界を震撼させた。VFXビジネスは売り切りビジネスなので,映画の興行収入が高くても,彼らの収入が上がるわけではないためだ。
そんなR&Hに敬意を表したのかどうかはともかく,Huang氏は劇中に登場する夜の海にインスパイアされたという,NVIDIA制作のデモを披露した。R&Hが映画向けに制作した海上のシーンに比べれば,シーンは狭いしアセットもシンプルではあるが,TITAN Zで海面の波動シミュレーションをリアルタイムに行いながら,無数に浮かぶクラゲや小舟の挙動を計算。さらに,途中で現れる鯨が巻き上げる水しぶきのパーティクル表現も,映画に近いクオリティを目指したものだという。
NVIDIAが制作したのライフ・オブ・パイ風の技術デモ |
物理シミュレーションに力を入れるNVIDIA
TITAN Zを使った最新デモを披露
次にHuang氏が取り上げたテーマは,NVIDIAが力を入れている物理シミュレーションの話だ。
基調講演では,NVIDIAの物理シミュレーションエンジン「PhysX」による,新しい統合型物理ソルバーによるデモが披露された。これを使うと,流体や布,あるいは流体と剛体といった具合に,異なる材質を持つ物体の運動を,同時に解決できる物理シミュレーションを実現できるという。下にデモの様子を撮影したムービーを掲載しておこう。
ただし,この物理ソルバーが現在のPhysXで実現されているのか,それとも将来のアップデートで実現可能になるかという点は,Huang氏の講演では触れられていない。
なお,先の海を描いたデモで使われた要素技術や,新しい物理ソルバーは,
また,これらのほかに基調講演では,「Unreal Engine 4」最新版によるデモも披露された。
左の写真は,ベースカラーとテクスチャをマッピングしただけのシーン。これに物理ベースのレンダリングを行ったのが右の写真だ。各マテリアルがリアルな反射光を返している |
クラウドレンダリング向けの新サーバーIray VCAを発表
基調講演で次に取り上げられたテーマは,「クラウドレンダリング」だ。まずHuang氏は,2枚の写真を画面に示して,「1枚は写真で,1枚は『Iray』によるCG。どちらがCGか,分かるだろうか?」と聴衆に問いかけた。
正解は「左」。よく見ると,影になる部分で大局照明の影響が若干技巧的で,見る人がじっくり見ればすぐ分かる。しかし,一瞬では見分けるのは困難だろう。この画像は,NVIDIAのクラウドレンダリングソリューション「Iray」を使い,レイトレーシングでレンダリングしたものだという。
Iray VCAは,フルスペック版のGK110を8基,1台のシステムに搭載したもので,1台あたり2万3040基(2880基×8)のCUDA coreによる演算能力を利用できるという。グラフィックスメモリ容量は「1GPUあたり12GB」とのことなので,「Tesla K40」(GPUコアはGK110B)に相当するものを8基搭載しているようだ。価格は5万ドルである。
Huang氏はIray VCAのデモとして,このシステムを先行評価導入した,本田技術研究所の米国子会社であるホンダR&Dアメリカズの協力によるリモートレンダリングのデモを披露した。基調講演会場から,ホンダR&DアメリカズのデータセンターにあるIray VCAを操作して,実際にリモートレンダリングをしてみせるというものだ。
ホンダR&Dアメリカズは,次世代ハイブリッドスポーツカーである「新型NSX」のデザインを担当したことでも知られる。同社では実際のデザイン業務に,このシステムを導入しているということだった。
ホンダR&Dアメリカズが実際に業務で使っているアセットをリモートで表示するデモが披露された |
ここでいう仮想GPUとは,仮想マシンでグラフィックスアプリケーションを利用できるようにGPUも仮想化する仕組みだ。具体的には,クラウド側にあるGPU 1基で,複数ユーザーの仮想マシンを動かし,グラフィックスアプリケーションを利用するというものだ。
クラウドゲームもグラフィックスアプリケーションではあるが,VMwareが主なターゲットにしているのは,業務用の設計ソフトやCG制作ソフトといったものなので,ゲーム開発者には恩恵のある機能となるかもしれない。
なお,Fathi氏によると,現在のスケジュールでは2014年後半から仮想GPUのテストが始まり,2015年のサービスインを計画しているという。
CUDAをモバイルにもたらす「Tegra K1」の優位性をアピール
基調講演最後のテーマとしてHuang氏が用意したのは,「CUDA on Mobile」(モバイル上のCUDA)だ。「このテーマほど言うに優しく,実現が難しかったものは,ほかになかった」とHuang氏は振り返る。それをついに実現したのが,2014年1月に発表されたモバイル向けSoC(のTegra K1だ。
「我々は長年,スーパーコンピュータの性能をデスクトップPCの世界に持ってくることに注力してきた。それがついに,モバイルの世界にまで持ってくることに成功したのだ」と述べるHuang氏は,同社のモバイル戦略がひとつのマイルストーンに到達したことを思ってか,どこかしみじみとした語り口だった。
これまでのTegraでは,GPUコアにDirectX9世代の「GeForce 7000」系アーキテクチャを使ってきた。それがTegra K1により,PC向けGPUと同世代のKeplerに引き上げられるわけだ。一般ユーザーにとっても大きな変革を期待できるSoCであろう。
さて,「モバイルスパコン」とも称されるTegra K1は,一体何に活用されるのか。Huang氏はこの問いに,「コンピュータビジョンである」と答えた。
コンピュータビジョンとは,「機械の目」とも意訳されるコンピューティングテーマで,前回レポートした「機械学習」と密接に関わる分野でもある。そしてコンピュータビジョンを実現するために用いられる技術が,GTC 2014の大テーマでもある「ビジュアルコンピューティング」だ。つまり,これらはすべて密接に関係するのである。
コンピュータビジョンの応用が進んでいる分野に挙げられるのが,自動車の自動運転や自立行動型ロボットだ。各種センサーから得られた情報から現実世界の3次元的な広がりを再構築して認識し,そこから注目すべき対象を認識して,それを追従したり,回避したりするといった動作にコンピュータビジョンが必要になる。
まず先端的な自動運転技術の研究では,30GFLOPSの演算能力を持つプロセッサがあれば,2Dカメラが毎秒30コマ(30fps)でとらえた2次元画像から,そこに存在するものの検出と追尾が可能になるという。
さらに,プロセッサの演算能力が180GFLOPSになると,検出したものが「何であるか」の認識が可能になり,280GFLOPSになれば,さらに「3D空間の再構築」までが可能になるそうだ。人間でたとえると,視野に入った光景から脳内地図を構築するようなイメージだろうか。
そして,「326GFLOPSの演算能力があるTegra K1なら,そこまでできる」というのがHuang氏の主張である。さらに演算性能を上げることが可能となれば,自動運転機械が機械学習の能力を持つことも可能になるそうだ。
Audiにて基礎技術開発を担当するAndreas Reich氏(左)を招いて,コンピュータビジョンの最新事例を紹介するHuang氏(右) |
Audiが開発した自動車向けコンピュータビジョンのデモ。障害物を「壁」(青色の四辺形)として認識している |
ステージ上で2人がトークを披露している最中に,このシステムを搭載した無人車両が走り込んできた! |
PCベースの実験機はトランクルームが機材で埋まっていたが(左),Tegra K1ベースの試作機は,右のようにスッキリしている |
Tegra K1の192 CUDA coreにちなんで,価格は192ドル。米国ではすでに予約を開始しており,日本でも菱洋エレクトロが販売する予定とのことだ。
Jetson TK1は,Linuxが動作するTegra K1ベースのコンピュータで,CUDAコンパイラを初めとしたプログラミングツールや,基本的なグラフィックスツールも搭載している。そのうえ,新開発のTegra K1専用コンピュータビジョンライブラリ「VisionWorks」も付属しているとのこと。
VisionWorksは,前述したGameWorksのコンピュータビジョン版といえるもので,コンピュータビジョンを構築するのに必要な定番ソフトウェアモジュールを,ライブラリとしてまとめたものだ。
それぞれのモジュールはCUDAベースになっているので,開発したソフトウェアは基本的にCUDA環境下のシステムであれば,ほぼ透過的に動作させることが可能だ。より高性能になるであろう将来のTegraシリーズでも,利用できるだろう。
26日に掲載した速報記事でも報じたとおり,Huang氏は最後に,Tegraのロードマップも披露した。
今回発表されたロードマップでは,Tegra K1に続く次世代Tegraとして,MaxwellアーキテクチャのGPUを統合するSoC「Erista」(開発コードネーム)が予定されるという。
2013年までのロードマップにあった「Parker」が姿を消しているのは気になるところだが,NVIDIAの見解によると,「Parkerはキャンセルされたものではなく,Eristaに続くものである」というような微妙な言い回しの説明をしている。PC向けGPUのロードマップで,「Volta」の前に「Pascal」が挿入されたのと,似たようなものだろうか。
ちなみに,Eristaとは,やはりアメコミで名高いヒーロー「ウルヴァリン」の娘の名前でもある。ウルヴァリンの名前はLoganで,Tegra K1の開発コードネームもLoganだった。次世代TegraのコードネームがLoganの娘ということは,Eristaでは大きなアーキテクチャ変更を行わずに,Loganの性能を強化する発展系SoCになる,という意味が込められているのだろうか。
上から下までCUDAを広げる周到なNVIDIAの戦略
Maxwellがハイエンド領域まで拡大されるのはいつになる?
2時間近くに及んだHuang氏の基調講演は,非常に多くの話題が詰め込まれていたのだが,基本的にはGTC 2014のテーマである「ビジュアルコンピューティング」を明確に説明するとともに,NVIDIAが中長期的にどこへ向かおうとしているかを,分かりやすく説明していたのではないかと思う。
NVIDIAが注力するビジュアルコンピューティングには,自動車やロボティックス,宇宙開発といった,今後の成長が見込める産業があり,Huang氏は「金脈を見つけたぞ!」という心境なのかもしれない。
Huang氏が語った戦略には一貫性があるし,同時に「したたかさ」も感じる。GPGPUプログラミングの世界には,オープンスタンダードのAPIである「OpenCL」がライバルではあるものの,スーパーコンピュータを使った先端技術開発の分野では,CUDAがデファクトスタンダードになっている。そのため,スーパーコンピュータを使って開発された先端技術,とくにビジュアルコンピューティングの世界も,このまま行けばCUDAで開発される機会が増えていく可能性は高い。
ハイエンドのプラットフォームはGeForceやTeslaでカバーしつつ,ローエンドとなる組み込み機器向けSoCの分野にも,Tegra K1によってCUDAベースのプラットフォームを用意する。それを後押しすべく安価な開発キットまで投入するのだから,用意周到と評するしかない。
しかし,NVIDIAの動向でひとつだけ気になる部分があるとすれば,ハイエンドGPU分野についてだろうか。
GeForceに代表されるKepler世代のGPUは,シングルカードのTITAN Zからクラウドレンダリング向けIray VCAまで,フルスペック版GK110を搭載する製品が増えている。しかし,新世代アーキテクチャであるMaxwellコアのGPUが,中堅のGeForce GTX 750系に留まっているのが筆者には気にかかるのだ。
GeForce GTX 750シリーズはあくまでもミドルレンジ向け製品であるし,2014年の主軸製品でありながらHDMI 2.0に未対応で,4K解像度の60HzをHDMIでは出力できない。AMDの出方を見ながらアップデートを図るのだろうとは思うが,はたしてどうなるだろうか。
また,ゲーマーとしてもうひとつ気になるのは,次世代の「SHIELD」に関する話題がないことだ。
Huang氏はかつて,「Tegraの世代が変わるたびに,新しいSHIELDを提供する」と予告していた。ゆえに,次世代SHIELDはTegra K1ベースになるはずで,それが実現すればAndroidベースのゲームプラットフォームとして,一気に頂点に君臨するだけの性能を備えることになるはずだ。
しかし,GTC 2014で発表されたSHIELDに関する話題は,「『Portal』がSHIELDに移植される」というものだけだった(関連記事)
ゲーム機のアナウンスはゲームのイベントでということであれば,2014年6月のE3 2014のタイミングを考えているのかもしれない。はたしてE3 2014で,次世代SHIELDのアナウンスされるのか,1ゲーマーとして興味は尽きない。
GTC公式Webサイト(英語)
キーワード
Copyright(C)2013 NVIDIA Corporation