オススメ機能
Twitter
お気に入り
記事履歴
ランキング
お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
[GTC 2014]デュアルGK110のTITAN Zから組み込み向けTegra K1まで,上へ下へとCUDAを広げるNVIDIAの戦略を読み解く
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2014/03/28 20:21

イベント

[GTC 2014]デュアルGK110のTITAN Zから組み込み向けTegra K1まで,上へ下へとCUDAを広げるNVIDIAの戦略を読み解く

GeForce GTX TITAN Zを掲げるJen-Hsun Huang氏(Co-Founder and CEO, NVIDIA)
CUDA
 NVIDIA主催のGPU技術者会議「GPU Technology Conference 2014」(以下,GTC 2014)にて,同社CEOであるJen-Hsun Huang(ジェンスン・フアン)氏が行った基調講演レポートの最終回となる今回は,新グラフィックスカード「GeForce GTX TITAN Z」とクラウドレンダリング向け新サーバー,そしてモバイル向けSoC(System-on-a-Chip)「Tegra K1」の話題をレポートしよう。
 なお,基調講演レポートの1本めと2本めは以下に掲載しているので,まだ読んでいない人は合わせて参照してほしい。

[GTC 2014]Maxwellの次に来る次世代GPU「Pascal」。「NVLink」と3次元メモリがその“次世代性能”を切り開く

[GTC 2014]賢い人工知能はGPUで作る。NVIDIAが取り組むGPGPUの新たな活用分野「機械学習」とは何か?



ビジュアルコンピューティングを加速させるTITAN Z登場


 まずは速報で報じたGeForce GTX TITAN Z(以下,TITAN Z)の話題から。
 Jen-Hsun Huang氏(以下,Huang氏)は基調講演の中で,2基の「GK110」を1枚のカードに搭載するTITAN Zを発表した。「ゲームユーザーにとっては,地球上に存在するあらゆるゲームを,最高のセッティングと解像度,最高のフレームレートで楽しめる。ビジュアルコンピューティングユーザーには,小さなフォームファクターで最強の演算パワーを提供する」と,TITAN Zを掲げたHuang氏は誇らしげに語る。

シングルカード最強を謳うTITAN Z。「TITAN Zはエイリアンテクノロジーにインスパイアされて生まれた」とジョークを飛ばすHuang氏
CUDA

 TITAN Zの仕様は速報でも報じているが,おさらいを兼ねて記しておこう。
 TITAN Zは,「GeForce GTX TITAN Black」に相当するGPUを2基搭載するといわれるカードで,搭載するCUDA core総数は5760基,グラフィックスメモリ容量は計12GBで,総演算性能は8TFLOPSに達する。
 価格は2999ドルと,さすがに高い。これまでのデュアルGPU搭載GeForceと比べても高価だが,これは「Tesla」ブランドのGPUと同じく,倍精度浮動小数点演算機能に制限がないためだと予想されている。

 だからこそHuang氏は,TITAN Zの発表にあたり,ビジュアルコンピューティング面でのメリットに重点を置いた説明を行っている。たとえば,前回のレポートで言及した,スタンフォード大学とNVIDIAの共同開発によるGPUベースの機械学習用人工知能なら,「TITAN Zを3枚装着したサーバー1台で実現できるだろう」と,Huang氏はそのパワフルさをアピールしていた。

TITAN Zがあれば「Google Brainの機械学習性能が,300分の1の電力と400分の1の値段で実現できる」(赤枠内)とHuang氏
CUDA


映画「ライフ・オブ・パイ」にインスパイアされた,海面のCGデモを披露


 TITAN Zを手にしたHuang氏は,リアルタイムグラフィックスの歴史を振り返りながら,現代のGPUが実現するグラフィックス表現についても語った。
 まず氏が取り上げたのは,1986年のアカデミー賞でショートフィルム部門にノミネートされた,CGの歴史に名を残すショートムービー「Luxo Jr」だ。擬人化されたランプの親子によるコミカルなやりとりを描いたムービーで,制作したのはCGアニメーション映画で名高いPixarだ。このムービーに出演(?)したランプは,その後もPixarのシンボルマーク的に使われているので,目にしたことがある人もいるだろう。

 Luxo Jrが制作された当時は,Computer Consoles Inc製の「Power 6/32」という高価なミニコンを使っていたものの,1フレームをレンダリングするのに1時間半かかっていたという。それが2001年に登場した「GeForce 3」では,リアルタイムで動作させられるようになったと,Huang氏は振り返る。

CGの歴史に名を残したLuxo Jrは,当時のミニコンを使っても,1フレームをレンダリングするのに1時間半もかかったという
CUDA

ライフ・オブ・パイの海上シーンは,1フレームのレンダリングに250時間がかかった
CUDA
 では,Luxo Jrから四半世紀以上が過ぎた現在では,何が実現できるようになったのか。Huang氏が例に挙げたのは,2013年のアカデミー賞でビジュアルエフェクト賞など4部門を受賞した映画「ライフ・オブ・パイ」である。
 この映画で,CGシーンを担当したVFX制作会社のRhythm and Hues Studios(以下,R&H)は,劇中大半を占める海上シーンを描くために,48時間かけて波動シミュレーションを行い,1フレームあたり250時間をかけてレンダリングしたという。「25年の間に,コンピュータは100万倍の性能向上を実現したが,それでもR&Hは1フレームに250時間かかった」(Huang氏)。

 余談だが,R&Hは,アカデミー賞を受賞する直前に経営不振で倒産に追い込まれ,CG業界を震撼させた。VFXビジネスは売り切りビジネスなので,映画の興行収入が高くても,彼らの収入が上がるわけではないためだ。

 そんなR&Hに敬意を表したのかどうかはともかく,Huang氏は劇中に登場する夜の海にインスパイアされたという,NVIDIA制作のデモを披露した。R&Hが映画向けに制作した海上のシーンに比べれば,シーンは狭いしアセットもシンプルではあるが,TITAN Zで海面の波動シミュレーションをリアルタイムに行いながら,無数に浮かぶクラゲや小舟の挙動を計算。さらに,途中で現れる鯨が巻き上げる水しぶきのパーティクル表現も,映画に近いクオリティを目指したものだという。

CUDA CUDA
NVIDIAが制作したのライフ・オブ・パイ風の技術デモ


物理シミュレーションに力を入れるNVIDIA

TITAN Zを使った最新デモを披露


 次にHuang氏が取り上げたテーマは,NVIDIAが力を入れている物理シミュレーションの話だ。
 基調講演では,NVIDIAの物理シミュレーションエンジン「PhysX」による,新しい統合型物理ソルバーによるデモが披露された。これを使うと,流体や布,あるいは流体と剛体といった具合に,異なる材質を持つ物体の運動を,同時に解決できる物理シミュレーションを実現できるという。下にデモの様子を撮影したムービーを掲載しておこう。
 ただし,この物理ソルバーが現在のPhysXで実現されているのか,それとも将来のアップデートで実現可能になるかという点は,Huang氏の講演では触れられていない。




 なお,先の海を描いたデモで使われた要素技術や,新しい物理ソルバーは,NVIDIAが提供しているゲーム開発者向け技術支援ライブラリ「GameWorks」へとフィードバックされるようだ。
 また,これらのほかに基調講演では,「Unreal Engine 4」最新版によるデモも披露された。

Unreal Engine 4のトレイラーから。2人の人物が格闘するシーンのデモと解説が行われた
CUDA

CUDA CUDA
左の写真は,ベースカラーとテクスチャをマッピングしただけのシーン。これに物理ベースのレンダリングを行ったのが右の写真だ。各マテリアルがリアルな反射光を返している


クラウドレンダリング向けの新サーバーIray VCAを発表


 基調講演で次に取り上げられたテーマは,「クラウドレンダリング」だ。まずHuang氏は,2枚の写真を画面に示して,「1枚は写真で,1枚は『Iray』によるCG。どちらがCGか,分かるだろうか?」と聴衆に問いかけた。

左右どちらがCGだろうか?
CUDA

 正解は「左」。よく見ると,影になる部分で大局照明の影響が若干技巧的で,見る人がじっくり見ればすぐ分かる。しかし,一瞬では見分けるのは困難だろう。この画像は,NVIDIAのクラウドレンダリングソリューション「Iray」を使い,レイトレーシングでレンダリングしたものだという。

レンダリングサーバーIray VCAの実物
CUDA
 クイズに続いてHuang氏は,Iray用の新製品「Iray VCA」を発表した。VCAとは「Visual Computing Appliance」の略で,単刀直入にいえばレンダリングサーバーことだ。
 Iray VCAは,フルスペック版のGK110を8基,1台のシステムに搭載したもので,1台あたり2万3040基(2880基×8)のCUDA coreによる演算能力を利用できるという。グラフィックスメモリ容量は「1GPUあたり12GB」とのことなので,「Tesla K40」(GPUコアはGK110B)に相当するものを8基搭載しているようだ。価格は5万ドルである。

GK110Bを8基搭載し,CUDA core総数は2万3040基。価格は5万ドルとのことだ
CUDA

 Huang氏はIray VCAのデモとして,このシステムを先行評価導入した,本田技術研究所の米国子会社であるホンダR&Dアメリカズの協力によるリモートレンダリングのデモを披露した。基調講演会場から,ホンダR&DアメリカズのデータセンターにあるIray VCAを操作して,実際にリモートレンダリングをしてみせるというものだ。
 ホンダR&Dアメリカズは,次世代ハイブリッドスポーツカーである「新型NSX」のデザインを担当したことでも知られる。同社では実際のデザイン業務に,このシステムを導入しているということだった。

CUDA CUDA
ホンダR&Dアメリカズが実際に業務で使っているアセットをリモートで表示するデモが披露された

Ben Fathi氏(CTO,VMware)
 また,クラウドつながりの話題として,NVIDIAが力を入れている仮想マシンソリューション「NVIDIA GRID」の顧客である,VMwareの最高技術責任者Ben Fathi(ベン・ファティ)氏が登壇し,VMwareの仮想マシンで仮想GPUが利用できるようになることを発表した。

 ここでいう仮想GPUとは,仮想マシンでグラフィックスアプリケーションを利用できるようにGPUも仮想化する仕組みだ。具体的には,クラウド側にあるGPU 1基で,複数ユーザーの仮想マシンを動かし,グラフィックスアプリケーションを利用するというものだ。
 クラウドゲームもグラフィックスアプリケーションではあるが,VMwareが主なターゲットにしているのは,業務用の設計ソフトやCG制作ソフトといったものなので,ゲーム開発者には恩恵のある機能となるかもしれない。

 なお,Fathi氏によると,現在のスケジュールでは2014年後半から仮想GPUのテストが始まり,2015年のサービスインを計画しているという。


CUDAをモバイルにもたらす「Tegra K1」の優位性をアピール


 基調講演最後のテーマとしてHuang氏が用意したのは,「CUDA on Mobile」(モバイル上のCUDA)だ。「このテーマほど言うに優しく,実現が難しかったものは,ほかになかった」とHuang氏は振り返る。それをついに実現したのが,2014年1月に発表されたモバイル向けSoC(のTegra K1だ。
 「我々は長年,スーパーコンピュータの性能をデスクトップPCの世界に持ってくることに注力してきた。それがついに,モバイルの世界にまで持ってくることに成功したのだ」と述べるHuang氏は,同社のモバイル戦略がひとつのマイルストーンに到達したことを思ってか,どこかしみじみとした語り口だった。

Tegra K1は,192基のCUDA coreを内蔵するKepler世代GPUを搭載したSoCだ。理論性能値は326GFLOPSに達する
CUDA

 これまでのTegraでは,GPUコアにDirectX9世代の「GeForce 7000」系アーキテクチャを使ってきた。それがTegra K1により,PC向けGPUと同世代のKeplerに引き上げられるわけだ。一般ユーザーにとっても大きな変革を期待できるSoCであろう。

 さて,「モバイルスパコン」とも称されるTegra K1は,一体何に活用されるのか。Huang氏はこの問いに,「コンピュータビジョンである」と答えた。
 コンピュータビジョンとは,「機械の目」とも意訳されるコンピューティングテーマで,前回レポートした「機械学習」と密接に関わる分野でもある。そしてコンピュータビジョンを実現するために用いられる技術が,GTC 2014の大テーマでもある「ビジュアルコンピューティング」だ。つまり,これらはすべて密接に関係するのである。

 コンピュータビジョンの応用が進んでいる分野に挙げられるのが,自動車の自動運転や自立行動型ロボットだ。各種センサーから得られた情報から現実世界の3次元的な広がりを再構築して認識し,そこから注目すべき対象を認識して,それを追従したり,回避したりするといった動作にコンピュータビジョンが必要になる。

Tegra K1ベースの車載用コンピュータビジョンモジュールを掲げるHuang氏
CUDA
 Huang氏は講演の中で,コンピュータビジョンの最先端事例を紹介するとともに,Tegra K1の存在価値とそのポジショニングを,Audiによる自動運転自動車研究をもとに説明した。

 まず先端的な自動運転技術の研究では,30GFLOPSの演算能力を持つプロセッサがあれば,2Dカメラが毎秒30コマ(30fps)でとらえた2次元画像から,そこに存在するものの検出と追尾が可能になるという。
 さらに,プロセッサの演算能力が180GFLOPSになると,検出したものが「何であるか」の認識が可能になり,280GFLOPSになれば,さらに「3D空間の再構築」までが可能になるそうだ。人間でたとえると,視野に入った光景から脳内地図を構築するようなイメージだろうか。
 そして,「326GFLOPSの演算能力があるTegra K1なら,そこまでできる」というのがHuang氏の主張である。さらに演算性能を上げることが可能となれば,自動運転機械が機械学習の能力を持つことも可能になるそうだ。

CUDA
Audiにて基礎技術開発を担当するAndreas Reich氏(左)を招いて,コンピュータビジョンの最新事例を紹介するHuang氏(右)
CUDA
Audiが開発した自動車向けコンピュータビジョンのデモ。障害物を「壁」(青色の四辺形)として認識している

CUDA
ステージ上で2人がトークを披露している最中に,このシステムを搭載した無人車両が走り込んできた!
CUDA
PCベースの実験機はトランクルームが機材で埋まっていたが(左),Tegra K1ベースの試作機は,右のようにスッキリしている

Jetson TK1を掲げるHuang氏
CUDA
 Huang氏は,「コンピュータビジョンを1チップコンピュータで実現可能とするTegra K1は,歩く,走る,飛ぶ,泳ぐといった自律行動ロボットの性能を,飛躍的に上げるだろう」と主張。そして,この分野に向けたTegra K1の活用を促進するための開発キットとして,「Jetson TK1」の発売を発表した。
 Tegra K1の192 CUDA coreにちなんで,価格は192ドル。米国ではすでに予約を開始しており,日本でも菱洋エレクトロが販売する予定とのことだ。

Tegra K1を搭載して「世界初の組み込み向けスーパーコンピュータ」を謳うJetson TK1。ちなみにJetsonとは,昔のテレビアニメ「The Jetsons」(宇宙家族ジェットソン)が由来。漫画好きのHuang氏らしい命名といったところか
CUDA

 Jetson TK1は,Linuxが動作するTegra K1ベースのコンピュータで,CUDAコンパイラを初めとしたプログラミングツールや,基本的なグラフィックスツールも搭載している。そのうえ,新開発のTegra K1専用コンピュータビジョンライブラリ「VisionWorks」も付属しているとのこと。
 VisionWorksは,前述したGameWorksのコンピュータビジョン版といえるもので,コンピュータビジョンを構築するのに必要な定番ソフトウェアモジュールを,ライブラリとしてまとめたものだ。

Jetson TK1でコンピュータビジョンを実現するライブラリ群がVisionWorksだ
CUDA

 それぞれのモジュールはCUDAベースになっているので,開発したソフトウェアは基本的にCUDA環境下のシステムであれば,ほぼ透過的に動作させることが可能だ。より高性能になるであろう将来のTegraシリーズでも,利用できるだろう。

 26日に掲載した速報記事でも報じたとおり,Huang氏は最後に,Tegraのロードマップも披露した。
 今回発表されたロードマップでは,Tegra K1に続く次世代Tegraとして,MaxwellアーキテクチャのGPUを統合するSoC「Erista」(開発コードネーム)が予定されるという。

公開されたTegraシリーズの最新ロードマップ。Tegra K1の次はEristaになった
CUDA

 2013年までのロードマップにあった「Parker」が姿を消しているのは気になるところだが,NVIDIAの見解によると,「Parkerはキャンセルされたものではなく,Eristaに続くものである」というような微妙な言い回しの説明をしている。PC向けGPUのロードマップで,「Volta」の前に「Pascal」が挿入されたのと,似たようなものだろうか。

 ちなみに,Eristaとは,やはりアメコミで名高いヒーロー「ウルヴァリン」の娘の名前でもある。ウルヴァリンの名前はLoganで,Tegra K1の開発コードネームもLoganだった。次世代TegraのコードネームがLoganの娘ということは,Eristaでは大きなアーキテクチャ変更を行わずに,Loganの性能を強化する発展系SoCになる,という意味が込められているのだろうか。


上から下までCUDAを広げる周到なNVIDIAの戦略

Maxwellがハイエンド領域まで拡大されるのはいつになる?


 2時間近くに及んだHuang氏の基調講演は,非常に多くの話題が詰め込まれていたのだが,基本的にはGTC 2014のテーマである「ビジュアルコンピューティング」を明確に説明するとともに,NVIDIAが中長期的にどこへ向かおうとしているかを,分かりやすく説明していたのではないかと思う。
 NVIDIAが注力するビジュアルコンピューティングには,自動車やロボティックス,宇宙開発といった,今後の成長が見込める産業があり,Huang氏は「金脈を見つけたぞ!」という心境なのかもしれない。

 Huang氏が語った戦略には一貫性があるし,同時に「したたかさ」も感じる。GPGPUプログラミングの世界には,オープンスタンダードのAPIである「OpenCL」がライバルではあるものの,スーパーコンピュータを使った先端技術開発の分野では,CUDAがデファクトスタンダードになっている。そのため,スーパーコンピュータを使って開発された先端技術,とくにビジュアルコンピューティングの世界も,このまま行けばCUDAで開発される機会が増えていく可能性は高い。
 ハイエンドのプラットフォームはGeForceやTeslaでカバーしつつ,ローエンドとなる組み込み機器向けSoCの分野にも,Tegra K1によってCUDAベースのプラットフォームを用意する。それを後押しすべく安価な開発キットまで投入するのだから,用意周到と評するしかない。

NVIDIAは,スーパーコンピュータからクラウド,組み込み向けまで,すべてにCUDAを広げる戦略を着々と実行しつつある
CUDA

 しかし,NVIDIAの動向でひとつだけ気になる部分があるとすれば,ハイエンドGPU分野についてだろうか。
 GeForceに代表されるKepler世代のGPUは,シングルカードのTITAN Zからクラウドレンダリング向けIray VCAまで,フルスペック版GK110を搭載する製品が増えている。しかし,新世代アーキテクチャであるMaxwellコアのGPUが,中堅のGeForce GTX 750系に留まっているのが筆者には気にかかるのだ。

 GeForce GTX 750シリーズはあくまでもミドルレンジ向け製品であるし,2014年の主軸製品でありながらHDMI 2.0に未対応で,4K解像度の60HzをHDMIでは出力できない。AMDの出方を見ながらアップデートを図るのだろうとは思うが,はたしてどうなるだろうか。

 また,ゲーマーとしてもうひとつ気になるのは,次世代の「SHIELD」に関する話題がないことだ。
 Huang氏はかつて,「Tegraの世代が変わるたびに,新しいSHIELDを提供する」と予告していた。ゆえに,次世代SHIELDはTegra K1ベースになるはずで,それが実現すればAndroidベースのゲームプラットフォームとして,一気に頂点に君臨するだけの性能を備えることになるはずだ。
 しかし,GTC 2014で発表されたSHIELDに関する話題は,「『Portal』がSHIELDに移植される」というものだけだった(関連記事

 ゲーム機のアナウンスはゲームのイベントでということであれば,2014年6月のE3 2014のタイミングを考えているのかもしれない。はたしてE3 2014で,次世代SHIELDのアナウンスされるのか,1ゲーマーとして興味は尽きない。

GTC公式Webサイト(英語)

  • 関連タイトル:

    CUDA

  • 関連タイトル:

    TITAN

  • 関連タイトル:

    Tegra K1

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
トピックス
スペシャルコンテンツ
注目記事ランキング
集計:02月16日〜02月17日