リリース
NVIDIA,CUDA Toolkit 4.1をリリース。性能の最適化が謳われる
CUDA Toolkit 4.1 | |||
配信元 | NVIDIA | 配信日 | 2012/01/31 |
<以下,メーカー発表文の内容をそのまま掲載しています>
科学的研究のGPUによる高速化をすばやく簡単に実現
CUDA C/C++/Fortranアプリケーションの
パフォーマンス最大化を支援する
画期的なエキスパート・ガイダンス・システムも用意
2012年1月26日−カリフォルニア州サンタクララ−NVIDIA(本社:米国カリフォルニア州サンタクララ、社長兼CEO:ジェンスン・フアン(Jen-Hsun Huang)、Nasdaq:NVDA)は本日、CUDA並列コンピューティング・プラットフォームの新しいバージョンをリリースしました。コンピューター処理を活用する生物学者、化学者、物理学者、地球物理学者などの研究者およびエンジニアは、このプラットフォームを利用すると、シミュレーションや計算処理におけるGPU処理を容易に推進することができます。
新しいNVIDIA CUDA並列コンピューティング・プラットフォームでは、以下のように3つの大幅な機能を拡張いたしました。
●自動パフォーマンス解析搭載のVisual Profilerを見直し、アプリケーションの高速化がいままで以上に容易になりました。
●幅広く利用されているLLVMオープンソースのコンパイラ・インフラストラクチャーをベースとしたコンパイラを用意しました。アプリケーション・パフォーマンスが10%、スピードアップします。
●画像処理関数と信号処理関数を数百種類追加し、NVIDIAパフォーマンス・プリミティブ(NPP)ライブラリーのサイズを倍加しました。
オープンソースの分子動力学プロジェクト、HOOMD-blueのリードデベロッパーであるジョシュア・アンダーソン(Joshua Anderson)氏は、次のように述べています。「新しいVisual Profilerは驚異的です。ほんの何回かクリックしただけでアプリケーションのパフォーマンス解析を自動的におこない、問題がありそうな場所をハイライトで教えてくれるとともに改善に役立ちそうなベストプラクティスの提案へのリンクも提供してくれるのです。これを使えば、さまざまな種類のアプリケーションについて高速化をすばやく簡単におこなうことができます。」
ICHEC(Irish Centre for High-End Computing)のシニア・ソフトウェア・アーキテクト、ジャイルス・シバリオ(Gilles Civario)氏は、次のように述べています。「LLVMコンパイラーを使ってみたところ、財務リスクのリアルタイム分析用コードをコンパイルし直すだけでパフォーマンスが10%近くもスピードアップしました。新しくリリースされたCUDAを使ってほかの部分もチューニングしたらどれほどのパフォーマンス向上が実現できるのか、とても楽しみです。」
CUDA並列コンピューティング・プラットフォームの最新リリースには、以下の新機能が搭載されています。なお、このプラットフォームは、http://developer.nvidia.com/getcudaにあるNVIDIAデベロッパー・ウェブサイトから無償で入手できます。
新しいVisual Profiler−パフォーマンス最適化がさらに簡単に
新しいVisual Profilerは、どのような経験レベルの開発者であってもパフォーマンスが最大となるコードの最適化が簡単におこなえます。自動パフォーマンス解析が搭載されているほか、ステップ・バイ・ステップで最適化の提案をおこなってくれるエキスパート・ガイダンス・システムも用意されており、アプリケーションのパフォーマンスを制約しているボトルネックを特定し、最適化ガイドへのリンクで対策を提案してくれます。新しいVisual Profilerを使えば、パフォーマンス・ボトルネックを簡単に特定し、対策を講じることができるのです。
LLVMコンパイラ−アプリケーション・パフォーマンスが10%向上
LLVMは幅広く利用されているオープンソースのコンパイラ・インフラストラクチャーで、モジュール型の設計となっているため、サポートするプログラミング言語やプロセッサー・アーキテクチャーを簡単に追加できます。新しいLLVMベースのCUDAコンパイラを使うと、コンパイルし直すだけで、GPUによる高速化を施した従来のアプリケーションに対して最大でさらに10%もパフォーマンスを高められます。また、LLVMはモジュール型の設計となっているため、NVIDIA以外のプロセッサー・アーキテクチャーに対応したカスタムLLVMソリューションをサードパーティーのソフトウェア・ツール開発者が提供することも可能です。この場合、NVIDIA GPUと他ベンダーのプロセッサーでCUDAアプリケーションを走らせることができます。
新しい画像処理・信号処理のライブラリー−NPPライブラリーによる“ドロップイン”アクセラレーション
NVIDIAは画像処理関数と信号処理関数を数百種類も追加し、NPPライブラリーのサイズを倍加しました。この結果、画像処理や信号処理のアルゴリズムを使うケースでGPUアクセラレーションのメリットを簡単に得られるようになりました。アプリケーションにライブラリー・コールを追加するだけなので、基本的にどのような開発者であっても利用できます。最新のNPPライブラリーは、基本的なフィルタリングから高度なワークフローに至るまで、幅広い画像処理・信号処理のアルゴリズムで活用可能です。
- 関連タイトル:
CUDA
- この記事のURL: