インタビュー
AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
今回は両氏の発言内容と,そこから分かったことをまとめてみたいと思う。
Sasa Marinkovic氏(Senior Manager, Desktop and Software Product Marketing, AMD) |
Terry Makedon氏(Manager, Fusion Software Marketing, AMD) |
なぜAMD FXは性能が出ないのか
AMD FXシリーズで採用されているBulldozerアーキテクチャでは,より少ないトランジスタ数でマルチコア化を実現することが最大のテーマとなっている。その結果として誕生したのが,従来製品よりも簡略化された整数演算ユニット2基と,共有される1基の浮動小数点演算ユニットなどからなる「Bulldozer Module」(以下,Bulldozerモジュール)だ。
Bulldozerアーキテクチャにおける整数演算ユニットをAMDは「x86コア」と定義しているため,Bulldozerモジュール1基は“2コア”。その定義に従って計算したとき,競合よりも微細化度合いで劣る32nm SOIプロセス技術を用いながらも,比較的小さなダイサイズで“8コア”CPUを実現できているというのが,AMD FXにおける最大のアピールポイントとなる。
しかし,簡略化――具体的には,コアあたりの整数演算パイプラインとアドレスジェネレータが各3本だったPhenom IIに対し,AMD FXで各2本に削減されたことにより,ゲーム性能や一般PC用途における性能では,競合製品はもとより,Phenom IIにも見劣りするという事態が生じてしまった(関連記事)。
インタビューではまずこのことを聞いてみたが,Marinkovic氏いわく「シングルスレッドしか使わないアプリケーションや古いゲームタイトルで,パフォーマンスが見劣りするのは仕方ない」。ただし,「はじめからマルチスレッド処理を前提に開発されている『Battlefield 3』などの最新ゲームタイトルでは,CPUパフォーマンスでAMD FXが見劣りすることはないはずだ」と,Bulldozerアーキテクチャのアプローチは間違えていないという認識も示している。
マルチコアやマルチスレッド対応のアプリケーションではBulldozerアーキテクチャの性能を引き出せるとしたスライド |
AMDによるBattlefield 3ベンチマークスコア比較。マルチコアに最適化されたアプリケーションならBulldozerのよさが出るという |
興味深いのは,この流れのなかで氏が「最適化すべきはアプリケーションだけではない。OSレベルでも改善すべき点がある」と指摘していることだ。
さらに氏は「Windows 7がBulldozerアーキテクチャへ最適化されるよう,Microsoftと協力してスケジューラの最適化パッチ(の準備)を進めている」とも述べている。リリース時期は「未定」(同氏)だそうだが,将来的に,Windows 7環境でもAMD FXの性能最適化が図られると予告されたのは大きなニュースだ。
アプリケーションの最適化が性能向上の鍵
ただ,風向きは変わるというのがAMDの見方である。
同社の推進するAPU(Accelerated Processing Unit)が,Bulldozerコアの改良版となる「Piledriver」(パイルドライバー,開発コードネーム)コアを採用する予定になっていたり,CPUとGPUを組み合わせた異種複合コンピューティングアーキテクチャ「Fusion System Architecture」(以下,FSA)の本格展開が控えていたりするためだ。
今後,APUへの移行が加速するとAMDは予測している |
異種混合コンピューティングを加速させるFSAは,2012年より本格的に普及が始まる |
FSAにおいてAMDは,CPUとGPUとでメモリ内のデータ共有を効率化することにより,ハードウェアレベルでスムーズな連係を実現するという。また,複数世代のGPU命令セットへ透過的なアクセスを可能にする新しい中間レイヤーと,ランタイムコンパイラ「AMD JIT」(Just In-time Compiler)を提供することで,よりシームレスにGPUとCPUが連係できる環境を作り出そうとしている。
AMDはまた,プログラミング環境の改善も図る予定だ。異種混合コンピューティングに向けたC++の拡張であるMicrosoftの「C++ AMP」に「AMD x86 Open64 Compiler」を対応させるほか,ミドルウェアベンダーと協力して,個人プログラマーでも異種混合コンピューティングに対応したソフトウェアの開発を容易に行えるようにする意向も示していたりる。
マルチコアへの対応もさることながら,GPUの性能を活かしたヘテロジニアスコンピューティングへ移行を加速すべきタイミングに差しかかっていると,Makedon氏は語る |
CPU演算性能の成長とGPU演算性能の成長とを比較したスライド。「急速に性能が向上し続けているGPUを利用しない手はない」というのがAMDの意見だ |
Makedon氏は,「2012年はFSA元年になる」と述べ,「APUだけでなく,AMD FXも処理性能の向上を果たす」とアピールしている。
次期GPUの「Southern Islands」(サザンアイランド,開発コードネーム)シリーズで採用予定の新GPUアーキテクチャでは,仮想メモリやキャッシュのスヌープ(snoop,キャッシュのデータ書き換えに伴って,システムメモリ上にデータの更新があった場合,同データを共有しているほかのコアに通知し,そのデータを参照する必要がある場合にメモリ上のデータをキャッシュへ再読み込みすること)などの機能が盛り込まれている。これにより,APUだけでなく,単体GPUと単体CPUとの組み合わせによる異種混合コンピューティング環境をも強化しようというわけである。
つまりAMDは,次期APU「Trinity」(トリニティ,開発コードネーム)のBulldozerアーキテクチャ採用や,FSA環境の構築こそが,Bulldozerアーキテクチャへのソフトウェア最適化を加速させるきっかけになると見ているのだ。AMDがFSA元年と位置づける2012年が――あと1か月もないといえばないが――やってくるまでは,不利な状況になるのを覚悟していると言えなくもない。
ただ,製品を作って売るメーカーとして「年内は諦めてます」と言うわけにもいかないということか,AMDは,AMD FXがPCゲームに最適なプラットフォームだと位置づけている。Marinkovic氏によれば,その優位性は以下に挙げる2点だ。
- LGA1366版Core i7よりも優れた価格対性能比
- 同価格帯のLGA1155版Core i7&i5よりも優れた実性能
「あのテスト結果で,それが優位性だと言われても」と思う読者は多いだろう。一体どういうことなのか説明を求めたところ,「最新ゲームタイトルでは,CPU性能よりもGPU性能のほうが重要になる」という旨の回答が返ってきた。
LGA1366版の「Core i7-980X/3.33GHz」を購入しても,最新ゲームタイトルにおいては,FX-8150と性能面で差が出ないため,「その差額をグラフィックスカードに回したほうがよい!」というのがAMDの主張だ |
4Gamer読者には釈迦に説法だが,ゲームにおいてはCPU性能よりもGPU性能が総合的な体感を左右する |
つまり1.は「1000ドル以上のCPUを購入しても,ゲーム性能に与える影響はごくわずか。であれば,同じ予算で『FX-8150/3.6GHz』を購入して,より高性能なグラフィックスカードを購入したほうが,優れた性能を得られる」ということなのだ。ちなみに2.は「マルチGPU構成時に,AMDなら,PCI Express 2.0 x16 ×2をサポートできる優位性がある」とのことだった。
以上,正直,納得いく説明とはとても言えないが,IT企業のマーケティング活動でよくある手法によるものなのは確か。新世代CPUアーキテクチャへの期待が大きすぎたことが,AMD FXの実性能に対するガッカリ感を煽ったのではないかという印象を受けた。
Bulldozerアーキテクチャが目指すものとは
AMDは,Bulldozerアーキテクチャについて未だに多くを語っていないが,方向性に関してはヒントが示されている。2010年10月に台北で開催された「AMD Technical Forum and Exhibition 2010」で,CPUアーキテクチャの開発を統括するDon Newell CTOが語った,「Bulldozerアーキテクチャは,用途や市場に応じて最適化が図れる柔軟さが特徴だ」というものだ。
当初,Bulldozerアーキテクチャでは,コアあたりのIPCを下げてでも,コアを簡略化しメニーコア化を加速できるようにしていた。一方,シングルスレッド性能が求められる用途に向けては,動作クロックを大きく引き上げやすくし,IPCの低さを補えるような設計になっている。FX-8150がオーバークロックで動作クロックの世界記録を達成したのは,その分かりやすい例だ。
ただ,飛躍的に消費電力の跳ね上がるオーバークロックが市民権を得られにくいことはMarinkovic氏も理解しているという。AMD FXのオーバークロック記録は,「あくまでそのポテンシャルを示すもの」と述べていた。
しかし,次期APUにして,Piledriverモジュールを統合する初のプロセッサとなる予定のTrinityでは,FSAに向けてGPU性能を強化しつつ,現行のA-Seriesと同レベルかそれ以下の消費電力を実現する必要がある。Piledriverは,Bulldozer以上に省電力へ最適化されたモジュールになっていると見るのが自然だ。
AMDがBulldozerコアでCPUの簡略化を推進したのは,APUへの統合やFSAの確立によって,CPUが行う演算処理の一部を積極的にGPUへと移管することを睨んでいるためだと指摘するOEM関係者も多い。
また,AMDはデスクトップCPUロードマップを変更したとされている。それによれば,Piledriverモジュールを5基(≒10 x86コア)統合する次期AMD FX「Komodo」(コモド,開発コードネーム)はキャンセルされ,Piledriverモジュールを4基(≒8 x86コア)統合する「Vishera」(ヴィシェラ,同)に切り替えられたとのことだ。
これは,「次期AMD FXにおいて,従来と同じ消費電力レンジを維持しつつ動作クロックを高めることにより,シングルスレッド性能を向上させる可能性が高い」ことを意味している。
既報のとおり,AMDは次期AMD FXでもSocket AM3+を踏襲すると言われているが,Marinkovic氏も「ゲーマーにより優れたアップグレードパスを提供すべく,今後もAMD FXの性能向上へ積極的に取り組んでいく」と,さらに高クロックな製品の投入を示唆していたこともここに記しておきたい。
両氏の話を聞く限り,AMD FXのアプリケーション性能は,ソフトウェアの最適化やMicrosoftのパッチ提供などによって向上していく可能性があるようだ。また,現在のCPU供給状況についても,GLOBALFOUNDRIESに要請し,速やかに安定した供給が図れるように話し合っていることも明らかになっている。あとは,これらの改善が2012年の早い時期に実現することを望むばかりである。
4Gamer読者だけにドライバアップデート情報を提供
Makedon氏がチラ見せしてくれたプレゼンテーションを見る限り,AMDが提供しているゲームプロファイルごとグラフィックス設定などを,ユーザーがスライダーなどで簡単にカスタマイズできるようになりそうな気配だ。「NVIDIAコントロールパネル」の「プログラム設定」に近いイメージで,「描画品質をある程度犠牲にしつつ,フレームレートを確保する」などといったことが可能になるかもしれない。
AMD公式Webサイト(英語)
日本AMDによるAMD FX製品紹介ページ
- 関連タイトル:
AMD FX(Zambezi)
- この記事のURL: