お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2011/12/13 11:00

インタビュー

AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か

 大きな期待とともに登場したAMDの新世代CPU「AMD FX」だが,競合製品はおろか,自社の従来製品にもベンチマークでは劣るところがあるなど,その船出は厳しいものとなっている(関連記事)。レビューの評価も全世界的に低調だが,そんな状況を受けて……かどうか,AMDのマーケティング担当者が緊急来日。デスクトップ製品のマーケティングを担当するSasa Marinkovic氏と,ソフトウェア全般のマーケティングを担当するTerry Makedon氏の両名が4Gamerのインタビューに応じ,「Bulldozerアーキテクチャの本領が発揮されるのはこれからだ」と語ってくれた。
 今回は両氏の発言内容と,そこから分かったことをまとめてみたいと思う。

画像集#002のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
Sasa Marinkovic氏(Senior Manager, Desktop and Software Product Marketing, AMD)
画像集#003のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
Terry Makedon氏(Manager, Fusion Software Marketing, AMD)


なぜAMD FXは性能が出ないのか


 AMD FXシリーズで採用されているBulldozerアーキテクチャでは,より少ないトランジスタ数でマルチコア化を実現することが最大のテーマとなっている。その結果として誕生したのが,従来製品よりも簡略化された整数演算ユニット2基と,共有される1基の浮動小数点演算ユニットなどからなる「Bulldozer Module」(以下,Bulldozerモジュール)だ。
 Bulldozerアーキテクチャにおける整数演算ユニットをAMDは「x86コア」と定義しているため,Bulldozerモジュール1基は“2コア”。その定義に従って計算したとき,競合よりも微細化度合いで劣る32nm SOIプロセス技術を用いながらも,比較的小さなダイサイズで“8コア”CPUを実現できているというのが,AMD FXにおける最大のアピールポイントとなる。

 しかし,簡略化――具体的には,コアあたりの整数演算パイプラインとアドレスジェネレータが各3本だったPhenom IIに対し,AMD FXで各2本に削減されたことにより,ゲーム性能や一般PC用途における性能では,競合製品はもとより,Phenom IIにも見劣りするという事態が生じてしまった(関連記事)。

パイプラインの簡略化だけでなく,Phenom IIの「K10」アーキテクチャでは1コアが最大6個の内部命令(Micro OPerations,以下 μOPs)を処理できていたのに対し,Bulldozerでは同4μOPsとなって,Bulldozerモジュール全体でも同8μOPsに留まるという事実もある。コアあたりのIPC(Instruction Per Cycle,1サイクルで実行できる命令数)は確実に低下しているのだ
画像集#007のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か 画像集#008のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か

 インタビューではまずこのことを聞いてみたが,Marinkovic氏いわく「シングルスレッドしか使わないアプリケーションや古いゲームタイトルで,パフォーマンスが見劣りするのは仕方ない」。ただし,「はじめからマルチスレッド処理を前提に開発されている『Battlefield 3』などの最新ゲームタイトルでは,CPUパフォーマンスでAMD FXが見劣りすることはないはずだ」と,Bulldozerアーキテクチャのアプローチは間違えていないという認識も示している。

画像集#009のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
マルチコアやマルチスレッド対応のアプリケーションではBulldozerアーキテクチャの性能を引き出せるとしたスライド
画像集#010のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
AMDによるBattlefield 3ベンチマークスコア比較。マルチコアに最適化されたアプリケーションならBulldozerのよさが出るという

64bit環境の登場と,64bit環境に最適化されたアプリケーションの登場にタイムラグがあったように,Bulldozerアーキテクチャのようなマルチコアへ最適化されたアプリケーションの登場にも時間がかかるとMarinkovic氏
画像集#006のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
 もちろんMarinkovic氏も,ユーザーがAMD FXの性能に満足していない事例があることは把握している。「これまでのCPUの進化を振り返っても,ハードウェアの進化にソフトウェアの対応が追いつくまでに一定の時間を要している。現在は,マルチスレッド(≒マルチコア)対応アプリケーションも増えつつあるが,シングルスレッドしかサポートしていないソフトのほうが圧倒的に多い実情は理解している」というのが同氏の弁だ。要するに,シングルスレッドに最適化されたアプリケーションではPhenom IIのほうが高速に処理できる場合があり,それを改善するには時間がかかる,というわけである。

 興味深いのは,この流れのなかで氏が「最適化すべきはアプリケーションだけではない。OSレベルでも改善すべき点がある」と指摘していることだ。

Windows 8ではBulldozerアーキテクチャへの最適化が果たされ,ゲーム性能も向上するというスライド。Marinkovic氏は,Windows 7に向けてもスケジューラの最適化パッチを提供する計画があるとしている
画像集#011のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
 AMD FXの発表時に,AMDでCPUやAPUのマーケティングを統括するJohn Taylor氏は,「Windows 8のスケジューラでは,(AMD FXは)より高い性能を発揮できる」と予告していた。それを受けてMarinkovic氏が述べるには,「スケジューラがマルチコアCPUへ最適化されることもさることながら,各コアへのキュー(※ここでは「CPUの処理待ち行列」の意)の割り当ても,Windows 8ではBulldozerアーキテクチャへ最適化されるよう,Microsoftと協力している」とのこと。共有型浮動小数点演算ユニットの利用でボトルネックが生じないようにスレッドやプロセスのスケジューリングだけに留まらない形で,OSレベルにおけるBulldozerアーキテクチャへの最適化がなされるというわけである。

 さらに氏は「Windows 7がBulldozerアーキテクチャへ最適化されるよう,Microsoftと協力してスケジューラの最適化パッチ(の準備)を進めている」とも述べている。リリース時期は「未定」(同氏)だそうだが,将来的に,Windows 7環境でもAMD FXの性能最適化が図られると予告されたのは大きなニュースだ。


アプリケーションの最適化が性能向上の鍵


2011年3月にリリースされたx86 Open64 Compiler Suite v4.2.5では,Bulldozerアーキテクチャで拡張されたAVXやFMA4などの機能が盛り込まれ,Bulldozerアーキテクチャへの最適化を果たした
画像集#012のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
 今になって思えば,AMDのソフト開発環境整備は遅きに失したと言ってもいいだろう。AMDからソフトウェアデベロッパなどに提供されているオープンソースのコンパイラスイート「AMD x86 Open64 Compiler Suite」が,Bulldozerアーキテクチャへの対応を果たしたのは2011年3月のこと。あれからたった半年強で,Bulldozerアーキテクチャに対応したアプリケーションを揃えろというのは無理な話だ。

 ただ,風向きは変わるというのがAMDの見方である。
 同社の推進するAPU(Accelerated Processing Unit)が,Bulldozerコアの改良版となる「Piledriver」(パイルドライバー,開発コードネーム)コアを採用する予定になっていたり,CPUとGPUを組み合わせた異種複合コンピューティングアーキテクチャ「Fusion System Architecture」(以下,FSA)の本格展開が控えていたりするためだ。

画像集#013のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
今後,APUへの移行が加速するとAMDは予測している
画像集#014のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
異種混合コンピューティングを加速させるFSAは,2012年より本格的に普及が始まる

 FSAにおいてAMDは,CPUとGPUとでメモリ内のデータ共有を効率化することにより,ハードウェアレベルでスムーズな連係を実現するという。また,複数世代のGPU命令セットへ透過的なアクセスを可能にする新しい中間レイヤーと,ランタイムコンパイラ「AMD JIT」(Just In-time Compiler)を提供することで,よりシームレスにGPUとCPUが連係できる環境を作り出そうとしている。
 AMDはまた,プログラミング環境の改善も図る予定だ。異種混合コンピューティングに向けたC++の拡張であるMicrosoftの「C++ AMP」に「AMD x86 Open64 Compiler」を対応させるほか,ミドルウェアベンダーと協力して,個人プログラマーでも異種混合コンピューティングに対応したソフトウェアの開発を容易に行えるようにする意向も示していたりる。

画像集#016のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
マルチコアへの対応もさることながら,GPUの性能を活かしたヘテロジニアスコンピューティングへ移行を加速すべきタイミングに差しかかっていると,Makedon氏は語る
画像集#017のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
CPU演算性能の成長とGPU演算性能の成長とを比較したスライド。「急速に性能が向上し続けているGPUを利用しない手はない」というのがAMDの意見だ

 Makedon氏は,「2012年はFSA元年になる」と述べ,「APUだけでなく,AMD FXも処理性能の向上を果たす」とアピールしている。
 次期GPUの「Southern Islands」(サザンアイランド,開発コードネーム)シリーズで採用予定の新GPUアーキテクチャでは,仮想メモリやキャッシュのスヌープ(snoop,キャッシュのデータ書き換えに伴って,システムメモリ上にデータの更新があった場合,同データを共有しているほかのコアに通知し,そのデータを参照する必要がある場合にメモリ上のデータをキャッシュへ再読み込みすること)などの機能が盛り込まれている。これにより,APUだけでなく,単体GPUと単体CPUとの組み合わせによる異種混合コンピューティング環境をも強化しようというわけである。

画像集#004のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
ソフトウェアデベロッパの間ではここ数年,CPUの動作周波数とIPCが常に向上してきたことにより,ソフトウェアに手を加えることのなく性能向上が得られる“タダ飯”時代はすでに終わったと言われている。マルチコアに最適化したソフトウェア開発の重要性が説かれ続けているのだ
画像集#005のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
OpenCLの普及度合いを示したスライド。ここで注目すべきは,Intelのマルチスレッド対応開発環境である「Intel Threading Building Blocks」と「Intel Parallel Building Blocks」が上位にあることだ。これは,Intelに向けた開発ツールの提供は積極的に行われているが,AMDに向けた開発ツールの提供が不十分であることを示している

 つまりAMDは,次期APU「Trinity」(トリニティ,開発コードネーム)のBulldozerアーキテクチャ採用や,FSA環境の構築こそが,Bulldozerアーキテクチャへのソフトウェア最適化を加速させるきっかけになると見ているのだ。AMDがFSA元年と位置づける2012年が――あと1か月もないといえばないが――やってくるまでは,不利な状況になるのを覚悟していると言えなくもない。

 ただ,製品を作って売るメーカーとして「年内は諦めてます」と言うわけにもいかないということか,AMDは,AMD FXがPCゲームに最適なプラットフォームだと位置づけている。Marinkovic氏によれば,その優位性は以下に挙げる2点だ。

  1. LGA1366版Core i7よりも優れた価格対性能比
  2. 同価格帯のLGA1155版Core i7&i5よりも優れた実性能

 「あのテスト結果で,それが優位性だと言われても」と思う読者は多いだろう。一体どういうことなのか説明を求めたところ,「最新ゲームタイトルでは,CPU性能よりもGPU性能のほうが重要になる」という旨の回答が返ってきた。

画像集#018のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
LGA1366版の「Core i7-980X/3.33GHz」を購入しても,最新ゲームタイトルにおいては,FX-8150と性能面で差が出ないため,「その差額をグラフィックスカードに回したほうがよい!」というのがAMDの主張だ
画像集#015のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
4Gamer読者には釈迦に説法だが,ゲームにおいてはCPU性能よりもGPU性能が総合的な体感を左右する

 つまり1.は「1000ドル以上のCPUを購入しても,ゲーム性能に与える影響はごくわずか。であれば,同じ予算で『FX-8150/3.6GHz』を購入して,より高性能なグラフィックスカードを購入したほうが,優れた性能を得られる」ということなのだ。ちなみに2.は「マルチGPU構成時に,AMDなら,PCI Express 2.0 x16 ×2をサポートできる優位性がある」とのことだった。

LGA1155版Core i5&i7だと,CPUとつながるPCI Express 2.0インタフェースは16レーンなので,マルチGPU構成時は8レーン×2となってしまう。だがAMDプラットフォームならフルスペックで接続可能,というのが2.の目セージだ。ただ,言うまでもないことだが,シングルカード構成で十分な(圧倒的大多数の)ユーザーからすると,微妙なアピールである
画像集#019のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か 画像集#020のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か

 以上,正直,納得いく説明とはとても言えないが,IT企業のマーケティング活動でよくある手法によるものなのは確か。新世代CPUアーキテクチャへの期待が大きすぎたことが,AMD FXの実性能に対するガッカリ感を煽ったのではないかという印象を受けた。


Bulldozerアーキテクチャが目指すものとは


 AMDは,Bulldozerアーキテクチャについて未だに多くを語っていないが,方向性に関してはヒントが示されている。2010年10月に台北で開催された「AMD Technical Forum and Exhibition 2010」で,CPUアーキテクチャの開発を統括するDon Newell CTOが語った,「Bulldozerアーキテクチャは,用途や市場に応じて最適化が図れる柔軟さが特徴だ」というものだ。

 当初,Bulldozerアーキテクチャでは,コアあたりのIPCを下げてでも,コアを簡略化しメニーコア化を加速できるようにしていた。一方,シングルスレッド性能が求められる用途に向けては,動作クロックを大きく引き上げやすくし,IPCの低さを補えるような設計になっている。FX-8150がオーバークロックで動作クロックの世界記録を達成したのは,その分かりやすい例だ。
 ただ,飛躍的に消費電力の跳ね上がるオーバークロックが市民権を得られにくいことはMarinkovic氏も理解しているという。AMD FXのオーバークロック記録は,「あくまでそのポテンシャルを示すもの」と述べていた。

画像集#022のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
 それでは今後どういう方向に進んで行くのか。これについては,Marinkovic氏,Makedon氏ともに「将来の製品については,コメントできない」というスタンスを貫いており,Piledriverコアの概要などを聞くことはできていない。
 しかし,次期APUにして,Piledriverモジュールを統合する初のプロセッサとなる予定のTrinityでは,FSAに向けてGPU性能を強化しつつ,現行のA-Seriesと同レベルかそれ以下の消費電力を実現する必要がある。Piledriverは,Bulldozer以上に省電力へ最適化されたモジュールになっていると見るのが自然だ。
 AMDがBulldozerコアでCPUの簡略化を推進したのは,APUへの統合やFSAの確立によって,CPUが行う演算処理の一部を積極的にGPUへと移管することを睨んでいるためだと指摘するOEM関係者も多い。

 また,AMDはデスクトップCPUロードマップを変更したとされている。それによれば,Piledriverモジュールを5基(≒10 x86コア)統合する次期AMD FX「Komodo」(コモド,開発コードネーム)はキャンセルされ,Piledriverモジュールを4基(≒8 x86コア)統合する「Vishera」(ヴィシェラ,同)に切り替えられたとのことだ。

 これは,「次期AMD FXにおいて,従来と同じ消費電力レンジを維持しつつ動作クロックを高めることにより,シングルスレッド性能を向上させる可能性が高い」ことを意味している。
 既報のとおり,AMDは次期AMD FXでもSocket AM3+を踏襲すると言われているが,Marinkovic氏も「ゲーマーにより優れたアップグレードパスを提供すべく,今後もAMD FXの性能向上へ積極的に取り組んでいく」と,さらに高クロックな製品の投入を示唆していたこともここに記しておきたい。

Bulldozerアーキテクチャのロードマップ
画像集#021のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か

 両氏の話を聞く限り,AMD FXのアプリケーション性能は,ソフトウェアの最適化やMicrosoftのパッチ提供などによって向上していく可能性があるようだ。また,現在のCPU供給状況についても,GLOBALFOUNDRIESに要請し,速やかに安定した供給が図れるように話し合っていることも明らかになっている。あとは,これらの改善が2012年の早い時期に実現することを望むばかりである。


4Gamer読者だけにドライバアップデート情報を提供


Makedon氏が明らかにしてくれた,次期Catalyst Control Centerに追加されるプロファイルの編集機能
画像集#023のサムネイル/AMD FXの性能が発揮されない理由をAMD担当者に聞く。性能向上のカギはOSやソフトウェアの最適化か
 今回のインタビューでは,元Catalyst Guruとしてお馴染みのMakedon氏から,4Gamer読者にちょっと早めのクリスマスプレゼントがあった。氏によれば,「詳細はまだ明らかにできないが,近い将来,『Catalyst Control Center』からユーザーがCrossFireXプロファイルや3Dプロファイルを編集できるようにする」とのことだ。
 Makedon氏がチラ見せしてくれたプレゼンテーションを見る限り,AMDが提供しているゲームプロファイルごとグラフィックス設定などを,ユーザーがスライダーなどで簡単にカスタマイズできるようになりそうな気配だ。「NVIDIAコントロールパネル」の「プログラム設定」に近いイメージで,「描画品質をある程度犠牲にしつつ,フレームレートを確保する」などといったことが可能になるかもしれない。

AMD公式Webサイト(英語)

日本AMDによるAMD FX製品紹介ページ

  • 関連タイトル:

    AMD FX(Zambezi)

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
スペシャルコンテンツ
注目記事ランキング
集計:04月19日〜04月20日