連載
西川善司の3DGE:AMD基調講演レポート〜新Ryzenのトップモデルは12C24T対応で価格は500ドル,新GPUのNaviはリアルタイムレイトレーシング対応か
本稿では,この基調講演内で発表された内容を整理してみることにしたい。
Su氏は最初に,競合たちに先駆けて2018年後期から先進製造プロセスの7nmを活用して新CPUや新GPUを2019年初頭に投入できたことと,Zen 2コアベースの新CPUはI/OダイとCPUダイとでプロセスルールの適材適所の使い分けを行うチップレットアーキテクチャを採用したことなどを振り返った。
発表された情報をまとめると,以下の4点になる。
- Zen 2ベースのデータセンター/サーバー向けCPU「EPYC」(開発コードネーム:ROME)の採用事例
- これまで開発コードネーム以外は謎だった「Navi」の素性に言及
- Zen 2ベースの新CPU,第3世代Ryzen
- PCI-Express Gen4プラットフォームを競合に先駆けて始動
世界最速スーパーコンピュータに第2世代EPYCが採用へ
1.の新EPYCの技術的詳細については,2018年11月のZen 2発表時に詳細を公開済みだ。Zen/Zen+世代に対しZen 2の分かりやすい改良ポイントである「浮動小数点演算性能の改善」をはじめ,Zen 2ファミリーから導入されることとなった製造プロセスの異なるCPUダイ(7nm)とI/Oダイ(14nm)とでCPUパッケージを構成する「チップレットアーキテクチャ」の採用理由などについては,すでに公開済みの筆者の解説記事をご覧いただきたい。
今回の新EPYC関連での発表のポイントは技術的なことよりも,ビジネス的に大きな成功を収めつつあることの報告にあった。
大手データセンター/サーバー事業者への採用事例が相次いでいることに触れつつ,最もSu氏が誇らしげに語ったのは,米エネルギー省が2021年にオークリッジ国立研究所へ納入予定の新型スーパーコンピュータにこの新EPYCが採用されることが決定したというニュースだった。
オークリッジ国立研究所のスパコンは,これまでにも何度も世界最速の称号を獲得してきているが,そのCPUとGPUが共にAMDベースとなるのは初めてのこと。目標性能は1500000TFLOPS,すなわち1.5EFLOPS(エクサフロップス)だとのことで(※1Exaは100京,1Exa=1000Peta=1000000Tera。ハイエンドのPC用GPUで16TFLOPS程度),これが実現すれば間違いなく「世界最速のスパコンはAMD製」という称号を得ることになる。
なお,第2世代EPYCは2019年第3四半期の出荷を予定しているとのことである。
NaviはRDNAアーキテクチャへ。年内投入を確約するも,ただしその素性は明かされず。
続いて発表されたのは新GPU,開発コードネーム「Navi」だ。
これまで幾度となく開発コードネームが紹介されるも,その素性について触れられることはなかったわけだが,今回の基調講演では「Naviについて」という時間帯を設けてこれに言及した。
ただ結論から言うと,判明したのは製品名とコアアーキテクチャ名,そして先代Vegaに対する相対的な性能指標値のみである。詳細については6月にロサンゼルスで開催予定のE3 2019時での発表を待て……ということらしい。
ただ,この基調講演のあとに行われたGPUブリーフィングでは,やや詳細について聞くことができたので,このセクションでは基調講演で語られたことに加えて,このブリーフィングで得られた情報も付記しておく。
まず,Su氏が触れたのは,SIEのPlayStatinハードウェアのアーキテクトを務めるMark Cerny氏が,米誌Wiredからの取材に対して次世代PlayStationのハードウェア仕様について多くのヒントを提供したことについてだった。
この中でSu氏は「次世代PlayStationではAMD製のZen 2世代CPUとNavi世代GPUが採用されることとなった」とインタビュー内容を認め,AMDが依然としてゲーム専用機(家庭用ゲーム機)に強い半導体メーカーであることをアピールした。
前述したように詳細は明かさなかったものの,Su氏はいくつかのヒントとも言えるキーワードを語った。
情報量はあまりないのだがキャッチーなキーワードとして紹介されたのはその新アーキテクチャ名「RDNA」だ。
RDNAは,これまでのRadeonのコアアーキテクチャ名であった「GCN:Graphics Core Next」に代わるものだそうだ。ブリーフィングで質問した際に得られた返答によれば「R」はRadeonのRで,続く「DNA」はなにかの当て字ではなく,生物学用語のデオキシリボ核酸(DNA)以上に深い意味はないとのことである。
では「RDNAは何なのか」というと「リアルタイムグラフィックスに特化したGPUコアアーキテクチャ」だそうだ。これ以上の情報は引き出せなかったが,グラフィックス用途ではRDNAベースのGPU,Radeon IntinctのようなAIやGPGPU用途向けにはGCNベースのGPUを引き続き登場させていくということなのだろう。
ブリーフィングで筆者は「RDNAはレイトレーシングアクセラレータを内包するグラフィックスパイプラインのことなのか」「Radepon Pro RenderはRDNAをアクセラレーションできるか」「Vegaで発表された新シェーダステージのPrimitive ShaderはRDNAでも対応しているのか」と立て続けに質問してみたところ,最初の二つの質問に対しては「E3まで待て」という返答で,最後の質問に対しては「Yes」という答えが得られた。核心的な情報を得るにはもう少し待たなければならないようだ。
(※先に挙げたMark Cerny氏によるインタビューでは,次世代PlayStation用のカスタムAPUがNavi系列のGPUコアを搭載していることとリアルタイムレイトレーシングを行うことは明らかにされている)
Su氏の基調講演の話に戻すと,Su氏は,このほか,7nm製造プロセスの恩恵と7nm製造プロセスへの物理設計の最適化の相乗効果でより「高クロック動作への対応」と「省電力性能の向上」が実現されていると言及した。1クロックあたりのパフォーマンス向上率は先代のVegaアーキテクチャに対して1.25倍,省電力性能も1.5倍に向上しているという。この数値の比較対象が14nm製造プロセスのオリジナルVegaなのか,7nm製造プロセスの「Vega 7nm」なのかは明言されていない。
また,NaviはPCI-Express Gen4対応の最初のゲーム向けGPUであるという,含みを持った説明も行われていた。これについては簡単に補足しておこう。実は開発コードネーム「Vega 7nm」はチップレベルではPCI-Express Gen4対応済みなのだ。ただ,PCI-Express Gen4対応なのは,AI/GPGPU用途の「Radeon Instinct」モデルのみで,「Vega 7nm」コアベースのゲーム向けGPUである「Radeon VII」は意図的にPCI-Express Gen3までの対応とされてしまった。そんな理由で「ゲーム向け単体GPUではNaviが最初」というわけである。
競合のNVIDIAが,リアルタイムレイトレーシング技術に対応させた新GPUに,従来の「GTX」から「RTX」とシリーズ記号を改めたのに対し,Naviはシリーズ記号はRXのまま据え置いて数値型番を4桁化しただけとなった。
ここはインパクト的に弱い気もする。というのも7月早々にリリースされるRadeon RX 5000シリーズの上位モデルは「Radeon RX 5700」となるそうで,パッと見,Radeon RX 570」と空目してしまいそうだからだ。よくよく思い返すと10年ほど前には「Radeon HD 5700」シリーズというのもあった。
Su氏は,このGPU関連発表セクションでは,Radeon RX 5700とGeForce RTX 2070とのパフォーマンス比較デモも披露している。
用いられたのは市販ゲームベースのベンチマークテストで,タイトルはSniper Eliteシリーズの開発元として知られるRebellion Developmentsが開発した「Strange Brigade」のPC版だ。
このタイトルは2018年夏にリリース済みのタイトルで,とくにレイトレーシングに対応したことがアピールされた作品ではないため,Radeon RX 5000シリーズやRDNAアーキテクチャの底力を見るには適したベンチマークテストとはいいがたい。とはいえ,一応ステージ上でのライブデモではGeForce RTX 2070よりRadeon RX 5700のほうが37%ほど高いフレームレートで描画を行っていた。
AMDとしてはRadeon RX 5700の仮想敵にGeForce RTX 2070を想定しているということであり,ここから見えるのは,今回もAMDは,新GPU Radeon RX 5700を「パフォーマンスと価格をバランスさせた製品」として訴求していきたいという意図だ。最大性能を追求した製品であれば最上位クラスのGeForce RTX 2080 Tiあたりとぶつけてテストを披露するはずだからだ。
まあこのあたりから考察するにRadeon RX 5700は,いわゆるAMD流儀でいうところの「パフォーマンスクラス」製品ということなのだろう。
第3世代RyzenはZen 2コア×2基構成の12C24T処理系を提供。14C28Tや16C32Tの登場の可能性は?
3つめの発表テーマは,一般ユーザー向けPC用のCPU製品「第3世代Ryzen」なのだが,Su氏は,この本題に入る前に,2019年1月のCES 2019で発表された第2世代Ryzen Mobile採用ノートPC製品について振り返りつつ,Su氏自身がAMDの代表である前に「私は一人の絶大なるPCファンである」と熱弁した。
このタイミングで台湾を代表するPC製品およびPCパーツメーカーであるASUSTeKとAcerのVIPを順番に一人ずつステージ上に招き,AMD製品を採用した多方面のの製品開発に従事してきたことへの感謝の意を示した。
このあと本題のZen 2ベースの第3世代Ryzenの発表に移行するのだが,その実,Zen 2コア自体の素性(浮動小数点演算性能の強化をはじめとした細かい改善点)や,Zen 2の設計思想(チップレットアーキテクチャ)についての詳細は2018年11月の時点で丸裸にされているので,第3世代Ryzenにまつわる発表における最大の関心事は「EPYCではなくRyzenとしてのZen 2コア製品はどんなものが出るのか」という部分にあった。
具体的には「何GHzの何コア(何C何T)のいくらの製品が出るのか」といった部分に興味が集中していたわけだが,発表されたその製品は結論から言ってしまえば期待どおりのものだったといえる。
ハイエンドモデルのRyzen 7はRyzen 7 3700X,同3800X共に8コア16スレッドモデルで,それぞれ定格3.6GHz(ブースト4.4GHz)と3.9GHz(ブースト4.5GHz)となっている。
第2世代RyzenのRyzen 2700Xが定格3.7GHz(ブースト4.3GHz)だったので,Ryzen 7 3700Xは,定格がやや下がりブーストがやや上がった格好となる。ただし,製造プロセスが12nmから7nmに微細化された恩恵などがあって,TDPは2700Xの105Wから3700Xでは65Wに下がっている。
Ryzen 7 3800XはTDP105Wを許容したうえで,さらに高い性能を追求したモデルという位置づけになる。
Su氏は「実はまだ隠し球がある」と前置きしたうえで「Ryzen 9 3900X」を発表した。
こちらは12コア24スレッドのモデルで,位置付け的には16コア32スレッド以上の構成を誇るRyzen Threadripperの下にラインナップされるスーパーハイエンドモデルとなる。製品型番の「Ryzen 9」は言うまでもなく競合の「Core i9」を意識したものだろう。
何度も述べてきているように第3世代Zen,すにわちZen 2コアベースのCPUは,CPUコアそのものであるCPUダイと,周辺I/Fを取りまとめたI/Oダイのマルチダイ構成をとるわけだが,2019年1月時点で予告された第3世代RyzenはCPUダイとI/Oダイが1基ずつの構成だった。実際,この構成の製品こそが,前出のRyzen 7 3700Xと同3800Xである。
対してRyzen 9 3900Xは,I/Oダイは1基のままCPUダイを2基に増量したモデルとなっている。
ところで,Zen 2コアのCPUダイ1基あたりは8コア16スレッドなので,単純に考えればCPUダイ2基構成であれば16コア32スレッドのモデルもありそうなものなのだが,今回発表されたRyzen 9 3900Xは4コア足りていないことになる。
これは間違いなく歩留まりに配慮した製品デザインと見るべきだろう。すなわち,Ryzen9 3900Xに搭載されている2つのZen 2コアは内包されるCPUコアを数個,無効化しているということだ。
2つ実装されるZen 2コアがそれぞれ2コアずつ無効化された6+6コア構成なのか,あるいは非対称なコア数構成なのかは分からない。歩留まり対策であれば,両方のパターンを許している場合もあるだろう。ここは「8+8コア構成のフル版や7+7構成の上位版はありえるのか」という疑問点と共にいずれ確認してみたいポイントである。
それにしても驚くべきは価格で,Ryzen 7 3700Xが329ドル,同3800Xが399ドル,Ryzen 9 3900Xが499ドルと,かなり戦略的だ。とくにRyzen 9 3900Xは競合であるIntelの同クラススペック製品「Core i9 9920X」の半額であり,市場やファンに与えるインパクトは相当に大きい。
この発表セクションの最後には,恒例の競合とのパフォーマンス比較が披露されている。
8コアモデル対決ではAMDのRyzen 7 3700X(8C16T)とIntelのCore i7 9700K(8C8T)とでCINEBENCH Release20のスコアを,AMDのRyzen 7 3800XとIntelのCore i9 9900Kとは,人気バトルロワイヤル系シューティングゲームの「PLAYERUNKNOWN'S BATTLEGROUNDS」(PUBG)の測定フレームレートで比較していた。
前者のテストは,CPUベースのレイトレーシングパフォーマンスを計測するもので,事実上,CPUのマルチスレッド性能を推し量るテストになる。結果はRyzen 7 3700Xが4806ポイント,Core i7 9700Kが3726ポイントで,Ryzen 7 3700Xが圧勝だ。
後者のテストは両環境においてGPUを揃えたうえで計測したそうで,事実上,CPUのシングルスレッドのパフォーマンスに重きを置いた結果が得られると説明された。結果は両者ともにほぼ同一か微妙にRyzen 7 3800Xが高いフレームレートを示していた。この結果でAMDとしては,「Ryzenはマルチスレッド性能は高いがシングルスレッド性能は競合及ばず」といったこれまでの評価を覆したいといったところなのだろう。
PCI-Express Gen4プラットフォーム一番乗りを強くアピール
4つめの発表テーマは,先行してサーバー/データセンター向けの環境では一足先に実現されていたPCI-Express Gen4を,民生向け製品でも利用できるようにするという発表だ。
NaviベースのRadeon RX 5000シリーズ,第3世代Ryzenは共にネイティブレベルでPCI-Express gen4に対応しているが,実際にGen4で使うためには新チップセットのX570チップセット搭載マザーボードが必要になる。
第3世代RyzenはAM4プラットフォームに対応しているので,従来のX300,X400型番のチップセット搭載のAM4ソケット搭載マザーボードでも利用できるはずだが,このときにはPCI-Express Gen4は利用できない。電気仕様的にはGen4も通せるはずなのだが,PCI-Expressの規格上,Gen4の信号を通すためにはPCI-SIGの認証試験を受けなければならず,過去の製品に対してこの認証を通すことは多くのメーカーでは行われないため,事実上,500型番チップセットでないとGen4は有効にならないのである(関連記事)。
逆に,第2世代Ryzen以前のCPUを500型番チップセットベースのマザーボードに搭載してもGen4にはならない。これは,第2世代Ryzen以前のCPUはGen3までの対応だから当然だ。
まとめるとPCI-Express Gen4環境は第3世代Ryzen,RADEON RX 5000シリーズ,500型番チップセット搭載マザーボードでないと利用ができないということだ。
気になるのは,GPU自体はネイティブGen4対応のRadeon VIIを,第3世代Ryzen,500型番チップセット搭載マザーボードで動作させたときにGen4対応となるだが,これについてはよく分かっていない。いずれ確認しておきたいポイントである。
このセクションのデモコーナーでは,PCI-Express Gen4の優位性をアピールするために,ULが開発中の「PCI-Express負荷テスト」に相当する新Feature Testを競合IntelのPCI-Express Gen3システムで実行したときと,AMDのGen4システムで実行したときのパフォーマンス比較を披露した。
この新テストモードの仕様が不明なので,テスト中の画面からそのテスト意図を想像するしかないのだが,テストの結果がフレームレート,帯域といった項目で表されていることから,GPUとCPUとでメインメモリーの一部を共有化してCPU/GPUの双方から互いにデータの読み書きを行う大量物量系シミュレーションのテストのようである。
GPUはメインメモリ上にあるデータをグラフィックスメモリにPCI-Expressバスを通じてコピーしてから処理しなければならず,CPUはグラフィックスメモリ内のデータをメインメモリにPCI-Expressバスを通じてコピーしてからでないとアクセスができない。ただし,プログラムからは,同一の論理アドレスをアクセスしているだけで済んでいるように見えるので,プログラム側の処理はそう複雑ではない。実行が複雑……というテストなのだ。
テスト結果はPCI-Express Gen3環境が14fps,帯域13GB/s,Gen4環境が25fps,帯域25GB/sとほぼ倍のスコアを示しており,ここから「Gen4の効果絶大」というストーリーが導かれることになる。
このテストがPCI-Expressの新フィーチャーである「Cache Coherent Interconnect for Accelerators」(CCIX) の効果の恩恵も反映できているのかは分からず。とくに説明もなかった。ちなに「CCIX」とはCPUとGPUとでメモリ共有をしている際に起こりえるCPU側キャッシュ,GPU側キャッシュ,共有メモリのそれぞれにおいて,データの不整合が起きないように自動調停を行う仕組み(キャッシュコヒーレンシ維持)のこと。例えばCPU側で共有メモリのあるアドレスを書き換えた場合,その同一アドレスをGPUキャッシュ側でキャッシュしていたときにデータ不整合が起きないようにキャッシュをクリアしたりアップデートしたりするのがCCIXの仕組みだ。
競合との戦いも新世代に
振り返ってみると,今回の基調講演の発表の目玉は,第3世代Ryzenの具体的な製品名と価格の発表,そしてNaviがついに登場することへの言及,この2つだったように思う。
第3世代Ryzenの,とくにRyzen9モデルはIntelをあわてさせるには十分なインパクトがあり,今後Intelの対応がどうなるかまでが楽しみである。
Naviの正体についてはまだ謎が多いが,わすが1年遅れで,リアルタイムレイトレーシング技術に関する足並みがNVIDIAと揃いそうな成り行きは評価したい。
RDNAアーキテクチャへの刷新への期待感が大きいのは間違いないが,AMDが用途によってはGCNを継続して行く方針を漏らしたのは興味深かった。これには,オークリッジ国立研究所へ納入予定の新型スーパーコンピュータに,Radeon Instinctが大量導入されることと無関係ではないのかもしれない。つまり,GPGPU用途ではGCNはまだまだいける……という目処がAMDの中には立ったのだろう。
NVIDIAはグラフィックス用途GPUも,GPGPU用GPUも単一のCUDAベースの設計で構成され,双方の用途で高い評価を得てきたが,近年では「単一アーキテクチャ」によるGPU設計思想が,両用途での最大公約数的な縛りを生じ始めている印象がある。例えばVoltaは,グラフィックス用途のポテンシャルを備えていたが,GPGPU用途に振りすぎた設計となったために,グラフィックス用途向け製品は超々ハイエンド品のリリースに留まることとなった。逆にTuringに至っては,リアルタイムレイトレーシング機能を,既存のCUDAアーキテクチャに組み込んだような設計となったことでグラフィックス用途に振り切った製品となった。結果,TuringベースのGPGPU用途製品のラインナップは限定的となっている。
AMDは,GPGPU用途はGCN系で,グラフィックス用途はRDNA系で,という2アーキテクチャ共存方針で,両用途において最良の製品を送り出そうとしているのかもしれない。ある種,NVIDIAの「単一アーキテクチャ」方針に対するアンチテーゼ的な動きといったところか。
さて,PCI-Express Gen4環境整備については,AMDが先行しているのは間違いないが,これはほぼインフラ的な部分なのでIntelもNVIDIAも足並みが揃うはずであり,AMD側の先行対応アピールはそこまで長続きしないだろう。
いずれにせよ,この後,6月早々にはE3があり,7月下旬からはSIGGRAPHもあるので,まだまだ競合同士の発表合戦は続くはずで,戦いはますます激化しそうである。
「AMD」公式サイト
- 関連タイトル:
Radeon RX 5000
- 関連タイトル:
Ryzen(Zen 2)
- この記事のURL: