オススメ機能
Twitter
お気に入り
記事履歴
ランキング
お気に入りタイトル/ワード

タイトル/ワード名(記事数)

最近記事を読んだタイトル/ワード

タイトル/ワード名(記事数)

LINEで4Gamerアカウントを登録
実際の音を聞いて理解する「TrueAudio」。一部GPUとAPUに統合した新機能で,AMDは何を狙っているのか
特集記事一覧
注目のレビュー
注目のムービー

メディアパートナー

印刷2014/08/23 00:00

テストレポート

実際の音を聞いて理解する「TrueAudio」。一部GPUとAPUに統合した新機能で,AMDは何を狙っているのか

 Radeon R9&R7シリーズのうち,「Radeon R9 295X2」(以下,R9 295X2)と「Radeon R9 290X」(以下,R9 290X),「Radeon R9 290」(以下,R9 290),そして「Radeon R7 260X」(以下,R7 260X)およびKaveri世代の「AMD A-Series」(以下,A-Series)APUだけがサポートする「TrueAudio」(トゥルーオーディオ)を覚えているだろうか。
 AMD独自のグラフィックスAPI「Mantle」とセットで大々的に発表されたにもかかわらず,2014年8月時点でサポートされる製品版タイトルはPC版「Thief」のみで,Mantleと比べると今ひとつぱっとしないため,すでに記憶の片隅へと追いやり済みという人も多いように思う。

 だが,このTrueAudioは,本当にスルーしていいようなものなのだろうか? 今回は,AMD本社へのメールインタビューと,実際に筆者が行ったテストを基に,TrueAudioの正体へ,できる限り迫ってみたい。


そもそもTrueAudioとは何か


 というわけで,まずは「TrueAudioとは何か」という話からである。
 TrueAudioの概要自体は,Radeon R9&R7シリーズが発表されたときに西川善司氏が解説してくれているが(関連記事),あれから約10か月が経ったということで,あらためて平たくまとめておくと,

  • Radeonが持つGPUの処理能力とグラフィックスメモリを用いてオーディオ処理を行う,ハードウェアベースのDSPソリューション

ということになる。エンドポイント(endpoint,最終段。ここでは出力インタフェースの意)をユーザーが自由に設定できるので,RadeonやAPUからのHDMI出力時にしか使えない,なんてこともない。出力インタフェースとしては,マザーボードのオンボードサウンドデバイスやサウンドカード,USBサウンドデバイスをユーザーが自由に選択して利用できる。
 ゲームプログラム側から見ると,TrueAudio対応GPUではその一部がオーディオ処理を行うコプロセッサ(co-Processor,メインのプロセッサを補助するプロセッサ)的に動作するイメージになる。処理フローでいえば,オーディオ信号をゲームからコプロセッサへ送り,そこで処理してまた戻してもらって,サウンドデバイスから出力する,といった感じだ。

 「GPUの一部をコプロセッサとして使う」というと,GPUアーキテクチャに詳しい読者は,Radeonにおけるシェーダプロセッサのひとかたまり的な存在である「Compute Unit」(演算ユニット)をGPGPU的に使っていると想像するかもしれない。しかし実際には,米Tensilica(テンシリカ)――正確にはCadence Design SystemsのTensilica部門――製DSP(Digital Signal Processor,デジタル信号処理に特化したプロセッサ)「HiFi EP Audio DSP」(以下,HiFi EP DSP)が組み込まれている。
 と,ここまで読めば,TrueAudioのサポートが今のところR9 295X2とR9 290X,R9 290,R7 260,そしてKaveriのみに留まる理由も容易に想像できるだろう。HiFi EP DSPが統合されている製品は,2014年8月現在,いま列挙したGPUやAPUだけだからだ。

オーディオDSPのイメージ図(Tensilicaの日本語Webサイトにある製品情報ページより)
TrueAudio
 続いてHiFi EP DSPとはなんぞやという話だが,一言でまとめるなら,これはオーディオ信号特化型DSPの1つである。テレビやセットトップボックス,Blu-ray Discプレーヤーなどといった民生機器における採用実績が豊富な,組み込み業界では非常にポピュラーなDSPと述べていい。
 Intelの次世代CPU「Broadwell」(ブロードウェル,開発コードネーム)では,Tensilica製DSP「HiFi 2 Audio DSP」の採用が確定しているが,HiFi EP DSPは,このHiFi 2 Audio DSPをべースに,音声信号の前処理や後処理と,キャッシュメモリサブシステムの性能をそれぞれ向上させた,いわゆるスーパーセット(=機能拡張版)であり(Tensilicaの日本語Webサイトにある機能比較表),要するに上位モデルだ。

 そんなHiFi EP DSPと,ゲームアプリケーションとの間を取り持つのは,オーディオ処理用ミドルウェアである。

2013年におけるTrueAudioの発表時点で,AudiokineticとFMODによるサポートは明らかになっていた
TrueAudio
 TrueAudioの発表と合わせて明らかになっているとおり,オーディオ処理用ミドルウェアでは,加Audiokineticの「Wwise」(ワイズ)と豪Firelight Technologiesの「FMOD」(エフモッド)がTrueAudioをサポート済みだ。

 TrueAudioに対応するゲームの音声がWwiseもしくはFMOD上で再生されると,そのうち,「プログラマーがあらかじめ指定しておいたオーディオ信号」がHiFi EP DSPへ送られる。HiFi EP DSPは,信号を受け取ると,GPUのアンコア部分やグラフィックスメモリの処理能力を一部で使いながら,送られてきた音声信号を内部のプロセッサで処理して戻す作業を担当する。そして最終的に,ユーザーが設定したエンドポイントへ展開されるわけだ。

通常の音声処理フローとTrueAudioを用いた音声処理フローの違い
TrueAudio

 冒頭でその名を挙げたThiefはWwiseを採用しているので,ThiefにおけるTrueAudio効果はWwiseを経由して実現されることになる。
 AMDによれば,開発中の一人称RPG「Lichdom」がWwiseベースでTrueAudioを採用しているとのこと。また,Oculus VR製ヘッドマウントディスプレイ「Rift」対応のデモ「Tuscanny」はFMODベースでTrueAudioを採用している。


TrueAudioの正体と「できること」


 以上,ハードウェアと処理の流れをまとめてみたが,HiFi EP DSP自体は,内部にミキサー的な機能を持ってはいるものの,言ってしまえば“音声を処理する箱”に過ぎない。実際には,その中で,音声処理アルゴリズム――オーディオ業界ではこれのことを「オーディオプロセッサ」と言うのだが,「プロセッサ」と書いてしまうとハードウェアのように感じる人が多いと思われるので,今回はそのままアルゴリズムと書くことにする――が動作するわけだ。

 では,TrueAudioは,そんなHiFi EP DSPを使って,どんな音声処理アルゴリズムを動作させることができるのかというと,現時点では「コンボルーションリバーブ」(Convolution Reverb)1つだけである。

ホールの例
TrueAudio
 コンボルーションリバーブは,ここ10年弱くらいの間に,音楽制作の世界で定着した音声処理アルゴリズムだ。リバーブは「残響」のことで,コンサートホールや体育館など,大きな建物の中で音を鳴らすと音が響いたりするが,あれがリバーブの典型的な例である。
 実際には,リバーブは主に二種類の音で構成されている。いま挙げた例で壁に当たった音が跳ね返ってくるとき,その「直接返ってくる音」が,リバーブを構成する第1要素となる「初期反射」(Early Reflection)。そして第2要素が「余韻として残る音」たる「残響後部」(Reverb Tail)となる。ホールの中で手を叩いたときに「パン」という音がすると,その後すぐに,濁った「パン」という音が返ってくるが,これが初期反射だ。そして,「パン」という音に付く「ーーーン」という余韻が残響後部である。

 デジタル音声信号処理が一般化した現在,音楽制作の世界においては,初期反射と残響後部を演算で作り上げる「デジタルリバーブ」(フェイクリバーブともいう)がほとんどになっている(※)。
 デジタルリバーブが広く採用されているのは,現行世代のプロセッサから見て,演算の負荷が非常に低くなっているからだ。すべてを演算で作り出せるため,汚れがなくクリーンな,それこそ「理想的なコンサートホールの残響」を,擬似的に付加できる。

※リバーブにはこのほかにも,アナログ時代の「鉄板リバーブ」や,部屋を用意してその部屋に音を送り,そこで残響音が付加されて返ってきた音を混ぜる「ルームリバーブ」などなど,多種多様な手法や装置が存在するが,今回は本稿の主旨から外れるので触れない。

イスラエルWaves Audio製のデジタルリバーブ用音声処理アルゴリズム「TrueVerb」のスクリーンショット。2つあるグラフのうち,上で確認できるオレンジ色の縦線が初期反射で,紫色の三角形が残響後部だ。縦軸が信号レベルの強さで上に行くほど大きくなり,横軸は時間軸。左から右に時間が経過していくなかでの残響を調整できるわけだ。初期反射と残響後部を別々に編集可能なのがポイント
TrueAudio

 一方,短所としては,あくまでも擬似的な,いわばフェイクなので,どこまでいっても「○○っぽい」音であり,実在するホールの残響を100%再現するようなことはできないことが挙げられる。

 ……と,長い前置きを経て,ようやくコンボルーションリバーブの話だが,デジタルリバーブの話をしたので,ピンときた人もいるだろう。というわけでさっそくざっくりまとめておくと,その定義は以下のとおりだ。

  • 実際のホールや特定の空間で,基準となるスイープ波形を残響ともども計測して,その測定データを基に,実在する場所の残響をシミュレートすること

コンボルーションリバーブでは,ゲームで再生された「残響のないオーディオ信号」に,IRデータを「畳み込む」ことで残響を与え,ゲームオーディオに残響をもたらす
TrueAudio
 重要なのは,デジタルリバーブが,「一般的にホールはこのような音響特性を持つので,それをシミュレートする」形を取るのに対し,コンボルーションリバーブは「計測した値がこうだから,これを基に別の音を鳴らしたときはこう鳴るという演算を行う」点だ。前者では,理想的な空間がシミュレートされるため,ノイズレスの残響が得られるのに対し,後者では計測時のノイズを含んだ残響が得られることになる。
 ちなみに,ここでは「実在する空間で計測した音響データを基に,異なる音を慣らしたときの残響をリアルタイムで演算する」格好になるが,こういう演算のことを数学で畳み込み(コンボルーション)という。コンボルーションリバーブという名前の由来はこれだ。

 よって,コンボルーションリバーブの生命線は,処理するプロセッサの演算能力だけでなく,専門用語で「インパルスレスポンス」(Impulse Response,以下 IR)と呼ばれる,当該空間の計測データということになる。

コンボルーションリバーブの仕組み
TrueAudio

 先ほども述べたとおり,今日(こんにち)のCPUやオーディオ処理用DSPにとって,デジタルリバーブの負荷は決して高くない。また,計測データを参照する必要がないため,メモリの消費量も少なくて済む。
 それに対し,コンボルーションリバーブの場合は,計測データを基にしたリアルタイム演算が必要となるため,プロセッサ側の能力次第で「レイテンシ」(Latency,ここでは音の出力遅延)が大きくなることがある。また,IRデータを展開しなければならないので,処理するのに必要なメモリ量も増す。

TrueAudio
有名な英Wembley Arena(ウェンブリー・アリーナ)のIRデータを,Waves Audio製のコンボルーションリバーブアルゴリズム処理ツール「IR-L」で見たところ。アリーナホールは残響が長いため,中央左ペインの「Convolution」のところを見ると,合計5.69秒のIRデータになっている
TrueAudio
こちらは著名なレコーディングスタジオである米Signet StudiosのIRデータ。IRデータは1.8秒分だ
 実際,IRデータは,スタジアムや教会内部のものだと5秒や6秒もの長さになる。そのため,従来からある伝統的なデジタルリバーブと比較してはるかに大容量のメモリが必要だ。

 そのため,コンボルーションリバーブをゲームで使おうとすると,それを処理するマシンの演算能力に対する要求は,デジタルリバーブのみを使う場合に比べて当然高くなる。しかも,マルチチャネルサラウンドで処理しようとすると,5.1chの場合,ミキサー,というかスプリッタで4chのデータを5.1chで定位させるのが一般的なので,フロントL/RとリアL/Rとで合計4ch分の演算が必要だ。要求されるプロセッサとメモリのリソースは最低でもステレオ時の2倍になってしまう。

 実のところ,コンボルーションリバーブ自体は,すでに大手ゲームベンダーの内製ミドルウェア上で実装されているものと推測される。あまりにも一般的なアルゴリズムなので,実装されていないというのは考えにくい。
 しかし,だからといって考えなしに使ってしまうと,CPUやメモリのリソースを使い切ってしまって音が歪んだり遅延が生じたり,最悪の場合はゲームプレイ自体に支障が出たりといったことが十分に生じうる。そのため,使われてこなかったか,「ここ」というピンポイントでの利用に留まっていたというのが,筆者の理解だ。

 ここまで読み進めてもらうと,TrueAudioの存在理由は,だいぶはっきりと理解できたのではないだろうか。
 R9 295X2やR9 290X,R9 290,R7 260X,そしてKaveri世代のAPUでは,コンボルーションリバーブのような,プロセッサおよびメモリ負荷の大きな音声処理アルゴリズムを動作させるために,専用プロセッサとしてHiFi EP DSPを利用できるのだ。
 IntelはPCベンダーに対し,「HiFi 2 Audio DSPの採用によって,Broadwell世代のCPUでは『DSPオフロード』(DSP Offloading)の恩恵を受けられる」という説明を行っていたりするのだが,これは「CPUに負荷をかけることなく音声処理を行える」という意味であり,HiFi EP DSPに処理を分散させるTrueAudioもまさにそんなイメージになる。負荷の高い処理だけを,GPUやAMD A-Series APUに統合されたHiFi EP DSPが受け持つのである。

 AMDによれば,R9 290X&290とR7 260X,Kaveri世代のA-Series APUに統合されるHiFi EP DSPは3基で,内部で共有するメモリ(shared internal memory)として機能するSRAM容量は384KBとのこと。さらに,さらに,DMAエンジンがグラフィックスメモリのフレームバッファから最大64MBをTrueAudio用で利用できるようになっているという。
 おそらく,コンボルーションリバーブの処理にあたっては,SRAM上にIRデータの冒頭部分を格納にしておき,必要に応じて,フレームバッファ上に展開したデータをストリーミングする仕様になっているのだと思われる。

TrueAudioのハードウェア仕様概要
TrueAudio

 なおThiefの場合,同時に使っているコンボルーションリバーブアルゴリズムの最大数は4つで,IRデータは最大10〜12秒分だそうだ。4つのアルゴリズムを同時に使う場合,各アルゴリズムが利用できるIRデータの量は単純に4分の1となる。筆者の予測だと,おそらく12秒分を「4秒分,4秒分,3秒分,1秒分」といった感じに,最大4つのアルゴリズムでシェアすることになるはずだ。


実際にThiefでTrueAudioの効果を聞いてみる


GOUGER DS-Cube Orange GU-IH4H87M-O
メーカー:パソコンショップ アーク
問い合わせ先:online_shop@ark-pc.jp
BTO標準構成価格:9万9800円(税込,2014年8月23日現在)
販売ページ
TrueAudio
 では,TrueAudio,そしてThiefにおいて実装されるコンボルーションリバーブで,いったいどういう効果が得られるのかを,実際に検証していこう。
 今回はSteamで購入できる英語版Thiefを利用した。テストにあたっては,R7 260Xを搭載するパソコンショップ アーク製のゲームPC「GOUGER DS-Cube Orange GU-IH4H87M-O」を用いることにしている。
 GOUGER DS-Cube Orange GU-IH4H87M-Oは,Micro-ATX対応で拡張性に優れるAerocool Advanced Technologies製小型PCケース「DS Cube Window Orange Micro-ATX」を採用し,BTO標準構成でCPUに4コア4スレッド対応の「Core i5-4590」を組み合わせたモデルで(※),使ってみると分かるのだが,とても静かだ。音をチェックするという今回のテストにおいて,非常に有効な製品であることをここで紹介しておきたい。

265(W)×395(D)×410(H)mmと小型のMicroATXケースは,天板部が簡易液冷クーラーに対応していたり,底面の吸気スリットが大きかったりと冷却重視。そんな筐体を採用しながらも,動作音は非常に静かだ。コンパクトで静音性の高いゲームPCを探している人にお勧めといえる。なお,採用するR7 260XカードはGIGA-BYTE TECHNOLOGY製の「GV-R726XWF2-2GD REV2」だった
TrueAudio TrueAudio TrueAudio

※正確を期すと,入手タイミングの都合で,筆者が用いた個体では「Core i5-4570」を搭載している。現在のBTO標準構成で採用されるCPUは,本文で紹介しているとおりCore i5-4590だ。

 インストールしたグラフィックスドライバは「Catalyst 14.6 RC」。記事掲載時点の最新版ではないが,長くかかったテストを開始したときの最新版なので,この点はお断りしておきたい。

 テストは,5.1chサラウンドサウンド出力と2chステレオヘッドフォン出力で行った。前者のテストに用いたシステムは下に示したとおりで,マルチチャンネルアンプとPCはGPU上の端子とHDMI接続している。
 ヘッドフォン出力にあたっては,GOUGER DS-Cube Orange GU-IH4H87M-Oのオンボードサウンド機能であるRealtek Semiconductor(以下,Realtek)製のHD Audio CODECを用い,AKG製のアナログ接続型ヘッドフォン「K240mkII Studio」とつないだ。

  • マルチチャンネルアンプ(AVアンプ):パイオニア「SC-LX86」
  • フロントL/Rスピーカー:パイオニア「S-A77TB」
  • リアスピーカー:パイオニア「S-A77BS」
  • センタースピーカー:パイオニア「S-A77VT」
  • サブウーファ:パイオニア「S-W7」

 Thiefでは,タイトル画面に用意された「OPTIONS」から「AUDIO」を開くと,「CONVOLUTION REVERB」という,そのままの項目が用意されている。選択肢は「TRUEAUDIO」「SOFTWARE」「OFF」の3つ。TRUEAUDIOを選ぶと,HiFi EP DSP搭載のRadeonやAPUでコンボルーションリバーブ処理を行い,「SOFTWARE」ではCPUとメインメモリを用いたコンボルーションリバーブを利用して処理し,「OFF」では処理を行わないことになる。

Thiefの「AUDIO」メニュー。「CONVOLUTION REVERB」という,そのままの項目で「TRUEAUDIO」を選択すると,HiFi EP DSPでコンボルーションリバーブ処理がなされるようになる
TrueAudio

 また今回は,読者にも実際の音を聞いてもらうべく,オンボードサウンド出力の音を,独RME製の外付け型サウンドデバイス「Fireface UCX」へ入力し,それとつないだMac mini(Mac OS X 10.9)上で動作するAvid製DAW(Digital Audio Workstation)ソフトウェア「ProTools|11」(Native)を使って録音することにした。HD Audio CODECの仕様上,出力は16bit/48kHz仕様となるが,入力側は24bit/192kHzとしている。

 少し補足しておくと,今回はコンボルーションリバーブの効果がThief上ではっきり分かる環境音(Ambient,アンビエント)を収録し,それを聞いてもらうことにしている。ただ,環境音はそもそも再生音量が小さいうえ,Realtek製HD Audio CODECの出力レベルも単体のサウンドデバイスと比べるとかなり低い。今回は収録にあたってHD Audio CODECの出力レベルを最大にしているが,それでも読者の再生環境によっては出力が足らないことが予想されたため,Fireface UCX側で入力ゲインを+18dBとした次第だ。
 もっとも,録音後の処理は,ビット解像度とサンプリングレートの16bit/48Hz化以外は一切行っていない。そのため,後ほど示す録音データには,ゲームサウンドの再生直前と直後にクリップノイズが載っているのだが,無加工の証明ということでご容赦を。

 要するに,PCのオンボードサウンド出力(≒Realtek製CODEC)から出力される音を,ゲインだけリニアに増幅して聴きやすくしたうえで,16bit/48kHz変換しただけの音を4Gamerのサーバーにアップしたというわけである。


TrueAudioで,Thiefの音は「リアルになまる」


 というわけで,下に4つ示したのがThiefの録音である。実際の音を聞いてみてほしい。

●録音1
 Thiefのゲーム開始直後。左側に窓があって,そこから外の音が聞こえる。


テストシーンのスクリーンショット
TrueAudio

●録音2
 冒頭のシーンに続けて,外に出たところ。


テストシーンのスクリーンショット
TrueAudio

●録音3
 少し進んで“鳥部屋”の中。


テストシーンのスクリーンショット
TrueAudio

●録音4
 リアルタイムのカットシーンだと思われるが,エレンの初出シーン。


テストシーンのスクリーンショット
TrueAudio

 聞いてもらうとすぐ分かると思うが,コンボルーションリバーブを使わないで出力したほうが低域も高域もしっかり再生されている。オーディオ的にいえばよりハイファイ(Hi-Fi)であり,それに対し,TrueAudioを有効化すると,低域も高域も落ち込んで,「なまった」音になり,ノイズも増える
 前述のとおり,上で示したのはオンボードサウンドからのアナログ2ch出力を録音したものである。テストを行ったところ,2ch出力時はステレオ感が狭くなり,ややモノラルっぽくなっているのに対し,5.1chサラウンドだと,サラウンド感を維持したまま「なまる」といった違いがあったので,その点は付記しておきたいが,全体的な「低域と高域が落ち込み,ノイズが増える」という傾向自体は2ch出力でも5.1ch出力でも変わらなかった。

 ここで理解しておきたいのは,増えたノイズが,「意図せず生じたノイズ」ではなく,「意図的にコンボルーションリバーブで付加されたノイズ」である点だ。当たり前だが,無響室のような特別な空間でもない限り,現実世界に残響の存在しない空間はなく,ノイズの存在しない空間もない。「無響室の中で鳴る音」と「残響とノイズのある空間で鳴る音」のどちらが,よりリアリティを持つだろう?

 筆者は音楽制作者なので実体験として分かるのだが,たとえば,DTM音源のバイオリンを鳴らすとき,残響音が欲しくてデジタルリバーブを付加すると,きれいに聞こえる。しかし,ハリウッド映画音楽などの録音に用いられる,オーケストラ用の大型録音ステージ「Scoring Stage」や,欧州にあるオーケストラ演奏会用ホールなどのIRデータを使ってコンボルーションリバーブを適用させると,同じバイオリンでもまったく雰囲気が変わり,ノイズが変わってなまり具合も変わり,その分,リアリティも増す。
 つまるところ,音楽制作におけるリアリティとはなまることなのだ(※再生機器側は話が別で,できるかぎりハイファイなほうがいい。ハイファイな機器からなまった音が聞こえるとリアリティを感じるが,なまった機器からだと単純に「悪い音」に感じられてしまう)。

 本論からは外れるが,せっかくなので,実際のバイオリンの音を使ったデモを聞いてもらうことにしよう。
 ここではオーストリアのVienna Symphonic Library製となる「Vienna Instruments: Orchestral Strings I」を用いた「バイオリンセクションの駆け上がり」を,リバーブ処理なしと,デジタルリバーブ処理あり,コンボルーションリバーブ処理ありの3パターンで用意することにした。

 もう少し具体的に述べると,専用のホストアプリケーション「Vienne Ensemble Pro 5」上に読み出した「Vienna Instrumens Pro」の「Orchestral Strings I」ライブラリから,14人編成のバイオリンにおける駆け上がりフレーズを,オーディオ処理なしのストレートな――専門用語でいうところの「ドライな」――状態でネットワークから再生。それを「Pro Tools|HD 3 Accel」システムで録音し,録音後,

  1. 未処理のままのもの
    再生する
  2. Waves Audio製のルームシミュレータ「TrueVerb」のプリセット「Large Concert II」を使用したデジタルリバーブ処理を行ったもの
    再生する
  3. Waves Audio製のコンボルーションリバーブアルゴリズム処理ツール「IR-L」上に,「Philharmonic Hall」の16列めで収録されたIRデータを読み出してコンボルーションリバーブ処理したもの
    再生する

を3つ用意した。いずれも16bit/48kHzの非圧縮PCMステレオだ。
 Viennea Instrumentsのライブラリは無響室で収録されているため,リバーブ処理を適用した状態との違いが分かりやすいが,これをヘッドフォンで聞いてもらうと,どれがよりクリーンなのか,どれがよりなまっていてリアリティがあるか,判断できるだろう。

 ゲームの音は,当初からハイファイ指向で,「ローノイズでなまりなし,低域から高域までがっつり再生」という設計になっていた(※筆者も当初,それに荷担した一人だ)。それが,コンボルーションリバーブを通すと,一気になまり,完璧とはいえないものの,リアリティがかなり増す。サンプルは2chだが,これが5.1chサラウンドだとさらに良好な印象となる。

 以上を踏まえて,先ほど示した4つの録音についてあらためて述べてみると,録音1では笛の音が籠もり,遠鳴りしている感が強くなる。録音2では環境音を含むノイズの音量が増すので,環境音全体にコンボルーションリバーブがかかっているのが分かりやすい。

独Steinberg製ソフトウェア「WaveLab 8」を用い,録音したWave波形の違い(=振幅の違い)を比較したもの。左が録音1で右が録音2の結果だ。いずれの画像においても,左ペインのグラフがTrueAudio無効時,右ペインのグラフが有効時のものとなるが,TrueAudioを有効化すると振幅が弱まるのが分かると思う(※サムネイルをクリックするとWaveLab 8のウインドウ全体を表示します。以下同)
TrueAudio TrueAudio

同じくWaveLab 8で可視化した,録音3のWave波形
TrueAudio
 録音3では,波形の上下振幅が小さい部分――常に再生されている環境音のみの箇所――が,TrueAudioの有効化によって,さらに小さくなっている。これは,音量が小さいオーディオ信号である環境音の低域と高域が,IRデータに基づき,TrueAudio処理によって削がれるためだ。
 無響室で録音すれば,低域から高域まで大きな音でハイファイな録音が可能だが,ノイズのあるホールでは,低域も高域も無響室ほどには大きな音で収録されない。それが,室内シーンを用いた録音3の波形で顕著に出ているのである。
 ちなみに,波形とは全周波数帯域の合算値(=縦軸)を時間の経過(=横軸)で表示したものなので,信号エネルギーとして大きい低周波が削られると,波形上の振幅(=合算値)は小さくなる。

録音4のWave波形
TrueAudio
 録音4で注目したいのは,振幅の大きなところ(=しゃべっているところ)における波形が,TrueAudio無効時と有効時でほとんど変わらないところ。Thiefにおいて,通常のダイアログ(dialogue,セリフ)にはコンボルーションリバーブが適用されていないということになる。

 なお,先ほど「完璧ではない」と書いたのは,容量384KBのSRAMと,R9 290Xでも容量4GBというグラフィックスメモリの仕様からして,どう考えても「シングルコンボルーションリバーブ」でしかありえないからだ。
 ここまであえて説明してこなかったが,今日(こんにち)の音楽制作用コンボルーションリバーブには,「シングル」と「マルチ」がある。シングルコンボルーションリバーブの場合,ある空間の一点で再生した音源を使うのに対し,マルチコンボルーションリバーブの場合は,異なる複数の地点で音源を再生し,その計測結果である複数のIRデータを使うことになる。

 当然のことながら,仮に異なる10か所で音源再生した10のIRデータをマルチコンボルーションリバーブとして使用した場合,そのデータ量はシングルコンボルーションリバーブ比で10倍になる。実際に音楽制作用コンボルーションリバーブアルゴリズムとして市販されている墺Vienna Orchestral Libraryの「MIR」だと,ホール内の数十か所で計測を行った結果として,数GBクラスのメモリ容量とストレージキャッシュ,そして,相応のCPUリソースを必要とする。
 仮にゲームのためにダウンサイジングしたとしても,シングルコンボルーションリバーブを使用するのと比べ,数十倍のCPUおよびメモリのリソースが必要となるのは,説明するまでもないだろう。

 なお,音楽制作側からの観点から述べておくと,シングルかマルチかというのはともかく,Thiefの冒頭シーンにおけるコンボルーションリバーブの活用は控えめだ。再生機器次第では「何が違うの?」と思われても仕方のないレベルともいえる。
 堪能するコツとしては,できればプレイする部屋のノイズを少なめにし,ゲームの再生音量を上げめにすることを挙げておきたい。普通の音量だと,環境音がそもそも聞き取れない可能性もあるからだ。


Thiefにおけるフレームレート改善効果は

確かにあるが,無視できるレベル


 ここまではTrueAudio有効時と無効時の違いを語ってきたわけだが,前段で,Thiefのコンボルーションリバーブ設定に「SOFTWARE」があると紹介したのを憶えているだろうか。
 実のところ,設定を「TrueAudio」にしても「SOFTWARE」にしても,得られるコンボルーションリバーブの効果は変わらず,聴感上の違いもまったくない。この点は「CPUベースとTrueAudioベースでThiefのコンボルーションリバーブに違いはあるのか」とAMDに確認し,「現時点ではない。恩恵はDSPへのオフロードと,(今後登場する)より複雑なオーディオストリーミングのサポートだ」という回答も得られているので,Thiefにおいて,TrueAudioを利用することのメリットは,CPUおよびメモリ負荷の軽減のみという理解でいい。

 では,負荷の軽減によって,フレームレートレベルではどの程度の違いが出ているのか。今回は,前段で音を聞いてもらったシーンを実際にプレイし,そこから3分間のフレームレート推移を「Fraps」(Version 3.5.99)から計測することにした。実際にプレイするので,毎回毎回100%同じ動作ができるわけではないが,冒頭のシーンだけに,ルートは固定なので,そう大きな問題はないと考えている。

 というわけでグラフ1は,Thiefのコンボルーションリバーブ設定を切り替えながらプレイしたフレームレートの推移,グラフ2はその平均値をまとめたもので,端的に述べると,違いはほとんどない。


 とはいえ,まったく同じでもなく,体感レベルで無視できる程度の違いが生じているのも分かるだろう。
 この点については,AMDも,「Thief自体がCPUリソースをガツガツ消費するタイプのタイトルではないため,CPUによるソフトウェア処理とTrueAudioで,処理負荷に大きな違いは生じない」と,4Gamerからの質問に対する回答のなかで認めている。要するに,現行世代のPCプラットフォームにとって,シングルコンボルーションリバーブの負荷は,わざわざDSPへオフロードするまでもない程度ということだ。


据え置き型ゲーム機を巻き込んだ

壮大な計画が見えるTrueAudio


 以上,TrueAudioと,Thiefにおけるコンボルーションリバーブの実装を細かく見てきた。

 サウンド処理がもたらすCPUやメモリの負荷は,ゲーム開発において,「ここ一番」のシーンにおいて,とても神経質にならねばならない。そのときにTrueAudioがあれば,“重く”て効果のある処理を,外部のDSPにオフロードすることで,それらの負荷を無視しつつ,確実に一定のリソースを利用できるというメリットがある。
 エンドユーザーからすると,これまでずっとハイファイ方面へ向かって走り続けていたゲーム業界が,TrueAudioとコンボルーションリバーブを機に,「実存する残響とノイズを付加してなまらせ,リアリティを追求する」という,映画業界と同じ方向に舵を切ってくると,リアリティが増し,ゲームの没入感を一段引き上げてくれることを期待できるようになる。

 しかも,Thiefがコンボルーションリバーブを採用したからといって,TrueAudioがコンボルーションリバーブ専用機能に留まるわけではない。
 AMDいわく,「コンボルーションリバーブはあくまで第1段階。次は2chステレオヘッドセットでも十分なサラウンドサウンド体験を可能にする『Spatialized Audio』を組み込む予定だ。また,長期的には,より多くのオーディオストリームをゲームから利用できるようにすることも検討している」とのことである。
 ちなみに,Spatialized Audio(スペイシャライズドオーディオ)は,昔からあるステレオ強調技術のこと。ステレオ音源の左右の分離感がより明確になるようにする技術だ。

 ……と,多くの可能性を感じるTrueAudioだが,「対応製品が非常に少ない」というのが,現時点における大きな課題となる。もちろん,「RadeonやA-Series APUでも非対応の製品のほうが多い」というのは時間が解決するだろうが,競合であるNVIDIAがTrueAudioに乗ってくる可能性は,まず間違いなくない。RadeonとAPUだけしかTrueAudioをサポートしないのであれば,AMDがどんなに頑張っても,ゲームデベロッパ,そしてユーザーに広く受け入れられるのは難しいだろう。

 また,前段でも触れたとおり,少なくともシングルコンボルーションリバーブであれば,現行世代のPC(というかCPUとメインメモリ)からすると,わざわざDSPへオフロードする必要がない。そんなことをしなくても,ソフトウェア処理で賄えてしまう。そうなると,TrueAudio対応のRadeonやA-Series APUをわざわざ選ぶ理由はないということにもなるはずだ。

PS4のカスタムAPUがTrueAudioベースのDSPを統合すると明らかにした,Dominic Mallinson氏(Vice President of Research and Development, Sony Computer Entertainment America)
 では,そんなTrueAudioに,なぜAMDは本気なのか。このことを考えるうえで重要な存在として浮上してくるのが,据え置き型ゲーム機の存在である。
 あらためて説明するまでもないと思うが,PlayStation 4(以下,PS4)とXbox Oneのメインプロセッサは,いずれもAMDのカスタムAPUだ。そして,少なくともPS4のAPUは,Sony Computer Entertainment Americaが「TrueAudioベースのDSPを統合している」と認めている(関連YouTubeムービー,言及があるのは17分過ぎ)。

 もちろん,API(Application Program Interface,あるソフトウェアを開発するときに利用可能な 命令や関数を集めたもの)がPC用とは異なる可能性があるので,TrueAudioそのものとは言い切れず,だからこそ「TrueAudioベース」という表現になったのかもしれない。だが,そもそもAPIについて言えば,WwiseやFMODといったミドルウェアがあれば吸収してくれるはずなので,ほぼTrueAudioと考えて問題ないだろう。
 また,公開情報がほとんどないXbox One側も,Tensilica製のDSPを統合しているとは言われている。その情報が正しいのかどうか,筆者は判断する術(すべ)を持たないが,仮に正しいとするなら,そのDSPがTrueAudioと縁もゆかりもないというのは考えにくい。

 そして,ここまでくると事情が変わってくる。RadeonやA-Series APUを搭載したPCと,PS4,Xbox Oneの間でTrueAudio(もしくはTrueAudio的な機能)をクロスプラットフォーム対応できるようになるからだ。しかも,今世代の据え置き型ゲーム機の場合,ゲームPCと比べるとCPU性能がとにかく非力なので,オーディオ処理の一部をTrueAudioで代用できるとなれば,採用するゲームデベロッパも増えてくる可能性は大いにある。おそらくAMDは,それがめぐりめぐってPCゲーム市場における同社の優位性につながると考えているのではなかろうか。

 少し俯瞰的に見てみると,TrueAudioと,BroadwellにおけるオーディオDSPの採用が,ほぼ同じようなタイミングで生じ,DSPオフロードをトレンドにしつつあるというのが面白い。TrueAudioとBroadwellでは同じDSPオフロードでも,「CPU負荷を下げつつ機能を追加する」か「純然たる負荷低減」かで目的が多少異なるものの,PCは一時期「何でもCPUで処理」だったのが,また別途DSPを利用するようになってきているというのは,なかなか味わい深い。

 いずれにせよ,TrueAudioからは“いま見えているもの”以上に可能性を感じる。AMDの目論みどおりに事が運ぶかというと,そう簡単にはいかないかもしれないが,長期的に注目しておくのがよさそうな技術とは言えるだろう。

AMDのTrueAudio概要紹介ページ

  • 関連タイトル:

    TrueAudio

  • この記事のURL:
4Gamer.net最新情報
プラットフォーム別新着記事
総合新着記事
企画記事
トピックス
スペシャルコンテンツ