イベント
「黒川塾 七十八(78)」聴講レポート。ゲームAI開発者の三宅陽一郎氏が,人工知能の哲学と最新事情を語る
「黒川塾 七十八(78)」配信アーカイヴ(YouTube)
今回のテーマは,「ゲームAIの今 社会と文化の歪みのもとで,人工知能の哲学」で,ゲストのゲームAI開発者・三宅陽一郎氏の新著作「人工知能のための哲学塾 未来社会編」(共著:大山 匠氏)の出版を記念して,ゲーム的なAIに限らず,現代を生きるために必要な人と人工知能の関係性についてのトークが展開された。
黒川文雄氏 |
三宅陽一郎氏 |
三宅氏は「人工知能には哲学が必要である」と提唱している。その理由は,「人工知能を探求することは,人間を探求すること」だからであり,従って「哲学によって深く探求し,エンジニアリングによって証明する」必要があると説明した。言い換えれば「知能とは何か?」という哲学,あるいはサイエンスの命題は時代と共にあり,人工知能の進歩とは,その探究とエンジニアリングとの相互作用によって進むものなのだそうだ。
人工知能を考える上で,三宅氏は物語的なフレームがあると理解しやすいとし,2冊のSF小説を紹介した。1つは1979年発表のJ・P・ホーガン著「未来の二つの顔」で,これは人間と人工知能の共存を,コンピュータ工学的な裏付けから解釈したものだという。三宅氏は,同書を「今読むべきSF」と表現していた。
もう1つはスタニスワフ・レム著の「ソラリス」で,こちらは人工知能のような,人間とは異なる知能と,どのようにコミュニケーションを取ればいいのか考えるのに適しているとのことである。
そうやって考えていくと,文化や文明によって人工知能の受け入れ方が異なることに気付かされるという。例えば日本人は,人工知能を自分達と並列な存在,すなわち仲間や友達として受け入れる傾向にある。逆に言えば人間と同等の知能を求めているので,そうした人工知能をリアルな世界で実現するのは難しい。三宅氏は「日本人はキャラクター化で受容する。ゲームもキャラクターを通して成り立っている部分が大きい」とした。
その一方で,西洋では人間が人工知能に命令し,それに対して人工知能が行動するアーキテクチャが議論の余地なく存在している。例えば日本ではロボットをハグしても誰も気にかけないが,西洋ではそうやって生命ではないものを人間扱いすることを忌避することが多い。三宅氏は,「これだけ人工知能が社会に浸透してくると,文化による受容の違いを討論せざるを得ないのではないか」と語っていた。
そうした人工知能に対する受容の違いは,人工知能を扱う映画や小説にも表れている。西洋では人間に使役していたロボットやアンドロイドが,下剋上で人間の上に立つというパターンがほとんどだ。近年のゲームで言えば「Detroit: Become Human」(PS4 / PC)もまた,基本的にはこのパターンである。
三宅氏は「エンターテイメントとしては日本のほうが面白い」とし,日本では「鉄腕アトム」を筆頭に,ロボットやアンドロイドを友達や恋人として描くケースなどがあり,多様性があることを示していた。
次に,SF小説からテッド・チャン著の「あなたの人生の物語」が紹介された。
三宅氏はこれを,ディープラーニングがこの先どんどん進み,身体的にも時間の系でも人間とはまったく異なる知能が生まれたときに,そうした存在とどのようにコミュニケーションを取ればいいのかを考えるのに適した小説だと説明した。今後,人工衛星やビル全体を人口知能化するなどで,身体構造や時間の流れが異なる知性が生まれうる。これはそうした時代を先取りした議論というわけだ。
一方ゲームでは,リアルには存在しない動物,つまり異形のクリーチャーの知能が必要になることもある。三宅氏は,「6本脚で羽根が4枚あるクリーチャーのAIを作っていると,普通に人工知能を研究している人達から『お前は何をやっているんだ』と言われる。人工知能研究者より,むしろSF作家のほうに親近感を覚える」と話していた。
ただ,こうしたゲームAIはディープラーニングによるものとは違い,人間と同じ時間を共有している。こうした人工知能はほかにあまり例がなく,三宅氏はゲームAIの技術がロボットやドローンに応用されつつあることを紹介した。
ここから話は,人工知能とのコミュニケーションというテーマを,さらに掘り下げたものになっていく。知能には意識と無意識のレイヤーがあるのだが,前者でコミュニケーションを取ろうとしたときには,言葉や指示といったものが使われる。
一方,例えば「態度が気に入らない」「仕草や匂いが気になる」といった形で現れる,無意識のコミュニケーションというのも存在する。知能はさまざまな形で無意識のコミュニケーションを取るものなので,それができないオンライン上のやり取りで,言葉だけに過剰に反応しがちなのは,ここに理由があると三宅氏は説明した。さらに人工知能とのコミュニケーションにあたっても,意識と無意識のレイヤーを考える必要があるとした。
人間の意識を考える上では,まず身体という基盤があり,その上で知能があって,さらに意識があることを前提にする必要がある。それにより,人間の知能は身体を通して,自分の住む世界から問題を設定する枠(フレーム)を自分自身で作り出せる。フレームは時間(イメージ)と空間(論理)で構成される。例えば将棋であればコマの配置と動かし方がフレームである。
しかし人工知能には身体がないので,世界との結びつきが極めて希薄になり,自分自身ではフレームを作れない。これがいわゆる「フレーム問題」で,現在の人工知能は将棋や囲碁など,人間に与えられたフレームに立脚したものしか解けないのである。
三宅氏は,人間とのコミュニケーションにおける今の人工知能のボトルネックは「コモングラウンドの欠如」にあると説明。例えば,子ども達がお医者さんごっこをしているシーンを理解できるかどうかは,医師による診察を経験したかどうか,少なくとも知っているかどうかにある。こうしたコミュニケーションの前段階の共通認識がコモングラウンドで,人間同士ですらこれがなければ意思疎通は難しいのだから,身体のない人工知能には無理難題というわけだ。
それでは人間と人工知能の間のコモングラウンドは何かと言うと,人間が与えるフレームしかない。将棋盤の上など,フレームの中では人間と人工知能は分かり合えるが,それ以外はまったく分かり合えないものなのだ。
だが三宅氏は,「逆にコモングラウンドを人工知能に与えることで,より円滑なコミュニケーションを図れる」という。氏によると,ゲームのバトルというフレームの中で人間と人工知能が同期する(分かり合う)のは案外簡単なのだとか。例えばプレイヤー(人間)が敵を攻撃するから,お前(人工知能)も攻撃しろ,逆に手を出すな,あるいはピンチになったら回復しろといった具合である。
しかし,それが日常に戻った途端,人工知能はどうやって考えればいいか分からなくなる。人間ならコモングラウンドや自身の経験や知識から,フレームを変化させるなどして次にやるべきことを見出すが,今の人工知能はそこまで到達していないのだ。
「環境からの自律・呪縛」というテーマでは,まず生物が環境に埋め込まれた存在であることが説明された。これは例えば,生物には自分より強い存在の縄張りには近づかないといったような原始的・動物的な呪縛があることを意味している。
一方,人間は言語や社会を持つことである程度原始的・動物的な呪縛から解き離れつつはあるが,縄張り意識や「何だかアイツは気に食わない」といった感情があるように,完全に逃れているわけではない。また新型コロナウイルスの影響により,オンラインでのコミュニケーションが推奨される半面,実際に顔を合わせて身体を使ったコミュニケーションを取りたいという人もいる。
三宅氏は「なぜオフィスに集まって仕事をしていたかというと,それは合理的だからではなく,動物的な面が大きかった」とし,「一見インテリジェントで洗練された社会も,実は動物的なメカニズムという基盤の上で成り立っていた。その基盤となっていた部分が吹き飛んだ今,どうするか。原始的・動物的な構造抜きで,新しく社会を構築できるのかという我々にとって大きなチャレンジになる」と持論を示した。
話題は「唯識論」にもおよぶ。約60年の歴史を持つ人工知能研究に先駆け,仏教では3000年以上前から人間の探求が行われてきた。ただ仏教は学問ではないので,その探究の過程や結果は,今の人工知能にあまり採り入れられていない。
三宅氏は,「人工知能を作るということは,動物的な意味においては,いかにして煩悩を持たせるかということ」としつつ,「人工知能は世界に執着がない。何も欲求がなく,言わば悟りきった状態なので,そこにプレイヤーが憎い,あの集団を倒したいという煩悩を持たせる。そうやって堕落させるほど,動物らしくなっていく」と説明した。実際,ゲーム中のモンスターのAIもそうやって作っているそうで,ゲーム内の世界の側から「アイツは敵」「これは食べられる」といった情報を与えることでモンスターに煩悩を持たせ,行動させているとのこと。
人工知能理論と言えば,掃除ロボット「ルンバ」にも採用されているロドニー・ブルックス氏の「サブサンプション・アーキテクチャ」が有名だが,これは複雑な行動を多数の単純なモジュールに分割し,それらの階層構造にすることで構築する成り立っている。
この理論はゲームAIにも応用されており,例えば思考の最下層では「敵が来たら剣を振る」,次の階層では「敵に攻撃されたら避ける」,さらに上の階層では「情勢が悪かったら3歩下がる」といった具合に,下層の行動が優先度を持ち,上層になるほど行動が抽象的になっていく構造となっている。
三宅氏によると,この理論は唯識論とほぼ同じことを言っており,環境と同化したいという動物的な衝動と,自分自身を取り戻したいという衝動を仮定して組み合わせると,エレガントな人工知能の内面を構築できるとのことである。
これまでの人工知能研究には人間の内面を研究する哲学的なアプローチと,それぞれに役割を与えた多数のエージェントを用い,社会のシミュレーションをするようなアプローチの2つの分野,つまりミクロとマクロの分野があった。しかし人間の内面はそう単純ではなく,ミクロで形成される知能(主我,i)もあれば,社会と接することで形成される知能(客我,me)もある。社会学ではiとme,2つの自我を一緒に研究しているとのことで,三宅氏は人工知能研究にもそのアプローチが必要になると考えているという。
またiとmeは,かたや自分の中で形成された自我,かたや人から見られることで形成された自我であり,相反する。三宅氏はその緊張関係から生まれるダイナミクスこそが,知能を作る力学となり,より人間らしい人工知能になるのではないかと期待を示した。
さらに話題は,人工知能が将来どうなっていくかというものへと移っていく。
三宅氏によれば,ある技術が飽和すると,次の技術に移行するという。現在はインターネットの普及によって生まれた,人間には扱いきれない量の情報を人工知能に整理させる時代だが,その人工知能の技術も近い将来飽和する。そして3つの領域に収束すると予測した。
まず1つめは自律型AI(汎用型AI)の登場で,これは鉄腕アトムに代表されるような自律型ロボットを思い浮かべると話が早い。
2つめは人間の知能拡張で,例えばメガネや靴に人工知能を持たせることで,人間の眼では視認不可能な何かを見られるようになる,道順を知らなくとも目的地にたどり着けるといった感じだ。
そして3つめは,場としての社会に人工知能を埋め込むこと。例えば会議室に人工知能を持たせることで,議事録がオートで作成されるなどである。
こうやって拡張した人間と進化した自律型AIのコミュニケーションは高速に行われ,常に人間と人工知能はアップデートされていく。三宅氏は,レイ・カーツワイル氏の提唱するシンギュラリティが本来意味するところはこれであるとし,「人工知能は人間を模倣し,狭い問題の中では人間以上の能力を獲得する」とした。
最近話題になったディープラーニングによるパックマンの目コピも紹介 |
Atariのゲーム57タイトルを人間よりもうまくプレイする人工知能も紹介された |
「人工知能は環境となる」というテーマでは,場としての社会に人工知能を埋め込むことが掘り下げられた。例えば世界中でプロジェクトが進められているスマートシティは,都市全体を監視・制御するAIの下に各エリアを監視・制御するAIがあり,さらにその下に各ビルを監視・制御するAIがあり……という階層構造となっている。
しかし人工知能には現実世界が苦手という事実があるため,リアル世界とまったく同じ構造の世界をデジタルで作り出し(デジタルツイン),一旦それを経由して都市などの監視・制御を行うとのこと。具体的には都市を丸ごとスキャンしてデータ化し,それらの差分を検出して異常がないかチェックしていくそうだ。三宅氏によると,そうした仕組みにはゲームAIの技術,とくにゲーム全体を俯瞰するメタAIの技術が応用されているという。
また都市内のさまざまな情報はビッグデータとして蓄積され,人工知能が解釈していく。交通システムなどはもはや人間が介在できる規模ではないそうで,何かあったときは人工知能が自律的にアプローチし,修復を試みているとのこと。
まとめると,現在の人工知能はいきなりリアル世界に出て行動するのではなく,クラウドやインターネットなどで得たデジタル知識を駆使してリアル世界を認識し,ロボットやドローンを介して具体的な行動を起こしているというわけである。
さらにAR技術を応用すると,デジタルツインの渋谷にサービスエージェントを置くことが可能となり,リアル世界で商品を手に取って,スマートフォンのカメラを介して見るとデジタルキャラクターによる商品解説が聞けるなんてことも実現できる。そうしたデジタルデータ化の技術はかなり進化しており,3Dのディープラーニングもある程度可能になっているという。ゲームのアセットも学習ベースで自動生成できるようになっており,人工知能が岩などを何パターンか作り,人間はその中から選んだり,あるいはもっと適切なもに作り直すよう指示を出したりするだけという感じになっていくそうだ。
また例えば,あるショッピングモールがプロモーションをしたいとなったときに,デジタルツインを構築し,デジタルアバターに商品の解説をさせたり,eコマース機能を連動させたりすれば,あたかも現地で買い物をしているかのような通信販売が可能となる。
三宅氏は「デジタル世界がリアル世界にフィードバックする」「デジタルとリアルがミックスし,分けて考えることに意味がなくなる」とし,「我々は,デジタル空間とリアル空間にまたがる巨大な人工知能を作ろうとしている」と表現した。
スマートシティのデジタルツインは,デジタル上に世界を持つ従来的なゲームや,位置情報ゲームなどのARゲームの在り方にも影響を与える。「夜の渋谷に徘徊するモンスターを皆で倒そう」というようなミッションをすぐに作れたり,さらにモンスターを一定数倒したら,リアルの店舗に何かが出現するといったこともできたりと,スマートシティなら別途インフラを用意しなくとも,街全体をゲーム空間化できるわけである。
ゲームで使う人工知能は,ゲームの中にあるゲームAIと外にあるゲーム周辺AIに分類される。前者はコンテンツに直接関わるAIで,ゲーム全体を制御するメタAI,キャラクターの行動を決めるキャラクターAI,地形を解析し目的地までの移動ルートを決定するナビゲーションAIの3つがある。一方後者のゲーム周辺AIは,開発支援AIや自動生成AI,インターフェース上のAIなど,ゲームの開発やリアルとのやり取りに使うAIだ。
また人工知能はシンボリズムとコネクショニズムの2系統に分類され,ゲームAIは前者にあたり記号主義に基づいているが,三宅氏によると今後はコネクショニズムのシフトして機械学習化が進むとのこと。このときネックになるのが,学習には再現性が必要という点で,そこはシミュレーション技術でカバーすることになる。
ゲームAIの強みは,もともと物理シミュレーションを持っているので,再現性が担保されることだ。そのため何度も試行錯誤を繰り返すことで,機械学習が可能となっていたのである。
三宅氏は現在を「技術の端境期」とし,「ディープラーニングは,以前だとビッグデータがあるところで行っていたが,今はビッグデータがなくともシミュレーションでデータを蓄積して行うことができる」と説明。シミュレーション技術は,これまでゲーム産業がトップランナーとしてリードしてきたが,今やさまざまな人工知能企業が参入してきているという。
例えばGoogleは機械学習の研究のためにサッカーゲームを開発し,シミュレーションの場として使っているし,MicrosoftやNvidiaなどの競合他社も同様のことを行っている。三宅氏はこの状況を「ゲーム産業の外で,ゲームAIと丸被りの研究が進んでいる」と表現した。
さらに三宅氏は「今,人工知能の発展に必要なのは,実はデジタルゲーム」とし,実際に「Quake III Arena」の自動生成マップなどが,機械学習のためのシミュレーション用に提供されていることを紹介した。また「Minecraft」は,プレイヤーの行動がシンプルで,かつゲームの制約が極めて少ないことから,人工知能の基礎研究に適しているという。
そのようにゲーム産業と人工知能界隈は密接な関係になりつつあるが,そもそもの始まりは,「DOOM」シリーズに使われたDOOMエンジンのソースコードが1997年にオープン化されたことにある。このオープンソースコードは,当時のゲーム開発者が着目したのはもちろんだが,最近では人工知能の研究でも多く利用されていたという。
このように,現在のところは20年以上前のゲームを使って人工知能の研究が進められているケースもまだまだ多いが,それが一とおり終わると今度はリアルタイムで開発しているゲームが研究に使われるようになる。実際,そうした研究を開始したとMicrosoftがGame Developers Conference(GDC) 2020で発表したそうだ。
三宅氏は人工知能の役割を,「人を代替する」と「人の能力をエンハンスメント(倍増)する」の2つであると語る。前者においては「人も人工知能も,その仕事ができる」という状態まで持っていかなければならない。しかし後者のエンハンスメントは,そこまで行かなくとも細かい仕事だけを人工知能に任せるようなことができれば可能であり,すでにゲームの中にも採り入れられている。例えば最近のゲームだと,ボタン1つで細い木の枝の先にヒョイと飛び移ったりできるが,これはプレイヤーの操作を人工知能がアシストすることにより実現しているもの。
つまり人工知能が気づかれないようサポートしてプレイヤーに達成感を持たせているのだが,三宅氏はリアル社会にもこれが導入されるようになると予測する。そうなると属人性が緩和され,誰がやっても仕事の水準をある程度まで担保できるようになるので,企業側にもメリットがあるからだ。
人工知能が人を代替する具体例としては,ゲームのテスターにAIを採用するケースが挙げられた。例えば,「アサシン クリード オリジンズ」(PS4 / Xbox One / PC)のゲーム内には500万ものオブジェクトが配置されており,それが正しく置かれているかを人間が1つ1つチェックするためには莫大なコストがかかる。そこでスクリプトを組み,毎晩チェックさせて逐一修正していったそうだ。
また「バトルフィールド1」(PC / PS4 / Xbox One)には64人対戦モードがあるが,これをテストするのに64人のテスターを実際に集めるのは困難だ。そこでディープラーニングでプレイヤーの動作を覚えた64人分のAIが対戦するというテストが行われたが,本採用には至らなかったとのこと。
人工知能が人をエンハンスメントする具体例としては,「サドンアタック」のチート検出が挙げられた。もともと「サドンアタック」チームでは,ゲーム中のスクリーンショットを無作為に抽出し,人間の目視でチートがなされていないかのチェックをしていたのだが,まずはそのデータをディープラーニングで人工知能に教え込んだ。そうすることで,人工知能が疑わしいスクリーンショットを発見したときに,「これはチートではないか」というサジェスチョンを表示するようにしたのである。これにより,1日あたりのスクリーンショットのチェック量は10倍近くになり,チートの検出率も高まったという。
eスポーツも,今後は人工知能やディープラーニングと密接な関係になっていく。三宅氏は,あるゲームがeスポーツとして人気が出て最強チームが誕生すると,AIと戦わせてAIの性能を知りたいという流れになると説明。例えば機械学習プロジェクト「OpenAI Five」は,人間の時間に換算すると180時間以上プレイしている「Dota 2」のAIチームを作り上げ,人間のチャンピオンチームに勝利した。三宅氏によると,eスポーツ系のゲームはフレームがしっかり決まっており,ルールも厳密でデータも蓄積しやすいので,人工知能としても学習しやすいそうだ。
「人工知能は文化を持ち始める」というテーマでは,まず三宅氏が,猿はボス猿の前でエサを食べないという事例を引き合いに出し,「ある程度高等生物になると,社会的な力が加わったときに行動が変わる。その行動を変える観念が文化になっていく」と説明。「文化とは社会の行動様式を変えるもの」と続け,例えば人工知能の階層構造を上位に引き上げていくのも観念であるとした。
それはリアル社会でも同じで環境を経験し,それが観念となって文化になると社会全体に影響を及ぼして,次の社会に継承されていく。例えばチンパンジーは群れごとに文化を持っているが,たまにほかの群れから紛れ込んでくる個体がいる。その個体が元の群れの文化でやっていたことを当たり前のようにやると,大人は興味を示さないが,子どもは興味を持ち真似し始める。さらには真似した文化を応用し,新しいことを始めるケースもある。これが文化の伝播・発展であり,行動様式を変えるということである。
三宅氏は以上をまとめて「文化とは,個を外側から形成する力でもある」とし,「ある一定の様式が文化になると次の世代にも自然に引き継がれる」と説明した。
そうした世代を超えて文化が継承していくことを計算する,「文化アルゴリズム」も紹介された。最近では,複数の人工知能をそれぞれ1つの集団に見立てて,このアルゴリズムのシミュレーションをやろうというプロジェクトもあるという。しかし人工知能が100体あれば100体が自分の行動様式を文化として残そうとするため,必ずしもほかの行動様式を受け入れるわけではなく,そこに対立が起きる。
全体としては優れた行動様式を残さなければならないので,その判定をする上位機能が必要となり,それこそが文化という機能であると三宅氏は語る。そして勝ち残った行動様式が,文化として強制的に若い世代に受け継がれていく。例えば「日本人なら箸が使えて当たり前」といったように,文化は何の判断もなく強制されるので,「若い世代には自由がない」と三宅氏は付け加えていた。
「人工知能の愛と幸福」というテーマでは,まずジョギングが例に出された。2人でジョギングする場合,単に列に並んで走っても分かり合えることはないが,ロープで身体を結ぶと「相手はスピードを出したいと思っている」「逆にゆっくり走ろうとしている」など,互いに分かり合えるようになるという。
三宅氏は,「お互いが同期して協調する力の輪ができたら,それはある意味分かり合えたと言っていいんじゃないか」とし,人と人工知能の間の循環についても「自分自身の存在を変化させるほど相手と協調したいのであれば,それは愛と言っていいんじゃないか」と語った。つまり,今の人工知能は基本的に自分を変えることなく,データを蓄積するなどの行動を取っているが,「相手のために自分を変え続けるメカニズムを持たせられるなら,その人工知能は愛を持つ」というのが三宅氏の見解である。
それでは人工知能の幸福とは何か。「そもそも人ですら幸福とは何か分からず,それを求めて悩んでいるのだから,人工知能もよく分からなくていいのではないか」というのが三宅氏の見解であり,「人工知能の幸福について考えるなら,幸福を求める悩みを持たせればいい」というのが答えである。
人間は何で悩んでいるのかと言えば,世界と溶け合いたいという衝動と,世界から離れて自分自身を確立したいという欲求の間で行ったり来たりしているからである。例えばSNSに投稿して他人から「いいね!」をもらえると,分かってもらえたような気になったり承認欲求が満たされたりして気分が良くなるが,そうやって受け入れられることばかりを優先すると疲れてくるので,投稿を止めて自分だけの世界に引きこもる。そうやって引きこもりを続けているうちに,何かさびしくなって「いいね!」を求めてSNSへの投稿を再開する……といったアンヴィバレンツの繰り返しなのだ。
そのように人工知能も世界に関わる時間が優勢のときもあれば,自分を整える時間が優勢のときもあるという状態に置けばいいというわけで,三宅氏は「人間の知能がそうであるならば,人工知能もそうであるべき」と話していた。
最後に三宅氏は,人工知能研究について「自律した人工知能を目指すのが正統な流れ」とし,現在の人工知能研究について「ゲーム空間を応用して自律した人工知能を作ろうという流れにシフトしている面白い時代になっている」とまとめてトークを締めくくった。
「黒川塾 七十八(78)」配信アーカイヴ(YouTube)
- 関連タイトル:
Minecraft
- この記事のURL:
キーワード
(C)2009-2010 Mojang AB.