イベント
[CEDEC 2023]ゲームにおける自然言語処理が解説されたセッションをレポート。世界が変われば言葉も変わる
ChatGPTに代表される大規模言語モデルは,私たちが日常で使っているような言葉(自然言語)でコンピュータとやりとりすることを可能にしたが,それをゲームで活用すると,どんな機能が実現できるのか,注意するべき点は何なのか,といったことが語られた講演の模様をレポートしよう。
スクウェア・エニックス AI部 AIリサーチャー 森 友亮氏 |
森氏はまず,ゲームで自然言語が使えるようになったときに実現できそうな機能を提示した。
NPCとの会話では,「ここは●●の村です」といったような決まり切ったセリフを繰り返すのではなく,話すたびに違うセリフを返してくれて,仲良くなれば「おかえりなさい!」と迎えてくれるような,関係性の変化まで表現できる。
また,「●●を探して」「●●を倒して」といったようなサブクエストを無数のバリエーションで作ることも,シナリオをプレイヤーの行動に合わせて変化させることも可能になる。
もちろんAIキャラは対戦相手や仲間になってくれる。仲間のキャラには,あらかじめ用意されたコマンドの入力ではなく,自然な言葉による複雑な指示ができるし,そのキャラはこちらの要望を確認しつつも自分のやりたい行動を取るという,人間っぽさを見せてくれるかもしれない。
また,開発者にとっては,シナリオ制作時のアイデア出しなどで,よい相談相手にもなりそうだ。
続いて森氏は,今なぜゲームに自然言語処理(Natural Language Processing,NLP)が必要なのかを説明した。
もっとも大きな理由としては,ChatGPTに代表される大規模言語モデルや,それを含む生成系AIが登場したことが挙げられる。森氏はそのインパクトがあまりに大きいため,どう活用するのか,どうすれば問題が生じないのかを考える必要があると語った。
NLPとは,自然言語をコンピュータによって処理する技術の総称。具体的なタスクとしては,「翻訳」「要約」「質問応答」「文章生成」「感情分析」などがあるが,中でもゲームとの関係が深いのが「対話」だ。
テキストベースのRPGは,Joseph Weizenbaum氏が1966年に発表した自然言語処理プログラム「ELIZA」に起源がある。ELIZAはもともとカウンセリング用途を目的として作られた試験的ソフトウェアだったが,Don Daglow氏はそれを拡張したプログラムを書き,最初期のコンピュータRPG「Dungeon」につながった。
また,初期のテキストベースRPGは,エージェントと対話する行為そのものがゲームだったという。
その後,時代が進むにつれ,NLPとゲームの距離は離れていったのだが,森氏は「大規模言語モデルの登場によって,デジタルゲームとNLPの道が再び交わる時が来ている」とした。
続いて,その大規模言語モデルの概要が説明された。
もともとの言語モデルは「次に来る単語が何か」を予測するものだったが,2017年にTransformer(大規模言語モデルのベースとなるもの)が登場したことで大規模化が進んだ。また,規模が大きくなる中で,それまでできなかったことが,ある段階から突然できるようになる「創発性」が発見されたことで,大企業がこぞって開発に投資するようになり,進化のスピードが加速している。
このあたりの解説は,CEDECの基調講演「AIはゲームをどのように変えるのか」と重なる部分も多いので,そちらのレポートも参照してほしい。
[CEDEC 2023]AIの現状とゲームに与える影響とは。街にいるAIキャラクターが,勝手にパーティーを始めるゲームが生まれる!?
ゲーム開発者会議CEDEC 2023の初日である8月23日に,岡野原 大輔氏による基調講演「AIはゲームをどのように変えるのか」が行われた。急激に進化するAIの現状や,それが今後のゲームにどのような影響を与えるのかが語られた講演の模様をレポートしよう。
大規模言語モデルには,ゲームプレイに特化したものもある。Metaが2022年に発表した「CICERO」がそれで,戦略ボードゲーム「Diplomacy」で人間レベルのパフォーマンスを発揮するほか,戦略に基づく会話や,対話の内容を考慮した戦略を取るといったこともできるとのことだ。
万能にも思える大規模言語モデルだが,もちろん問題点もある。大きなものとして「必ずしも人間の求める回答を返さない」があり,学習データに含まれていない内容には答えられない。2021年までのデータで学習した大規模言語モデルに,2022年に起こった歴史的事実を聞いても,さすがに分からないというわけだ。
また,ChatGPTを使ったことがある人なら思い当たるかもしれないが,「間違った内容を,さも正しいかのように回答する」こともある。この現象は「幻覚」(ハルシネーション)と呼ばれ,もともとの言語モデルが持っている「次に来る単語は何かを予測する」という性質が影響している。
こういった問題を解決し,より人間が求める応答を実現するために,現在のAI開発においては,チューニングが重要視されている。
大規模モデルの問題点には,「大規模すぎて自前で動かせる組織が限られる」というものもある。巨大なクラスタ,サーバーが必要になるため,それにかかるコストを用意できない場合は外部からAPI等を利用することになるが,それにも当然料金はかかる。
そのため,最近は小型でも性能がよいモデルの開発や,すでにある大規模モデルを軽量化する動きがあるという。
Transformer型の大規模言語モデルには,「モデルのパラメータ数やデータセットのサイズ,計算資源が多いほど性能がよくなる」という「スケーリング則」が発見されており,それが大規模化をさらに推し進めていたのだが,2022年には,従来のモデルよりも少ないパラメータで,より多くのデータを学習したほうがより高い性能を発揮した,という研究結果も出ているとのことだ。
続いて,NLPのライブラリをUbuntu(Linux系のOS)にインストールし,実際に要約を行う手順が紹介されたのだが,本稿では割愛する。
講演の最後に,ゲームにおけるNLPの活用が語られた。
冒頭で挙げられたように,ゲームでNLPを使えるようになれば,NPCと自然な会話をしたり,サブクエストを無数に生成したりといったことが可能になるのだが,ほかにも応用できるものはある。
実況生成に利用すれば,プレイや対戦がさらに盛り上がるし,ヘルプやチュートリアルでもラフな質問が可能になるので,使い勝手はさらによくなりそうだ。
ただ,実際にNLPをゲームに入れようとすると,いくつかの問題が出てくる。
まずは,「サーバーを使うか,アプリに含めるか」という選択だ。大規模言語モデルは高性能なサーバーに接続して使うのが一般的だが,そちらを選ぶとゲームはオンライン専用になり,サーバーが止まればプレイできなくなる。サーバーやAPI利用のコストをどうするかを考える必要も出てくるのだ。
アプリに含めようとしても,違う問題が出てくる。プレイヤーにどれだけの動作環境を求めるかによって実装できる機能は変わってくるし,モデルのアップデートもしづらくなるため,新語や社会通念の変化に対応できないなどの事態が発生する可能性もある。
また,生成に伴う問題もある。森氏は「現実世界のNLPと,ゲームで必要なNLPには違いがある」と,常識や倫理観が異なることを指摘した。現実世界と,回復魔法で傷を癒やせる世界では,当然ながら常識が異なるので,NLPもそれに合わせる必要があるというわけだ。また,現実世界では倫理的に問題があっても,ゲーム世界なら許される言動があるかもしれないので,今あるNLPをそのままゲームに入れても,うまく行かない可能性は高そうだ。
もちろん,前述した「幻覚」のような問題もあるので,そちらの対策も必要になる。現実世界ではChatGPTの回答に「これは嘘かも」と慎重に調べるような人でも,ゲーム内のキャラクターがヒントを教えてくれたら,それが嘘でも信じてしまうかもしれない。
また,キャラクターの性格や知識に合わない言動も避けなければならない。ゲーム序盤なのに,終盤の隠しアイテムの話を始めたら興ざめだろう。
森氏はその対策として,「どんなデータで学習するか」を挙げた。そもそも大規模言語モデルには,学習データに起因するバイアスがあるという。ゲームに合った学習データを集めることが重要になるとのことだ。
森氏はゲームでNLPを活用するためには,一般のNLPの知識を踏まえつつ,ゲームのNLPならではの課題についての議論も必要と呼びかけて,セッションをまとめた。
4Gamerの「CEDEC 2023」記事一覧
- この記事のURL: