イベント
[CEDEC 2023]生成AIをゲーム開発で活用する際に,法律・知財・契約上で留意すべきポイントとは。弁護士が解説したセッションをレポート
本セッションには,STORIA法律事務所のパートナー弁護士である柿沼太一氏が登壇し,生成AI(主に画像生成AI)をコンピューターエンターテインメント領域にて利用する場合の法律や知財,契約上の留意点について解説した。
生成AIと著作権に関する論点一覧
本セッションの冒頭で,柿沼氏は生成AIの著作権に関する論点がほぼ
- 「AI開発・学習と著作権侵害」
- 「AI生成物の生成・利用と著作権侵害」
- 「AI生成物と著作物性」
の3つであることを指摘。それぞれを言い換えると,
- 「AIの開発と学習に人の著作物を勝手に使っていいのか」
- 「AIを使って生成物を作ったり,あるいは利用したりすることが他者の著作権を侵害しないか」
- 「AI生成物に著作権が発生するのか」
になるとのこと。
また生成AIの著作権を考えるときには,「学習済みモデルを作るフェーズ」と「作った学習済みモデルを使って生成物を作るフェーズ」に分けて考えることが重要だという。
AI開発・学習と著作権侵害
まずAI開発・学習と著作権侵害についてで,「第三者が提供する画像生成AIのオープンソースソフトウェア(OSS)を使い,他者の画像でファインチューニング(既存のモデルに任意のキャラクターやオブジェクト,好きな絵柄などを追加学習させるLoRAを含む)を行って,自社専用の画像生成AIを構築することは可能か」という疑問が例示された。
柿沼氏は,著作権法30条の4の第2号により,「情報解析の用に供する場合」と見なされ,「著作物に表現された思想又は感情の享受を目的としない利用」となり,原則として適法だと見解を語った。この場合の情報解析には,ファインチューニング(LoRAを含む)も含まれるそうだ。
ただし,著作権法30条の4が万能かというとそんなことはなく,注意点もいくつかある。1つめは,これはあくまで「学習」に関する規定であり,AI生成物の生成やAI生成物の利用とは別の問題であること。
2つめは,諸外国にも似たような規定はあるが,日本の場合は世界的に見てかなり緩い規定となっており,利用目的に制限がなく,営利目的のために使ってもいいことだ。そうなるとオフショア開発では,どの国の法律が適用されるのかという疑問が出てくるが,「当該著作物が利用される地」(利用行為地)の法律が適用されるという。
すなわち,作業者が日本にいて日本のサーバー上で作業が行われていれば日本の著作権法が適用されるが,サーバーか作業者のいずれかが外国の場合は日本の著作権法が適用されない可能性があるので注意しなければならないそうだ。
3つめは,学習に使おうとしているコンテンツの権利を誰が持っているかは無関係であること。たとえば外国の企業が著作権を持っている著作物だったとしても,日本国内での利用行為には,日本の著作権法30条の4が適用されるという。
また著作権表記(©)は,著作権の内容とは無関係で,仮に著作権が発生していても,日本国内であれば日本の著作権法30条の4が適用されるそうだ。
さらに例外も2つある。1つめは「学習時に学習対象著作物の享受目的も併存している場合」というもので,より詳しくは,情報解析(学習)のために対象著作物の利用行為を行うに際して,対象著作物の「表現上の本質的な特徴」を感じ取れるような著作物の作成目的(=対象著作物の享受目的)が併存している場合,対象著作物の利用行為は30条の4の対象に“ならない”とのこと。
つまり作風が似ている,○○を真似ているというレベルではなく,まさに対象著作物そのものを作ることが目的だと判断されれば,著作権侵害となる。
ただし柿沼氏によると,学習段階──つまり,まだAI生成物が生成されていない段階において,享受目的が認定されるケースがどれだけあるかは疑問だという。またLoRAなどの技術を利用する場合も,「対象著作物の作風の再現」を目的とするような場合には「享受目的はない」と考えているそうだ。
もう1つの例外が著作権法30条の4但書「ただし,当該著作物の種類及び用途立びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は,この限りでない」で,どのようなケースがこれに該当するかは明文化されていないため,現在議論がなされているとのこと。
とは言え,「情報解析を行う者の用に供するために作成されたデータベースの著作物の利用行為」──すなわち学習用データセットのようなものを無断で使っていると,但書に該当する可能性があるそうだ。逆に,それ以外で但書に該当するケースはそれほど多くないという。
AI生成物の生成・利用と著作権侵害
AI生成物の生成・利用と著作権侵害に関しては,「著作物の入力行為」「AI生成物の生成行為」「AI生成物の送信行為」の3段階に分けて検討する必要があるそうだ。そのうえで,実際に問題になることが多い4つのパターンが示された。
パターン1は,生成AIに既存著作物を入力しているだけで,生成AIによる処理結果として類似著作物が生成されていないというもの。まず著作権侵害と判定するには,類似性と依拠性が必要となるため,この点ではセーフとなる。
続いて,権利制限規定の適用についてチェック。既存著作物を入力する時点でコピーしていることが引っ掛かりそうだが,これは情報解析のために必要な行為と見なされるので,著作権法30条の4が適用されるというのが柿沼氏の見解である。
ただ上記のとおり,著作権法30条の4には例外が2つあり,享受目的がある場合には適用されないが,このパターンはAI生成物を作っているため,柿沼氏は「学習段階における既存著作物の利用の場合よりも,享受目的併存が認められるケースは多いのではないか」と説明した。
パターン2は,生成AIに既存著作物を入力し,生成AIによる処理結果として既存著作物と類似するAI生成物が生成され,当該AI生成物を配信したり譲渡したりするケースだ。
入力行為における権利制限規定の適用は,パターン1と同様に原則は情報解析とみなされるのでOKだが,享受目的または但書該当の場合はNGとなる。さらにこのパターンは,入力のみ行っているパターン1と異なり,AI生成物を実際に生成し,かつ配信などをしていることから,入力行為について享受目的ありと判断されるかもしれない。この場合は著作権法30条の4が適用され,NGと思われるとのこと。
また後述するパターン4と異なり,ユーザー自身が既存著作物を生成AIに入力してAI生成物を生成・利用しているため,「“偶然”生成された」「既存著作物を知らなかった」という言い訳は通用しないそうだ。
パターン3は,生成AIに生成指示や非著作物を入力したところ,生成AIによる処理結果として既存著作物の類似著作物が生成され,当該類似著作物を利用(公衆送信・譲渡など)しているケースである。
このパターンは,まずユーザーが既存著作物を知っているかどうかで判断が分かれる。ユーザーが既存著作物を知っていた場合は,明確に単なる著作権侵害である。
一方,知らなかった場合は,偶然既存著作物に似たものができたわけなので,著作権侵害にはあたらない。ただ,これは理屈上の話であり,柿沼氏は「実際に有名なコンテンツとすごく似ているものを作ってしまったとして,『知りませんでした』で済むかどうかと言うと,かなり厳しいのではないか」との見解を示した。
パターン4は,学習に既存著作物が使われており,生成AIに生成指示や非著作物を入力したところ,生成AIによる処理結果として既存著作物の類似著作物が生成され,当該類似著作物を利用(公衆送信・譲渡など)しているケースで,柿沼氏によると「一番難しい問題」とのこと。
このパターンでも,ユーザーが既存著作物の存在や,学習に既存著作物が利用されていることを知っているかどうかで判断が分かれる。まず知っていた場合は,著作権侵害である。
難しいのは,ユーザーが既存著作物の存在や,学習に既存著作物が利用されていることを知らなかった場合で,柿沼氏は「このパターンが明確な著作権侵害だとすると,怖くて生成AIを使えなくなる。つまり,このパターンが著作権侵害になるかどうかは,生成AIをどこまで使えるかという点においてかなり重要な問題」と指摘。
そして,ここではユーザーが既存の著作物を知っているかどうかや接したことがあるかどうかを示す「依拠性」があるかどうかが論点になるという。学習に使われた既存著作物はAI生成物の生成過程ではパラメータとなっており,そのままコピーされているわけではない。ただ,柿沼氏によると,学説上では依拠性があると考えるケースが多いように思われるとのこと。
したがって保守的に考えるのであれば,学習に使われた既存著作物に類似したAI生成物が世に出てしまうと著作権侵害となるため,きちんとリサーチする必要があるという。ただ,リサーチと言っても実行は難しく,学習データセットの内容が公開されていれば,それをチェックする,あるいはWeb検索をかけるといったくらいしか方法はないそうだ。
柿沼氏は,このパターンでAI生成物を生成する状況は,外部事業者にコンテンツ制作を委託した場合に似ているとする。そうした状況下で著作権侵害を回避するためのの現実的な対応手段は3つしかないそうだ。
1つは,変な学習済みモデルを使わないこと。つまり,大規模に学習したモデルであるほど,学習データセットにあるデータとほぼ同じなものが出てくる可能性は,かなり低くなるからだ。逆に特定の作家や作品,キャラクターだけを学習させたような特化型モデルは,著作権侵害のリスクが高まるとのこと。
2つめは,プロンプト(AIへの指示)入力時に,作家名や作品名など著作権侵害を誘発するテキストを含めないことで,3つめは,AI生成物が著作権を侵害していないかセルフチェックすることだ。柿沼氏は,これら3つを合わせて実行することで,100%大丈夫というわけではないが,相当リスクが低くなると考えていると話していた。
AI生成物と著作物性
柿沼氏は,AI生成物に著作権が発生しなければ模倣され放題となるので,事業領域によっては重要な問題になることを指摘。その一方で,AI生成物に著作権が発生するケースには,確固たる基準がないことにも言及した。
著作権の発生に関する日本での基準は,3つに分類されているとのこと。1つめは,人による創作には著作権が発生するというもの。2つめは,AIによる創作には著作権が発生しないというもの。そして3つめは,AIを道具として利用した創作には著作権が発生するというものだ。2つめと3つめの違いは,前者はボタンを押しただけなどの簡単な操作であるのに対し,後者には人の創作意図や創作的寄与が存在するということだ。
柿沼氏は,「どんな場合に創作意図があるのか判断するのが,一番の難題。確実な基準はない」とし,「Zarya of the Dawn」の事例を紹介した。この事例は,コミック「Zarya of the Dawn」がアメリカの著作権局に登録されたあと,作者が制作に画像生成AIのMidjourneyを使用したとSNSに投稿したことに端を発する。作者がどのようにコミックを制作したのか,弁護士を介して提出したところ,著作権局はMidjourneyが作った画像については著作権はないという判断を下した。
その一方で,セリフや構成などについては,作者自身が作っているので,著作権が発生するとしたのである。
なぜ,アメリカの最高裁がMidjourneyの作った画像に著作権がないと判断したのかについて,柿沼氏は要点が3つあるとする。その中でもおそらく大きなポイントだろうと考えるのが,「ユーザーがMidjourneyに作成するよう指示可能な範囲と,実際に作成された画像との間に大きな隔たりがある」ことで,「ユーザーが完全にMidjourneyをコントロールできていないことを非常に重視していると思われる」と見解を語った。また逆に言えば,Midjourneyをコントロールできる仕組みを入れたり,生成物を加工したりすれば著作物性が存在するということになるのではないかとも捉えているそうだ。
なお日本にはアメリカのような著作権登録制度はないため,どうなるかはまったく分からず,今後裁判などが起きたら,何かしらの基準ができるかもしれないとのこと。柿沼氏自身は,「短いプロンプトで一発出力」したAI生成画像に著作権はなく,「AIが自動生成した画像に人間がさらに加工したもの」には著作権が発生すると考えているそうだ。ただし後者の場合は,人間が加工した部分にだけ著作権があるため,全体的に加工する必要があるという。
難しいのは「長く複雑なプロンプトで出力」したAI生成画像や,「プロンプト自体の長さや構成要素を複数回試行錯誤して生成されたものの中から優れた画像を選択」したケースで,著作権の有無には議論があるそうだ。たとえば人間同士の場合,アーティストに指示したディレクターや,作家に指示した編集者は著作者ではないため,AIに指示しただけの人も著作者ではないとする説もあれば,AIは人間ではないのだから話が別という説もあるという。
また文章についても同様の問題があるわけだが,画像生成AIを使って画像を生成する場合に生じる「出力をコントロールして思い通りの画像を生成する」というような意図がないことが多いため,AI生成文章には著作権が発生しないケースが多いのではないかと,柿沼氏は考えているそうだ。
ゲーム内声優音声に関する権利関係
セッションの終盤では,ゲーム内の声優による音声に関する権利関係に関する解説もなされた。基本的な考え方としては,
- 「ゲーム内の声優の音声に関して誰がどのような権利を持っているか」
- 「音声生成AIの作成(学習)フェーズと,音声生成AIによって生成された実際の音声の利用フェーズそれぞれにおいて,それら権利の侵害行為があるか」
を検討する必要があるとのこと。
まずゲーム内の声優の音声に関して誰がどのような権利を持っているかについては,セリフを作成した著作者(脚本家など)に「セリフの著作権」が,実演をした声優という実演家に「声優の実演に関する著作隣接権」が,そして声優に「声優の声に関するパブリシティ権」がそれぞれ生じる。
声優Xの音声データを学習用データとする音声生成AIを使った場合,学習フェーズにおいて,「セリフAの著作権」は著作権法第30条の4第2号により,セリフAの著作者の許諾なく学習に利用しても原則として適法となる。
また「実演家Xの著作隣接権」も,著作権法第102条および同第30条の4第2号により,実演家Xの許諾なく学習に利用しても原則として適法となる。
さらに「Xの声に関するパブリシティ権」は,学習に利用するだけであれば,適法ではないかというのが,柿沼氏の見解である。
したがって,「さまざまなゲーム内の,さまざまな声優による音声を大量に収集し,音声用AIを作成したい。無断でそれらの声優音声データを収集してAIの生成(学習)に利用することは可能か」「ある特定の声優の音声を再現するために,当該声優の音声を大量に収集し,音声用AIを作成したい。無断でそれらの声優音声データを収集してAIの生成(学習)に利用することは可能か」という2つの設例は,いずれも適法となる。
一方,生成・利用フェーズは,3つのAI生成物のパターンに分けて解説がなされた。パターン1は,無断利用のAI生成物が「オリジナルと同じ声優Xによる既存セリフAの実演」というケースだ。セリフの著作権については,既存セリフの無断利用なので,生成AIと関係なく著作権の侵害にあたる。
また「実演家Xの著作隣接権」は,実演家は「その実演」(実際に演じられた実演そのもの)に関する隣接権を有する(著作権法第91条等)が,AIにより生成・出力された実演は「その実演」とは言えないため,声優Xの著作隣接権の侵害にはならない。
しかし「声優Xのパブリシティ権」については,音声生成AIにより生成された音声であっても,その「声」が当該声優の声であると認識できれば,「何をしゃべっているか」とは無関係にパブリシティ権が発生するため,当該声優に無断で当該音声をゲーム内で利用すれば,声優Xのパブリシティ権侵害となる。
パターン2は,AI生成物が「オリジナルと異なる声優Yによる既存セリフAの実演」というケースである。こちらもセリフの著作権については,既存セリフの無断利用なので,生成AIと関係なく著作権侵害となる。
また「声優Yの著作隣接権」は,声優YによるセリフAの実演は存在しない実演なので,声優Yの著作隣接権の侵害にはならない。
そして「声優Yのパブリシティ権」については,音声生成AIにより生成された音声であっても,その声が当該声優の声であると認識できれば,「何をしゃべっているか」とは無関係にパブリシティ権が発生するため,当該声優に無断で当該音声をゲーム内で利用すれば,声優Yのパブリシティ権侵害となる。
パターン3は,AI生成物が「声優Xによるオリジナルセリフの実演」というケースだ。「セリフの著作権」はオリジナルセリフの利用なので,著作権侵害にはならない。
また「声優Xの著作隣接権」は,声優Xによる実演が存在しないため,声優Xの著作隣接権の侵害にはならない。
しかし「声優Xのパブリシティ権」は,これまで同様,音声生成AIにより生成された音声であっても,その声が当該声優の声であると認識できれば「何をしゃべっているか」とは無関係にパブリシティ権が発生するため,当該声優に無断で当該音声をゲーム内で利用すれば,声優Xのパブリシティ権侵害になる。
4Gamerの「CEDEC 2023」記事一覧
- この記事のURL: