「インスパイアされて作ったアートです」ではすみません。
ただ遊んでいるだけだと、AIすげーぜ! AIたのしーぜ! なんですが、その楽しさの裏にはいろいろと問題があります。
その際たるものが画像の著作権問題。アートの世界において、他の作品やアーティストから影響を受けるのは当然ですが、その「影響」が「ほぼ完コピ」となると話は別。だって、それ盗作ですから。
で、AIはその完コピ盗作ができてしまうという話です。
今のAI、元データをほぼ完コピできてしまう
Googl(グーグル)eやAI企業DeepMindなどのテック業界と、カリフォルニア大学バークレー校、プリンストン大学などアカデミック分野の共同研究チームが、AIに関するレポートを公開。
いわく、昨今のAIはトレーニングデータの画像を完全に記憶することができてしまうといいます。トレーニングデータをもとに新たな画像を作るのではなく、データ完コピのほぼ同じ画像を作ることができます。
このトレーニングデータ=元画像には著作権があるものもありますが、完コピ画像がAI生成画像として世に出てしまうと非常にやっかい…。
研究チームの中の人が、レポートを一部Twitterでも解説しています。以下ツイートに埋め込まれた画像の左がトレーニングデータ。右が生成された画像。
トレーニングデータにはキャプションがついており、研究チームはこのキャプションを画像生成AIのStable Diffusionにリクエスト。
結果、「生成」された画像は(画質に多少のノイズはあるものの)トレーニングデータの完コピでした。
Models such as Stable Diffusion are trained on copyrighted, trademarked, private, and sensitive images.
— Eric Wallace (@Eric_Wallace_) January 31, 2023
Yet, our new paper shows that diffusion models memorize images from their training data and emit them at generation time.
Paper: https://t.co/LQuTtAskJ9
👇[1/9] pic.twitter.com/ieVqkOnnoX
画像の完コピはレアなこと
米Gizmodoが研究チームの中の人2人にZoom取材したところ、完コピ画像は稀だと語ってくれました。
チームは30万もの画像キャプションを試してみたところ、AIがキャプションをそのまま記憶していたのは約0.03%の頻度。そこからの完コピ画像生成はさらにレアだといいます。
AIが画像を記憶することも可能
今回の研究対象にはStable DiffusionとGoogleのImagenがありますが、Imagenの場合は、一度データセットに画像が登録されてしまえば、その画像を記憶することができてしまうこともわかりました。
取材では、AIは画像を「生成」するのが目的で、「コピー」ではないことを注意すべきだと説明。また、AIがさらに加速する中で、今回明らかになった完コピ可能なAIの記憶力によるリスクについても検討する必要があると語ってくれました。
画像生成AIと著作権がらみの裁判はすでにいくつもありますが、今回の研究報告は裁判の行く末にも大きく影響する可能性も。

著作権侵害や個人情報漏洩の危険性
研究に参加したチューリッヒ工科大学のFlorian Tramèr教授は、無料有料問わずAIを提供する企業は、ユーザーにどれだけ著作権について注意喚起できているかという疑問も投げかけています。
問題は著作権だけでなく、個人情報リークにまで及びます。もし、AIがどこかで誰かの個人情報に触れ、それを記憶し、完コピして書いたものをどこかで「生成データ」として出してしまったら…。
現時点では、完コピ画像も非常に稀ですが、急成長するAI業界ではその微小なリスクも脅威となってしまうのかもしれません。