画像生成AIの激変は序の口に過ぎない

ASCII.jp / 2022年12月2日 16時0分

　画像生成AI「Stable Diffusion」がコンテンツ製作の技術革新を急速に促しているという話を「すさまじい勢いで世界を変えている画像生成AI」に書きました。あれから約2ヵ月が経ち、状況はさらに大きく変わってきています。

Novel AIソースコード流出事件

　最も影響が大きかったのは10月8日に起きたとされる「Novel AI」のソースコード流出事件です。どういった形でハッキングされたのかは明らかにされていませんが、流出したとされるコードはおそらく本物だという結論になっています。

　Novel AIは10月3日にサービスが開始された画像生成AIサービス。Stable Diffusionや「Midjourney」と比べても圧倒的に高品質な日本アニメ風の画像出力ができることにより、日本やアジア圏で高い人気を得ています。

　Googleトレンドの傾向を見てみても、日本ではNovelAIがリリース後にトレンドのトップを維持しており、海外と比較しても人気の高さが伺えます。NovelAIは月額課金モデルで展開されており、最低設定で10ドルですが、25ドルのプランであれば、作成できるサイズに制限はあるものの、いくらでも画像を生成することができます。

日本のトレンド。青線がNovelAI。他のサービスよりも常にトレンドの上位にいる

全世界の傾向。MidjourneyやStable Diffusionの方が関心が高い

　ところが、リーク版Novel AIは現在ネット上で共有されていて、Stable Diffusionにデータセットのモデルとして読み込ませることができてしまいます。つまり無料で使うことができてしまうのです。もちろん、盗難されたデータということで、違法性の高いデータです。しかし、ネット上で共有され、一気に広がってしまったため、もはやその流通を止めることは事実上不可能になってしまいました。

　Novel AIもStable Diffusionをベースに拡張開発されたものですが、ソースコードの流出により、どうやって品質の高い画像を生み出しているのかが明らかになりました。その中で画像を生成するための「プロンプト」と呼ばれるコマンドの研究がアジア圏で進み、10月中旬には「元素法典第1巻」と呼ばれるプロンプト事典が公開されました。

公開されている「元素法典」。「正面tag」はプロンプト、「反面tag」はネガティブプロンプトのこと

　「元素法典」は、日本の利用者にも大きな驚きを持って受け止められました。

　Novel AIでは、これまでアニメ風の絵柄は出せるものの、絵画風の複雑な絵柄は作りにくいと考えられていたからです。しかし元素法典の中では、複雑で繊細な絵が作れるプロンプトも提案されていたんですね。

　ただ、これがリーク版Novel AIで作られたプロンプトがかなり混じっているのは間違いありません。なぜかといえば、製品版のNovel AIにそのまま打ち込んでも完全に絵が出てこないというのが1つです。製品版Novel AIとリーク版Novel AIには微妙に違いがあるようで、同じプロンプトでも似たような絵は出ても、完全に同じ絵は出ません。さらに製品版のNovel AIにはプロンプトの文字数に225字の上限があるんですが、元素法典には上限をはるかに超える長文のプロンプトが含まれている手法も紹介されている中にはあるというのがもうひとつです。

　現在、ローカル環境でStable Diffusionを動作させるアプリとして最も普及しているのは、AUTOMATIC1111さんが公開しているStable Diffusion web UIだと思われます。アプリにはプロンプト数の制限をなくしたバージョンがあり、リーク版Novel AIはそこでも動作するため、その環境で開発されたものではないかと推察できるんですね。

　元素法典は、これまでのプロンプト以外にも、何を描いてほしくないかを指定する「ネガティブプロンプト」の有効性の発見にもつながり、劇的に画像生成AIの複雑な絵の作成に道を開くことになりました。現在では「元素法典第2巻」もリリースされ、さらなる研究が進んでいます。

AIイラスト投稿サイトの勃興

　Novel AIはサービス開始から10日間で3000万枚もの画像が生成され、11月16日には1億2000万枚もの画像が生成されたと公式に発表されています。リーク版Novel AIを含めるとものすごい数の画像が生成されていると推測されます。今度は、そこで大量に生成された画像をウェブ上でどう発表するかが課題になってきました。特に、既存のイラストコミュニティでは、手描きでイラストを描いていたユーザーたちとの衝突が始まったのです。

　たとえば今、イラスト投稿サイトのpixivで「初音ミク」の画像を検索してみると、新着画像はサムネイルを見ているだけで、NoveAI、これもNovelAI……という状態です。なぜわかるかと言えば、これだけ見ているとだんだんわかってくるんですよね（笑）。

pixivで初音ミクで検索した結果。筆者の推測では新着の5割はAIイラストだと思われる

　「Novel AI顔」とでも言うべき、特徴的なのっぺりとした顔が出力される傾向があり、その対策をとっていない場合は同じような画風の絵柄になりやすい傾向があります。もちろん、画像生成AIがまだ苦手としている指に注目すると発見は容易です。

　特にNovel AIは初音ミクの学習データが大量に含まれているようで、非常にクオリティが高いんですね。短いプロンプトで、完成度の高い画像が作り出せるということで、画像生成AI初心者が最初に作成する初心者向けのプロンプトの一つにもなっています。

　pixivは10月20日に「AI生成作品の取り扱いに関するサービスの方針について」という発表を通じ、今後、AI生成画像を既存の画像と区別することができる機能や、フィルタリング機能、AIのみランキングの提供をしていくとしました。まずは、投稿時に「AI生成作品」のタグをつけるという方針になっています。

　しかし画像生成AIはボタンを押せば10秒単位で画像が生成されてしまうわけで、その画像を次々に投稿する人も現れるようにもなりました。これまで一生懸命描いていた人からすると、この状況を見ると微妙な気分になります。また大量に作られるAI絵に押しやられてしまう結果にもなってしまいます。これまで投稿してきたイラストレーターたちから反発が出るのも当然だと思います。

　それなら、AI画像だけの画像投稿サイトを作ればいいじゃないかというロジックが出てくるのも当然です。AIユーザーたちも安全に投稿できて評価されるサイトを求めているわけですから。その結果、AI画像投稿サイトが国内にいくつも登場してくることになりました。代表的なものは、「AICON」や「chichi-pui」などがあります。

　このうちAICONでは10月中旬から1ヵ月間、AIイラストの投稿コンテストを開催しました。コンテストで入賞するには、ランキング上位に入らないといけないんですが、重要なポイントがあります。ランキングは、他のユーザーの「いいね」数で決まるという点です。もちろん、品質の高いAI絵を投稿しているのは必須条件で、作者の方はTwitterに積極的に呼びかけをすることになるため、それが口コミを作りました。

　さらに、もう一つ画像生成AIコミュニティを活性化させる仕掛けがあります。作成時の画像のプロンプトを公開することが普通になっていることです。プロンプトを公開していないと他のユーザーに「いいね」をつけられにくい傾向があるため、ランキング上位のAI絵のレベルの高いプロンプトが丸々公開されるのが当たり前になりました。コピペして誰でも試せるわけで、さらにプロンプトの研究が進むことになったのです。

AICONのコンテスト結果の発表ページ。良質なAIイラストがプロンプトと共に公開されている。1位のAI絵は574件のいいねを集めた

　サイトによればAICONの運営代表は東京理科大学の学生ということです。こうしたコンテストをNovel AIが流行り始めたタイミングからすぐに立ち上げ、クオリティの高い作品を集めることができたのは大成功と言えるでしょう。しかもコンテストは初回なので、優勝賞金はわずか3万円。もう少し参加人数を安定的に集められるようになれば、サービス自体がスタートアップとして高い価値を持つ可能性があることは容易に予想が付きます。

　ただし、コンテストに応募できるのは合法的な画像に限られていて、リーク版Novel AIの使用は禁止されています。これが海外のサイトだと、「どこのサービスを使ってもよい」ということにしている場合もあるなど、サイトによって対応は異なります。そのサイトではコンテストのテーマも「Pokemon」など露骨なものになっていたりします。おそらく許可は取っていないでしょう。

　そんな形で、いわば画像生成AI版のpixivやpintarestを目指すサブマーケットが登場してきているわけです。新しいテクノロジーが出てきたときは、そこから、そのテクノロジーだけでなく、その派生によって別産業が始まるという典型例ですね。

学習データは明らかにされない方向に

　最近ではリーク版Novel AIをさらに高品質なイラストを追加学習させて進化させたデータセットと言われている「Anything v3.0」というものがあらわれ、従来と比べてもとにかく精度が高いと大騒ぎになっています。「元素法典」作者たちによるデータセットだと言われているのですが、詳細は明らかにされておらずはっきりしたことはわかりません。

anything v3.0、何が凄いかっていうと、このpromptでこれが生成されるんですよ… 恐るべし… というわけで、prompt大公開。 pic.twitter.com/UC7wBumqxd
— kaz (@tkaz2009) November 16, 2022

　また、リーク版Novel AIはStable Diffusionで読み込めるモデルとして登場したわけですが、同様のStable Diffusion向けのデータセットが続々と出てきています。最近出てきたのが「Ghibli-Diffusion」。おそらくスタジオジブリ制作の映画などから学習をさせたものかと思いますが、かなり、それっぽい画像を生成します。

え..やばくない？ Stable Diffusionのジブリモデルで生成された画像信じられない..https://t.co/kt6aXpo82Rpic.twitter.com/mHX9N6v9Tu
— やまかず (@Yamkaz) November 22, 2022

　最近では、何をベースにしてデータセットを作成したのかというのを明らかにすると、著作権の問題などで非難される傾向が高まっているため、どの画像や動画データを学習データに使ったのかということはどんどん隠される傾向が高まっています。

　Midjourneyは、アニメ風に特化した画像生成AIの「Nijijourney」を近く正式サービス化する予定で、現在ベータサービスを提供しています。非常に絵画的な素晴らしいAI絵が生み出されるのですが、何からデータを学習しているのかには完全に沈黙しています。しかしユーザーの検証によって、様々な日本の数多くのアニメなども学習データになっていることはほとんど間違いないと考えられています。ただし一切情報を出していないことで、Novel AIが発表されたときとは異なり、既存のイラストレーターコミュニティからの強い反発はまだ起きていません。

　そのため、今後のサービスでは、何から学習したのかを明らかにしないというのが普通になると考えられます。

#nijijourney は美麗絵超絶神絵、鉛筆落書きや線画のような画像も出力できますが、"本当にアニメをキャプチャしたような絵"も出せます。大丈夫なんか……。 AI　無編集 pic.twitter.com/VugXLZvenO
— 852話 (@8co28) November 25, 2022

従業員1〜2人のゲーム会社が爆発的に増える？

　そうした中、ベンチャーキャピタルのアンドリーセン・ホロウィッツが11月17日に「ゲームにおけるジェネレーティブAI革命」というレポートを出しました。

https://a16z.com/2022/11/17/the-generative-ai-revolution-in-games/

　レポートによれば、2010年前後から膨大な量のAI関連論文が提出されていて、もっとも影響する範囲が大きいのはリアルタイムで複雑なデータを処理する必要があるゲーム分野だとしています。

　たとえばオープンワールド型の「レッド・デッド・リデンプション 2」の開発には巨大な世界を作り込むために、5億ドル規模の膨大な開発費がかかっていましたが、マイクロソフトの「フライトシミュレーター」は、衛星写真をもとに地形をAIで自動生成しているため、開発費を面積に対しておさえることができているとされています。

　レポートでは画像生成AIはあくまでも前ぶれにすぎず、3Dアートワーク、テクスチャ、オーディオ、アニメーションなどすべてに影響が出る可能性があるとしています。

　それによって何が起きるかといえば、従業員が1〜2人規模のマイクロゲームスタジオが大量にあらわれ、市場にリリースされるゲームがさらに増えていくと予測しています。ただし去年だけでもSteamには1万本のゲームがリリースされているため、その中で目立つのはさらに難しくなりそうだとも指摘しています。

アンドリーセン・ホロウィッツが公開した生成AIが与えるインパクトが大きい分野を分析したチャート。縦軸が複雑性で、横軸がリアルタイム性。どちらも兼ね備えるゲームに最も影響が大きいと分析している

　画像生成AIは、2022年に一般に普及する段階に入ったITテクノロジーとしては、最大のインパクトを持ったものではないだろうかと考えています。今はまだ2Dの領域にとどまっていますが、実際にゲーム用のアセットに応用したりする事例も登場しつつあり、メタバースの領域にも広がっていくことは間違いないでしょう。まだまだ変化は序の口に過ぎず、この激震は来年も続いていくのだろうと考えています。

筆者紹介：新清士（しんきよし）

1970年生まれ。「バーチャルマーケット（Vket）」で知られる株式会社HIKKY所属。デジタルハリウッド大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRゲーム開発会社のよむネコ（現Thirdverse）を設立。VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。著書に8月に出た『メタバースビジネス覇権戦争』（NHK出版新書）がある。

津波情報気象庁発表

地震情報

画像生成AIの激変は序の口に過ぎない

Novel AIソースコード流出事件

AIイラスト投稿サイトの勃興

学習データは明らかにされない方向に

従業員1〜2人のゲーム会社が爆発的に増える？

筆者紹介：新清士（しんきよし）

この記事に関連するニュース

トピックスRSS

ランキング

★ 注目の特集

ITトピックス ITトピックスFeed