1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

画像生成AIで年賀状 リアルな人物も簡単に

ASCII.jp / 2025年1月1日 7時0分

グーグルの画像生成AIサービス「ImageFX」で作成。「女性と蛇」のテーマでは拒絶されることが多かったので「ぬいぐるみの蛇」として指定してみた。圧倒的な説得力のある画像が出ている 筆者生成

 あけましておめでとうございます。

 編集部から、お正月の挨拶をかねて、画像生成AIで手軽に年賀状を作るとしたらどれぐらいのことができるのか、というのを紹介してほしいというお題をいただいたので、各種画像生成AIで年賀状を作ってみます。画像生成AIが商用サービスとして登場した2022年7月と比べて、様々なサービスやツールが各社から登場しており、またその描画能力も飛躍的に向上しています。それらを使うことで、思ったような画像を使った年賀状を手軽に作れるようになっています。

※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください

グーグル「ImageFX」は簡単でリアル ただし「女性と蛇」は拒絶傾向

 最も手軽で誰にでも作れるツールとしては、グーグルの「ImageFX」が挙げられます。無料で使えて、簡単なプロンプトで、かなりリアルで品質の高い画像を作ってくれます。8月にリリースされた「Imagen3」が内部モデルとして動作しています。テキストの出力も指定すると、それも理解して作成してくれます。

 ただ、今年の干支である蛇と女性を組み合わせた画像を作ろうとしたら、ポリシー違反として生成が拒絶されることが何度もありました。通る条件もあったりするようなので、プロンプトには工夫が必要です。構図などは完全にランダムでコントロールが難しいのですが、出てくる画像の水準が高いので、これで十分ではという気分になります。

ImageFXの年賀状。「Year」がダブっていますが、これぐらいのミスは普通です。PhotoshopのAI機能の「削除ツール」を使うときれいに消せる
プロンプトは、日本語で作成し、翻訳AI「DeepL」を使って翻訳している。「テキスト『Happy New Year!』を背景に、笑顔で赤い和服を着た可愛らしい日本人女性、全身ショット、映画のようなショット、写実的なショット」

AIツール「Copainter」でラフから生成

 次は、ちょっとだけ手を掛けてみて、ラディウスファイブのAIツール「Copainter」を使ってみます。2024年12月に、ラフ画像からきれいな線画を生成してくれる「線画」機能が追加されました。無料のお試しでも登録時に10回、月に3回ほど使うことができるのでお手軽に試せます。

 まず、お絵かきソフトでラフ画像を3分ほどで作ります。それにプロンプトを添えて「線画」で線画を作成します。それなりに女性の着物や蛇が認識されたようなので、次の段階の「下塗り」を同じプロンプトで実施します。イメージ通りだった場合には、その2枚を指定する「着彩」をすると、その2枚が結合されて画像として完成します。

「Copainter」で作成した年賀状。テキストは別の画像編集ソフトで入れる必要がある
線画段階。筆者のラフ画像(左)から、うまく線を生成してくれている
下塗り段階。線画からプロンプトに応じて色を生成している

定番「Midjourney」はオリジナルキャラクターで年賀状ができる

 次は、クラウド画像生成AIサービスの「Midjounery」です。せっかくなので、本連載の作例モデルキャラクターである「明日来子さん」の画像を使って、着物姿に蛇を一緒におめでたい雰囲気の画像を作りました。

 一応、「Happy New Year!」のプロンプトも入れてみたのですが、左下に小さく追加されるだけでした。昨年1月の記事に使った、明日来子さんの画像をクリエティブリファレンスとして指定し、強度0(--cw 0)にします。こうすることで、顔だけを参照して、似たような顔にしてくれます。完全に一致はしないので、何枚も出して良さそうなのを選びます。なお、生成にあたっては最新バージョンのVer 6.1ではなく、Ver 6を使っています。このバージョンの方が似た顔が出やすいためです。

明日来子さんの年賀状画像
Midjouneryのツール画面。プロンプトは同じように、DeepLで作成した。プロンプト画面の小さなところに、クリエティブリファレンス用の元画像が表示されている。胴体が少し大きすぎたので、Editor機能のinpaintを使ってバリエーションを生成し、その中で少し細身になったのを選んでいる
10月に追加された「Edit」モードを使うことで、画面の一部にテキストを追加したりすることもできる。ただ、何度も生成したのだが思うようないい感じのテキストが生成されなかったので、ボツに

ローカル環境で人気の「Flux.1」はWebUI Forgeで簡単に

 続いては、最先端のローカルPCでも使える環境として人気を得ている「Flux.1 Dev」です。生成環境は、ローカルPC向け画像生成AI環境としては定番の1つ「Web UI Forge(フォージ)」を使っています。利用しているチェックポイントは、Forge用に調整が入っている「flux1-dev-bnb-nf4-v2.safetensors」です。プロンプトは同じようなものですが、昨年作成した明日来子さんLoraを使っています(参考:画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に)。色味が若干暗めに出るのが、Flux.1の特徴なのですが、もっと調整すると雰囲気は変わってきます。

Flux.1 Devの明日来子さんとの年賀状画像。Flux.1は複数枚試すと、着物の理解が若干甘い印象がある
WebUI Forgeの生成画面。プロンプト自体は複雑ではない。最後の部分で、筆者が作成した「明日来子さんLoRA」の指定をしている
アニメ風チェックポイント「lyhAnimeFlux_v4Niji.safetensors」の明日来子さん年賀状

「お年賀動画」も生成してみた Soraは苦戦

 さらに、作成した画像を元に動画生成AIでお年賀動画を作ってみました。

 ImageFXの画像を使い、OpenAIの「Sora」のi2v(Image-to-Video)で、お辞儀をする動画を作成してみました。10回あまり生成した中、最も意図通りだったのがこの動画です。まず10秒で作成して、「Re-cut」モードを利用して、20秒に延長生成をしています。お辞儀では、手を揃えてほしかったのですが、結局は成功できませんでした。細かいところをどのように制御するのかが、今年の課題になることが予見できます。

 続いて、「Runway Gen3 Turbo」の3枚の画像を指定できるキーフレーム機能を使い、Midjouneryで作成した画像3枚をもとに、10秒の動画を2種類作成しました。動画編集ソフトでつなげることで20秒の動画にしています。Runwayは指定できる画像があれば、補完してつなぐことが得意なので、きれいにつながっています。

2025年はAI動画や3Dなど関連分野に注目

 画像生成AI業界では今回紹介していないサービスがいくつも登場しており、また表現能力も飛躍的に上昇しています。基本的な表現能力は行くところまで行っており、今後はさらに人間の指示に応じて、どこまで制御できるのかが問われる段階が続いています。さらには、動画や3Dなどの関連する分野での競争に切り替わっていくでしょう。2025年にどこまで発展が進むのかも、しっかりと追っていきたいと思います。

 どうか皆様にとって、素晴らしい年となりますように。

 今年もよろしくお願いします。

 

筆者紹介:新清士(しんきよし)

1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください