グーグル、高クオリティかつ高速なテキスト画像生成モデル「Muse」を発表
ASCII.jp / 2023年1月5日 15時0分
グーグルは1月2日、従来のモデルよりも大幅に効率的でありながら、最先端の画像生成性能をもつテキスト画像AI生成モデル「Muse」を発表した。
![](https://ascii.jp/img/2023/01/05/3473294/x/2c2c73c1967f2b3f.png)
競合モデルと同クオリティかつ超高速化
近年「Stable Diffusion」やOpenAIの「DALL-E 2」など、テキストから画像を生成するAIは驚くべき進化を見せている。グーグルもすでに「Imagen」と「Parti」という画像生成AIを発表しているが、「Muse」はそのどれとも異なる新しいモデルだ。
![](https://ascii.jp/img/2023/01/05/3473362/x/620e848cf805aba4.png)
実際、1画像(512×512)あたりの生成時間はMuseが1.3秒となり、Stable Diffusion 1.4の3.7秒を明らかに上回っている。
![](https://ascii.jp/img/2023/01/05/3473292/x/6e6db0f90f65b3e8.png)
高速化の理由としては、ImagenやDALL-E 2などの拡散(diffusion)モデルと違い、量子化された画像トークン(学習用画像のセット)を使用することでサンプリングの反復回数を減らしていることと、Partiなどの自己回帰(autoregressive)モデルにはない並列デコードで効率を高めているためとしている。
テキストだけで複数の物体をコントロール
![](https://ascii.jp/img/2023/01/05/3473290/x/12e0f645ee6375fc.png)
また、1から画像を生成するのではなく、あらかじめ用意した画像を編集することもできる。上記作例では「皿に置かれたケーキとカップに入ったカフェオレ」の写真を元画像として用意し、そこに「花のラテアートが描かれたカフェラテの隣にあるクロワッサン(A croissant next to a latte with a flower latte art.)」というテキストを入力することで、皿やカップはそのままにクロワッサンと花のラテアートの部分だけが編集されている。
マスクを使えば修正も書き足しも自由自在
さらに画像中の一部の要素だけを指定する「マスク」機能を使えば、マスク内だけを修正(Inpainting)したり、逆にマスク内はそのままに外側だけを書き足す(Outpainting)ことができる。
![](https://ascii.jp/img/2023/01/05/3473291/x/ec9fef5d6f99dfce.png)
修正の例。上記の画像ではマットで指定された部分のお城がカットされ、代わりにテキストで指定された熱気球(Hot air balloons)が現れた。
![](https://ascii.jp/img/2023/01/05/3473366/x/708f9434766186d9.png)
書き足しの例。上記の画像ではマットで指定された建物はそのままに、周囲の背景がテキスト(Beautiful fall foliage)の指定通りに変更された。
今年は画像AIの実装が続くか?
現状グーグルはAIのデータセットにバイアスがかかる危険があるとして、一部(Imagenのみ米国限定でベータ版が利用可能)をのぞいて画像生成AIを公開していない。
![](https://ascii.jp/img/2023/01/05/3473394/x/6e68e115d0743d7b.png)
一方、OpenAIに10億ドル出資しているマイクロソフトは、昨年10月に検索エンジン「Bing」に画像生成AI、DALL−E2を「Image Creator」としてすでに実装(日本では利用不可)しており、一部報道では「ChatGPT」を使った検索の強化も予定されているという。
もちろんAppleやAmazonといったライバル達もAI関連技術への莫大な投資を続けている。去年大きな注目を浴びた画像生成AI技術だが、このぶんだと今年はさらなる革命的な進化と実際のサービスへの実装例を多く見ることができそうだ。
この記事に関連するニュース
-
生成AI「リートン」、6月28日に「Stable Diffusion 3」をweb・iOS版アプリ両方でリリース
PR TIMES / 2024年6月28日 16時45分
-
Microsoftが「Recall」機能に関する追加情報を公開 プライバシーに配慮/iOS版「フォートナイト」が2025年後半に復活
ITmedia PC USER / 2024年6月16日 6時5分
-
「Stable Diffusion 3」が一般公開。20億パラメータの“Medium”版、NVIDIA向けに最適化したバージョンも
マイナビニュース / 2024年6月13日 18時43分
-
弁護士さんに相談したい!勉強したい方へ!【画像生成AIの社会と倫理】「画像生成AI Stable Diffusion スタートガイド」公式ワークショップ開催。AI時代のインターン募集も。
PR TIMES / 2024年6月13日 18時15分
-
AIによる画像生成がさらにリアルに、美しく。ファッション業界向け生成AIツール「MaisonAI」がアップデート
PR TIMES / 2024年6月12日 17時45分
ランキング
-
1老後の趣味で気軽に“塗り絵”を始めて1年後…… めきめき上達した70代女性の美麗な水彩画に「本当にすごい…」「感動です」
ねとらぼ / 2024年6月29日 22時0分
-
2「ロンハー」有吉弘行のヤジに指摘の声「酷かった」「凄く悲しい言葉」 42歳タレントが涙浮かべる
ねとらぼ / 2024年7月2日 15時31分
-
3シャオミ、ペンを発売 「書き心地は良いが、タブレットとペアリングはできません」と公式
ITmedia NEWS / 2024年7月3日 8時30分
-
4坂本龍馬はそんなこと言わない! 居酒屋で発見された“ウソすぎる名言”が話題「おもろすぎる」「せめて土佐弁で」
ねとらぼ / 2024年7月2日 20時30分
-
5マイナポータルで障害、一部機能が利用しづらくなった
ASCII.jp / 2024年7月2日 16時35分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)