米Amazonのクラウド部門AWSは12月3日(現地時間)、ラスベガスで開催の年次イベント「AWS re:Invent」で、マルチモーダル生成AIモデル「Amazon Nova」ファミリーを発表した。AWSのAI開発プラットフォーム「Bedrock」で利用可能になる。
テキスト生成モデルにはMicro、Lite、Pro、Premierの4サイズあり、Premier以外は同日からAWSで提供を開始し、Premierは2025年初頭に提供開始予定だ。日本語を含む15言語をサポートする。
画像生成モデルの「Nova Canvas」、動画生成モデルの「Nova Reel」も同日AWSでリリースされた。リリース段階ではサポートするのは英語のみ。
テキスト生成モデルのMicroだけはマルチモーダルではない(テキストのみの入出力)が、レイテンシーが最も低い。米Googleの「Gemini 1.5 Flash」と米Metaの「Llama 5.1」とのベンチマーク比較では、言語理解や常識推論で競合を上回る結果になっている。
Lite以上はテキストの他、画像、動画もサポートし、上位ほど精度や速度、そして価格が高くなる。
アンディ・ジャシーCEOは「これらのモデルは、独自システムやAPIと連携するよう最適化されており、複雑な自動ステップの実行が非常に簡単だ」と語った。例えば、ヘルスケア企業であれば、医療用語や業界特有の情報を理解するようNovaを微調整できるという。
Nova Canvasは、画像の生成、背景変更やレイアウトなどの編集が行える。Nova Reelで生成できる動画は最長6秒。テキストや画像を入力することで動画を生成する。ズームやパン、360度回転などが可能だ。リリース段階では最長6秒だが、近日中に2分長の動画生成が可能なモデルを公開する予定としている。
以下の動画は、Nova Reelを使って制作した架空のパスタメーカーの広告動画だ。
AWSのYouTubeチャンネルでは、多数の生成例が公開されている。
AWSは、CanvasとReelにはウォーターマークやコンテンツモデレーションなど、「責任あるAIの使用を促進する」ためのコントロール機能があると説明する。Novaファミリーは「誤報、児童性的虐待資料、化学、生物、放射線、核のリスクの拡散に対抗するために安全対策を拡大している」という。