低コスト開発で米AI株に衝撃を与えたDeepSeek、DALL-E3超えのマルチモーダルAI公開
マイナビニュース / 2025年1月28日 9時23分
推論型大規模言語モデル「DeepSeek-R1」で注目を集める中国のAI企業DeepSeekが、「Janus-Pro」をリリースした。「画像と言語の理解」から「画像やテキストの生成」までを1つのフレームワークで実現するマルチモーダルAIモデルである。同社によると、Janus-Proは従来の統合型マルチモーダルモデルよりも優れた性能を示し、タスクごとに特化したモデルと同等またはそれ以上の成果を上げている。「Janus-Proのシンプルさ、高い柔軟性、有効性は、次世代の統一マルチモーダルモデルの有力な候補となる」と主張している。
Janus-Proは、テキストや画像など複数のモダリティ(マルチモーダル)を統合的に理解し、さらに生成も可能な新しいオートリグレッシブ(自己回帰型)フレームワークである。これまでのマルチモーダルモデルでは、「理解タスク」と「生成タスク」の両方で同じ視覚エンコーダを用いると、性能や設計に制約が生じることがあった。
Janus-Pro では、視覚エンコーディング部分を分離してマルチモーダル理解と生成のそれぞれに最適化された形で画像を処理し、モデル本体のトランスフォーマーには単一の統合アーキテクチャを採用している。これにより、理解タスクと生成タスクを同時にこなす際のトレードオフを緩和しながら、フレームワーク全体の拡張性や柔軟性を高めている。ベースとなる大規模言語モデル(LLM)は DeepSeek-LLM-1.5b-baseおよびDeepSeek-LLM-7b-base。画像の理解にはSigLIP-Lが用いられており、384x384ピクセルサイズまで対応可能である。
こうした構造により、「テキスト-画像」生成を初期バージョンの「Janus」と比較した場合、短いプロンプトからより高品質な出力を得られ、簡単な文字要素の生成も安定した。
DeepSeekによれば、テキストから画像への生成モデルを評価するベンチマーク「GenEval」や「DPG-Bench」で、Janus-Pro-7BはDALL-E3、PixArt-alpha、Emu3-Gen、Stable Diffusion 3 Mediumなどのモデルを上回るスコアを示したという。
DeepSeekが1月20日にリリースした「DeepSeek-R1」は、OpenAIの推論型LLM「o1」に匹敵する性能を数学、コーディング、推論タスクで達成しており、24日にR1を用いたDeepThink機能を追加した「DeepSeek」アプリのアップデートが公開されると、同アプリはAppleのApp Storeで「ChatGPT」を抑えて1位を獲得した。
DeepSeekは、DeepSeek-R1をNVIDIAの旧式のAIチップを用いて560万ドルで開発したと主張している。最先端AIの開発コストは高騰し続けており、例えばOpenAIは「GPT-4」の訓練費用に1億ドル以上を投じたとされる。DeepSeekの主張が事実であれば、高コストのAIモデルに投資が集中していたこれまでの常識が覆される可能性がある。実際、DeepSeek-R1が登場したことで、1月27日の米株式市場でAI関連株は総じて大幅安となった。とりわけNVIDIAへの影響は大きく、NVIDIA株の終値は前日比17%安の118.42ドルだった。
(Yoichi Yamashita)
外部リンク
この記事に関連するニュース
-
中華製AI「DeepSeek」はNVIDIAを駆逐するか 無料で性能はChatGPTにほぼ引けを取らない
東洋経済オンライン / 2025年1月28日 22時10分
-
中国が開発した「DeepSeek」、一体どこがすごいのか―独メディア
Record China / 2025年1月28日 18時0分
-
DeepSeek、推論型LLM「R1」オープンソースで公開、OpenAI o1に匹敵、手頃なAPI料金
マイナビニュース / 2025年1月21日 8時31分
-
NVIDIA が RTX AI PC 向け AI 基盤モデルを発表
PR TIMES / 2025年1月7日 15時45分
-
ヘッドウォータース、Microsoft AzureのNTT版LLM「tsuzumi」を活用したAIエージェントソリューションの提供開始
PR TIMES / 2025年1月6日 17時45分
ランキング
-
1「RTX 5080/5090」店頭販売の中止が相次ぐ パソコン工房の混乱が原因か
ITmedia NEWS / 2025年1月30日 21時45分
-
2Mリーグレポーターの伊藤友里、騒動後初の生放送を欠席へ 岡田紗佳から失言受けていた
ねとらぼ / 2025年1月31日 1時41分
-
3データ探しにAI活用、クラウドの使い勝手も取り込んだ新世代のNAS「UGREEN NASync」
ITmedia NEWS / 2025年1月30日 8時20分
-
4「108円でいいんですか?!」 シャトレーゼの「コスパ最強パンケーキ」が人気過ぎて品薄に 「おいしすぎる」
ねとらぼ / 2025年1月30日 7時30分
-
5成人向けゲームについてクレカに続いて銀行も表現規制か?日本の銀行が外国からの送金や口座開設を拒否
Game*Spark / 2025年1月30日 0時2分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください