サイバーエージェント、大規模“視覚”言語モデル(VLM)を公開‐日本語に対応
マイナビニュース / 2024年6月13日 14時0分
サイバーエージェントは6月13日、同社独自の大規模視覚言語モデル(VLM:Vision Language Model)を公開した。このVMLのパラメータ数は75億で、ベースモデルの一部を米Hugging Faceが運営するWebサイト「Hugging Face Hub」に公開したという。
公開されたモデルは同社独自の日本語大規模言語モデル(LLM)で合成されたデータセットをメインに学習したもので、商用利用可能なオープンソースソフトウェアで提供される。ユーザーは同モデルのチューニングを行うことにより、画像を加味した対話AI(人工知能)などの開発もできる。
近年、米OpenAIが開発した「GPT-4o」を始めとした画像も扱えるLLMが急速な進化を遂げている一方で、既存の公開されているVLMのほとんどは英語を中心に学習されており、日本文化の理解や日本語での会話に強いVLMは少ない状況だという。
日本語VLMの開発に取り組んでいるサイバーエージェントは、同モデルを一般公開することで、より多くの人に日本語の視覚言語モデルに関する最先端の研究開発に取り組んでもらいたい考えだ。
(早川竜太)
外部リンク
この記事に関連するニュース
-
国産LLM初、AIエージェントとして使える「KARAKURI LM 8x7B Instruct v0.1」を一般公開
PR TIMES / 2024年6月20日 11時15分
-
【Gaudiシリーズを解説】生成AIに対し、広がる選択肢―Fugaku-LLMも快適に動作
マイナビニュース / 2024年6月18日 11時0分
-
Weights & BiasesがVision-Languageモデル評価のためのHeron VLMリーダーボードを公開
PR TIMES / 2024年6月13日 13時45分
-
チューリング、Vision & Languageモデル評価のための「Heron VLMリーダーボード」に技術提供
PR TIMES / 2024年6月13日 13時45分
-
リコー、インストラクションチューニング済みの130億パラメータLLMを開発
マイナビニュース / 2024年6月3日 12時46分
ランキング
-
1「GTO」出演後、消息をたった“幻の男”が登場 菊池風磨&小芝風花が再会し「変わってない!」と喜び
ねとらぼ / 2024年6月24日 20時8分
-
2ランサムウェア渦中の「ニコニコ」に学ぶ“適切な広報対応”の重要性
ITmedia エンタープライズ / 2024年6月25日 7時15分
-
3「まるでガラケー」折りたたみ式のスマホを支える「有機EL」の特徴 大画面のメリット探る
よろず~ニュース / 2024年6月25日 11時0分
-
4iPhoneのSuicaが改札で反応しない原因は? 対処法も解説
ITmedia Mobile / 2024年6月25日 6時5分
-
5「ニコニコチャンネル+」28日にサービス再開へ ログイン方式は変更に
ITmedia NEWS / 2024年6月25日 15時52分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください