サイバーエージェント、大規模“視覚”言語モデル(VLM)を公開‐日本語に対応
マイナビニュース / 2024年6月13日 14時0分
サイバーエージェントは6月13日、同社独自の大規模視覚言語モデル(VLM:Vision Language Model)を公開した。このVMLのパラメータ数は75億で、ベースモデルの一部を米Hugging Faceが運営するWebサイト「Hugging Face Hub」に公開したという。
公開されたモデルは同社独自の日本語大規模言語モデル(LLM)で合成されたデータセットをメインに学習したもので、商用利用可能なオープンソースソフトウェアで提供される。ユーザーは同モデルのチューニングを行うことにより、画像を加味した対話AI(人工知能)などの開発もできる。
近年、米OpenAIが開発した「GPT-4o」を始めとした画像も扱えるLLMが急速な進化を遂げている一方で、既存の公開されているVLMのほとんどは英語を中心に学習されており、日本文化の理解や日本語での会話に強いVLMは少ない状況だという。
日本語VLMの開発に取り組んでいるサイバーエージェントは、同モデルを一般公開することで、より多くの人に日本語の視覚言語モデルに関する最先端の研究開発に取り組んでもらいたい考えだ。
(早川竜太)
外部リンク
この記事に関連するニュース
-
パナソニックHD、国内最大級の日本語LLMを開発‐パラメータ数は1000億
マイナビニュース / 2024年7月2日 12時15分
-
マイクロソフトが示す“マルチモーダルAI”の可能性、「GPT-4o」が実現する未来の体験とは?
マイナビニュース / 2024年6月28日 10時0分
-
Google、オープンLLM「Gemma 2」公開、2倍以上のサイズのモデルに匹敵する効率性
マイナビニュース / 2024年6月28日 9時22分
-
サイバーエージェント、漫画やアニメをAIで翻訳‐海外展開を支援
マイナビニュース / 2024年6月26日 11時24分
-
Weights & BiasesがVision-Languageモデル評価のためのHeron VLMリーダーボードを公開
PR TIMES / 2024年6月13日 13時45分
ランキング
-
1老後の趣味で気軽に“塗り絵”を始めて1年後…… めきめき上達した70代女性の美麗な水彩画に「本当にすごい…」「感動です」
ねとらぼ / 2024年6月29日 22時0分
-
2藤本美貴&庄司智春、真っ昼間に変装ゼロで“腕絡め”デート 大勢の注目浴びるも“モザイク9割”の結果で「笑った」
ねとらぼ / 2024年7月2日 15時1分
-
3中小企業の社内Wi-Fi接続、約半数が「つながりにくさ」を実感‐対処法は?
マイナビニュース / 2024年7月3日 11時50分
-
4新紙幣「一万円札と千円札の1の字が違う」SNSに違和感覚えるという声も…… 「1」のデザインが違う理由は?
ねとらぼ / 2024年7月3日 18時15分
-
5シャオミ、ペンを発売 「書き心地は良いが、タブレットとペアリングはできません」と公式
ITmedia NEWS / 2024年7月3日 8時30分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください