ELYZA、日本語LLMとしての性能向上を図った「Llama-3-ELYZA-JP-120B」発表
マイナビニュース / 2024年9月19日 16時40分
ELYZAは9月19日、日本の生成AIの開発強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」に採択され、計算資源などの支援を受けながら基盤モデルの研究開発進め、新たな日本語LLM(Large Language Models:大規模言語モデル)「Llama-3-ELYZA-JP-120B」を構築したことを発表した。この成果は「GENIAC成果報告会」にて公表したという。
同社はモデルの構築にあたり、日本語LLMの性能向上に向けた新たな試みとして、モデルの基礎能力向上と日本特有の知識・表現の性能向上を実施。モデルの基礎能力向上では、従来から取り組んでいたオープンモデルをベースにした継続学習によるモデル開発手法に、「Depth Up-Scaling」というモデルサイズ拡張アプローチを組み合わせた。これにより、パラメータ数の増強による性能向上を図った。
日本特有の知識・表現の性能向上では、日本での社会実装を見据えて、日本特有の知識(法令、行政手続きなど)に関する特化学習による性能向上を試みた。その応答性能を測るためのベンチマークを新たに作成して評価した結果、「GPT-4(0613)」を超えるスコアを獲得たとのことだ。
なお、今回の研究開発における技術的な工夫や得られた知見のより詳細な情報については後日技術ブログなどを通じて公開予定だとしている。
(熊谷知泰)
外部リンク
この記事に関連するニュース
-
Axcxept社、EZO×Qwen2.5シリーズでGPT-4-Turboを凌ぐ日本語LLM/自動CoT・RAGを採用
PR TIMES / 2024年9月24日 15時45分
-
ELYZA、経済産業省およびNEDOが推進する「GENIAC」の支援の元、新たな日本語LLMを開発、成果を公開
PR TIMES / 2024年9月20日 17時40分
-
Axcxept株式会社、東日本旅客鉄道株式会社様からクラウドファンディングでプレミアムサポートを獲得し、革新的AIモデル開発を加速
PR TIMES / 2024年9月11日 15時15分
-
チューリング、日本初の自動運転向けVLA(Vision-Language-Action)モデルデータセット「CoVLA Dataset」を発表、WACV2025に論文が採択
PR TIMES / 2024年9月10日 11時15分
-
第19回YANSシンポジウムにて大規模言語モデル活用を加速する2つの成果を発表、一部成果のモデルを公開
PR TIMES / 2024年9月8日 2時40分
ランキング
-
1バトルもアツい新作『英雄伝説 界の軌跡』を試遊!「日本ファルコム」ブースは巨大「みっしぃ」やノベルティなどが魅力【TGS2024】
インサイド / 2024年9月26日 20時20分
-
2「どういうお笑い?」 ヨシモト∞ホールが誤表示を謝罪 “斜め上をいくエラー”に「声出たwww」「どうしてこうなった」
ねとらぼ / 2024年9月26日 17時44分
-
3『モンハンワイルズ』に「イャンクック」が登場決定!「クック先生」の愛称で親しまれる人気モンスターが久しぶりの復活
インサイド / 2024年9月26日 23時35分
-
4「変わってなかったらロボット」 元“ギャルのカリスマ”安西ひろこ、容姿巡る「たたき」にピシャリ “45歳の近影”が奇跡そのものだった「本当の美人」
ねとらぼ / 2024年9月25日 20時15分
-
5【徹底検証】本当に使えるChrome拡張機能はどれ? 第1回 「Google翻訳」vs「DeepL翻訳」精度を比べてみた
マイナビニュース / 2024年9月26日 9時0分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください