日本語精度が高い130億パラメータの大規模言語モデル(LLM)を開発
Digital PR Platform / 2024年1月31日 13時30分
![日本語精度が高い130億パラメータの大規模言語モデル(LLM)を開発](https://media.image.infoseek.co.jp/isnews/photos/digitalprplatform/digitalprplatform_82560_0-small.png)
~ お客様の業種・業務に合わせたカスタムLLMを2024年春から提供開始 ~
株式会社リコー(社長執行役員:大山 晃)は、日本企業の業務での活用を目的に、企業ごとのカスタマイズを容易に行える130億パラメータの大規模言語モデル*1(LLM)を開発しました。日本語と英語での学習において、その学習データの比率を工夫することで、日本語としての文法や回答が正確で日本語精度の高い、日本企業が持つ情報資産の活用に適したモデルを実現しました。ベンチマークツールを用いた性能検証*2の結果、日本語で利用できる130億パラメータを持つ日本語LLMにおいて、2024年1月4日現在で最も優れた結果を確認しました。
労働人口減少や高齢化を背景に、AIを活用した生産性向上や付加価値の高い働き方が企業成長の課題となっており、その課題解決の手段として、多くの企業がAIの業務活用に注目しています。しかし、AIを実際の業務に適用するためには、企業固有の用語や言い回しなどを含む大量のテキストデータをLLMに学習させ、その企業独自のAIモデル(カスタムLLM)を作成する必要があります。このたびリコーが開発したLLMは、米Meta Platforms社が提供する「LLM Llama2-13B」をベースに、日本語と英語のオープンコーパス*3を追加学習させて開発したものです。①学習に利用するコーパスの選定 ②誤記や重複の修正などのデータクレンジング ③学習データの順序や割合を最適化するカリキュラム学習 など、リコー独自の学習上の工夫が組み込まれていることが特徴です。学習の結果、特にNLI(自然言語推論能力)において高性能となっています。日本語LLMの性能評価で広く使われている日本語ベンチマークツール(llm-jp-eval)を用いた他LLMモデルとの性能比較*2では、評価スコアの平均値が最も高く、優れた性能を確認することができました。
[画像1]https://user.pr-automation.jp/simg/2160/82560/600_193_2024013107424265b97b62e4963.png
日本語ベンチマークツール(llm-jp-eval)における他モデルとの比較結果*2(リコーは最下段)
学習能力が高い本LLMに企業独自の情報や知識を取り入れることで、お客様ごとの業種・業務に合わせた高精度なAIモデル(カスタムLLM)を、短期間で容易に構築することが可能になります。カスタムLLMをお客様の業務で活用し、業務文書の要約や質問応答の作業をAIに置き換えることで、業務のワークフローを最適化し、業務効率化を実現します。
2024年春から、カスタムLLMをクラウド環境でお客様へ提供開始します。まずは日本国内のお客様より提供を開始し、今後海外のお客様への提供も目指します。
この記事に関連するニュース
-
パナソニックHDとストックマーク、国内最大規模(1000億パラメータ)の独自日本語LLM「Panasonic-LLM-100b」開発で協業
PR TIMES / 2024年7月2日 12時45分
-
パナソニックHD、国内最大級の日本語LLMを開発‐パラメータ数は1000億
マイナビニュース / 2024年7月2日 12時15分
-
はたらく人に寄り添うAIソリューション「RICOH デジタルバディ」「RICOH Chatbot Service デジタルバディ」の提供を開始
Digital PR Platform / 2024年6月28日 13時0分
-
Google、オープンLLM「Gemma 2」公開、2倍以上のサイズのモデルに匹敵する効率性
マイナビニュース / 2024年6月28日 9時22分
-
ELYZA、「GPT-4」を上回る性能の日本語LLMを開発・公開
PR TIMES / 2024年6月26日 16時45分
ランキング
-
1マクドナルドが「ストローなしで飲めるフタ」試行 紙ストローの行方は...?広報「未定でございます」
J-CASTニュース / 2024年7月17日 12時55分
-
2セルフレジで客が減る? 欧米で「セルフレジ撤去」の動き、日本はどう捉えるべきか
ITmedia ビジネスオンライン / 2024年7月18日 8時10分
-
3「レイバン」メーカー、人気ブランド「シュプリーム」を15億ドルで買収
ロイター / 2024年7月18日 8時34分
-
4永谷園、MBO成立=今秋にも上場廃止
時事通信 / 2024年7月17日 20時36分
-
5申請を忘れると年金200万円の損…荻原博子「もらえるものはとことんもらう」ための賢者の知恵
プレジデントオンライン / 2024年7月17日 8時15分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください
![](/pc/img/mission/mission_close_icon.png)