リコー、日英中3言語に対応した700億パラメータの大規模言語モデル(LLM)を開発、お客様のプライベートLLM構築支援を強化
Digital PR Platform / 2024年8月21日 10時2分
【評価結果(ELYZA-tasks-100)】
複雑な指示・タスクを含む代表的な日本語のベンチマーク「ELYZA-tasks-100」において、リコーのLLMは平均で4を超える高いスコアを示しました。また、比較した他のLLMはタスクによって英語で回答するケースが見られましたが、リコーのLLMは全てのタスクに対して日本語で回答して高い安定性を示しました。さらに、回答速度の面でも他のLLMを大きく上回り、トークナイザーの改良の効果を確認しました。
[画像1]https://digitalpr.jp/simg/2160/93585/650_167_2024082021320666c48cc65d77c.jpg
ベンチマークツール(ELYZA-tasks-100)における他モデルとの比較結果*3(リコーは最下段)
【リコーのLLM開発の背景】
労働人口減少や高齢化を背景に、AIを活用した生産性向上や付加価値の高い働き方が企業成長の課題となっており、その課題解決の手段として、多くの企業がAIの業務活用に注目しています。しかし、AIを実際の業務に適用するためには、企業固有の用語や言い回しなどを含む大量のテキストデータをLLMに学習させ、その企業独自のAIモデル(プライベートLLM)を作成する必要があります。
リコーは国内でもトップクラスのLLMの開発・学習技術をベースに、企業向けプライベートLLMの提供や、社内文書の活用を後押しするRAGの導入支援等、様々なAIソリューションの提案が可能です。
製造業や金融業などセキュリティ要件の高い業界では、オンプレサーバに導入可能な省リソースでありながら、700億パラメータの規模で、対応言語は日英中を選択可能なプライベートLLMに対する強い要望がありました。こうした要望を踏まえ、リコーが開発した高性能なLLMに企業独自の情報や知識を取り入れることで、お客様ごとの業種・業務に合わせた高精度なAIモデル(プライベートLLM)を、低コスト・短期間で容易に構築することが可能です。
リコーは、お客様に寄り添い、業種業務に合わせて利用できる AI サービスの提供により、お客様が取り組むオフィス/現場のデジタルトランスフォーメーション(DX)を支援してまいります。
*1 Large Language Model (大規模言語モデル)。人間が話したり書いたりする言葉(自然言語)に存在する曖昧性やゆらぎを、文章の中で離れた単語間の関係までを把握し「文脈」を考慮した処理を可能にしているのが特徴。「自然文の質問への回答」や「文書の要約」といった処理を人間並みの精度で実行でき、学習も容易にできる技術。
*2 このたびリコーが開発したLLMは、米Meta Platforms社が提供する「Meta-Llama-3-70B」の日本語性能を向上させた「Llama-3-Swallow-70B」をベースモデルに採用し、日本語と英語、中国語のオープンコーパス(自然言語の文章や使い方を大規模に収集し、一般公開されているデータセット)を追加学習させて開発したものです。
*3 2024年8月9日時点の評価結果。「Meta-Llama-3-70B」と公開されているその日本語継続事前学習モデルを比較対象として選定。参考として「GPT-4」の「スコア」も併記。「スコア」の算出に際して、生成文の評価には「GPT-4」 (gpt-4-0613) を使用し、英語での回答による減点は行っていない。「総回答時間」はNVIDIA DGX H100においてGPUを2枚用いて計測。「英語で回答されたタスクの割合」は100タスクのうち英語で回答されたものの割合。但し、「Meta-Llama-3-70B-Instruct」は回答の大部分が英語または英語交じりの日本語だったため概算値。
*4 LLMはテキストデータを「トークン」と呼ばれる単位で処理します。トークンとは、単語、文字セット、または単語と句読点の組み合わせです。
この記事に関連するニュース
-
リコーが700憶パラメータのLLMを発表、日・英・中の3言語に対応
マイナビニュース / 2024年8月21日 14時4分
-
タイ語・中国語・英語対応の大規模言語モデル「DTLM」登場|MMLUで従来のタイ語LLMより高評価
Techable / 2024年7月30日 12時0分
-
Llama 3の日本語継続事前学習モデル「Llama 3 Youko」シリーズを公開
PR TIMES / 2024年7月26日 16時40分
-
爆速の生成AIを手軽に体験、SambaNovaが無料で使えるFast APIの提供を開始
マイナビニュース / 2024年7月25日 6時56分
-
Meta、無料で商用可の「Llama 3.1」リリース 「世界最大かつ最も高性能なオープンモデル」
ITmedia NEWS / 2024年7月24日 7時6分
ランキング
-
1東武日光線「板倉東洋大前から栃木」に何がある? 小さな駅でも構内が広い「北関東」らしい風景
東洋経済オンライン / 2024年8月21日 7時30分
-
2羽田空港の「衝突事故」をなぜ防げなかったのか…「人間ではなくAIに任せればいい」への元管制官の回答
プレジデントオンライン / 2024年8月21日 8時15分
-
3セブン&アイのカナダコンビニ大手による買収実現は難しいとの見方広がる…株価急落
読売新聞 / 2024年8月20日 22時18分
-
4お米がありません!75歳のおひとり様女性、8月15日に「年金15万円」が振り込まれたはずが…残金2,000円の地獄「どう生きていけばいいのか」
THE GOLD ONLINE(ゴールドオンライン) / 2024年8月21日 6時15分
-
5単なる「ラーメン店主のワガママ」ではない…炎上覚悟で飲食店が「イヤホン・スマホ禁止」にする本当の理由
プレジデントオンライン / 2024年8月21日 10時15分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください