日本語精度が高い130億パラメータの大規模言語モデル(LLM)を開発
Digital PR Platform / 2024年1月31日 13時30分
LLMは、パラメータ数が多いほどより多くの情報を処理でき、学習能力が高まる一方、より大きな計算リソースが必要になるうえ、学習や運用の難易度が上がり、開発難易度が高くなります。本モデルは「AWS™ LLM開発支援プログラム」によるサポート提供のもと、AWS Trainiumアクセラレーターを搭載したAmazon Elastic Compute Cloud Trn1インスタンスを利用することで、従来手法の開発と比較し45%のコスト低減および12%の開発期間短縮を実現することができました。さらに、お客様向けカスタムLLMを開発する際にも、効率的に開発することができるため、お客様へより安価・短納期でのご提供が可能です。
なお、今回のLLM開発とその手法は2024年3月11日から開催される言語処理学会*4第30回年次大会において論文発表する予定です。
リコーは、お客様に寄り添い、業種業務に合わせて利用できる AI サービスの提供により、 お客様が取り組むオフィス/現場のデジタルトランスフォーメーション(DX)を支援してまいります。
*1 人間が話したり書いたりする言葉(自然言語)に存在する曖昧性やゆらぎを、文章の中で離れた単語間の関係までを把握し「文脈」を
考慮した処理を可能にしているのが特徴。「自然文の質問への回答」や「文書の要約」といった処理を人間並みの精度で実行でき、学習も
容易にできる技術。
*2 2024年1月4日時点の評価結果。公開されている日本語LLMのうち130億パラメータかつトークナイザを日本語適応している事前学習
モデルとの比較。
MC、NLI、QA、RC は、下記カテゴリー内の平均値。Avg.はその4カテゴリー平均値の平均値。
MC (Multi-Choice QA:多肢選択質問応答):jcommonsenseqa
NLI (Natural Language Inference:自然言語推論):jamp、janli、jnli、jsem、jsick
QA (Question Answering:質問応答):jemhopqa、niilc
RC (Reading Comprehension:読解):jsquad
*3 自然言語の文章や使い方を大規模に収集し、一般公開されているデータセット。
*4 自然言語処理(NLP)分野では最大の学会です。学会発表するNLP2024は、言語処理学会の年次大会です。
https://www.anlp.jp/
この記事に関連するニュース
-
パナソニックHDとストックマーク、国内最大規模(1000億パラメータ)の独自日本語LLM「Panasonic-LLM-100b」開発で協業
PR TIMES / 2024年7月2日 12時45分
-
パナソニックHD、国内最大級の日本語LLMを開発‐パラメータ数は1000億
マイナビニュース / 2024年7月2日 12時15分
-
はたらく人に寄り添うAIソリューション「RICOH デジタルバディ」「RICOH Chatbot Service デジタルバディ」の提供を開始
Digital PR Platform / 2024年6月28日 13時0分
-
Google、オープンLLM「Gemma 2」公開、2倍以上のサイズのモデルに匹敵する効率性
マイナビニュース / 2024年6月28日 9時22分
-
ELYZA、「GPT-4」を上回る性能の日本語LLMを開発・公開
PR TIMES / 2024年6月26日 16時45分
ランキング
-
1マクドナルドが「ストローなしで飲めるフタ」試行 紙ストローの行方は...?広報「未定でございます」
J-CASTニュース / 2024年7月17日 12時55分
-
2永谷園、MBO成立=今秋にも上場廃止
時事通信 / 2024年7月17日 20時36分
-
3申請を忘れると年金200万円の損…荻原博子「もらえるものはとことんもらう」ための賢者の知恵
プレジデントオンライン / 2024年7月17日 8時15分
-
4「7%だったら仕方ない」牛丼チェーン松屋が“深夜料金”を本格的に導入 人件費を価格に転嫁【Nスタ解説】
TBS NEWS DIG Powered by JNN / 2024年7月17日 20時37分
-
5「再配達は有料に」 ドライバーの本音は
ITmedia ビジネスオンライン / 2024年7月17日 6時40分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください
![](/pc/img/mission/mission_close_icon.png)