Apple、iPhoneでも稼働するオープンな言語モデル「OpenELM」を公開
ITmedia NEWS / 2024年4月25日 10時54分
Hugging FaceのOpenELM(30億パラメータ)のページ
米Appleの研究者らは4月24日(現地時間)、オープンソースの言語モデル「OpenELM」(ELMはEfficient Language Model、効率的な言語モデルの略)をHugging Faceで公開した。
パラメータ数の異なる4つのモデルがある。小さいものから、2億7000万、4億5000万、11億、30億(パラメータとは、意思決定でモデルがトレーニングデータセットから理解する変数の数を示す)。
AppleがAIのモデルを公開することはこれまでほとんどなかったが、OpenELMの「広範なリリースは、オープンな研究コミュニティを支援し、発展させることが目的」という。
Appleは、OpenELMとともに、開発者がモデルをソフトウェアに組み込めるように設計された複数のツールもオープンソース化した。その中にはiPhoneやMac上でモデルを実行できるようにするライブラリも含まれる。
「公開データセットで学習されたモデルは安全性の保証なしでリリースされる」ため、利用する開発者は自分で「十分なセーフティテストを実施し、適切なフィルタリング機構を実装することが不可欠」だとしている。
AppleはOpenELMを、約1兆8000億のトークンで構成されるデータセットでトレーニングしたとしている。データセットとしては、GitHubのRedPajamaデータセット、大量の書籍、Wikipedia、StackExchangeの投稿、ArXiv上の論文、Reddit、Wikibooks、Project GutenbergなどのDolmaセットを使った。
OpenELMは、レイヤーごとのスケーリング戦略を用いて、Transformerモデルの各レイヤー内でパラメータをefficient(効率的)に割り当てることで精度を向上させているという。例えば10億パラメータでは、Allen Institute for AIのOLMoと比較して半分の事前学習トークン数で2.36%の精度向上を示すとしている。
米Microsoftも前日、iPhoneで稼働可能なSLM「Phi-3」を公開している。
外部リンク
この記事に関連するニュース
-
Spiral.AI、Transformerの限界を克服した次世代LLMアーキテクチャ「RetNet」の学習済みモデルを公開
PR TIMES / 2024年5月1日 15時15分
-
オルツ、数兆パラメータ規模の大規模言語モデル構築に着手
PR TIMES / 2024年4月26日 17時15分
-
オルツ、数兆パラメータ規模の大規模言語モデル構築に着手
共同通信PRワイヤー / 2024年4月26日 15時0分
-
Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に
ITmedia NEWS / 2024年4月19日 9時31分
-
Meta、次世代オープンLLM「Llama 3」公開、対話AI「Meta AI」のWebサイト開設
マイナビニュース / 2024年4月19日 7時51分
ランキング
-
1「そっち使うの?!」「これは天才」 さびだらけの鉄くぎをぐつぐつ煮込むと……? DIYに役立つ“まさかの使い道”が200万再生
ねとらぼ / 2024年5月2日 12時15分
-
2Xの生成AI「Grok」で話題を要約、「Stories on X」提供開始
マイナビニュース / 2024年5月4日 9時45分
-
3『ポケモンGO』普段、日本じゃゲットできないポケモンに会える!48時間の“激レア色違い”が熱い「ライバルイベント」ポイントまとめ
インサイド / 2024年5月4日 0時0分
-
4「PSVR2」を自腹で買って1年2ヶ月……プレイ感や不満、足りない点を忖度抜きで語る! 現状を変える“2つのポイント”にも注目
インサイド / 2024年5月4日 12時0分
-
5『ディアブロ IV』5月15日開幕のシーズン4「武装再錬」を紹介する映像公開―アイテムに史上最大の変更が加わる
Game*Spark / 2024年5月4日 17時30分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください