Snowflake Cortex AI、Llama 3.1 405Bのホストを発表
マイナビニュース / 2024年8月5日 12時9分
米Snowflakeはこのほど、Metaが提供するオープンソースの多言語LLM(大規模言語モデル)「Llama 3.1コレクションをSnowflake Cortex AIにホスト予定と発表した。
○Snowflake Cortex AIとは
Snowflake Cortex AIは、LLMへのアクセスを提供し、AIを活用したアプリケーションを簡単に構築・展開することを実現するフルマネージド型のサービス。
ユーザーが自然言語を使用して構造化データを操作して、インサイトをセルフサービスで取得することを可能にする「Cortex Analyst」、サーバーレスのファインチューニングが行える「Cortex Search」といったコンポーネントの提供が予定されている。
○Llama 3.1 405Bを最適化
Snowflake AIリサーチチームは推論とファインチューニングの両方に対してLlama 3.1 405Bを最適化する。導入初日から12万8000トークンという膨大なコンテキストウィンドウをサポートしながら、既存のオープンソース型ソリューションよりも遅延を最大で3分の1削減し、スループットを1.4倍とするリアルタイム推論を実現するという。
さらに、単一のGPUノードを使うだけで大規模モデルをファインチューニング可能なため、Cortex AI内ですべてを処理できるようになり、コストの問題や開発者とユーザーが感じる複雑さを解消する。
()
外部リンク
この記事に関連するニュース
-
Snowflake Cortex AI、Metaとの協力により新たなフラッグシップモデルファミリーホスト・最適化
PR TIMES / 2024年8月2日 12時45分
-
NVIDIA AI Foundry が世界中の企業向けにカスタム Llama 3.1 生成 AI モデルを構築
PR TIMES / 2024年7月25日 10時45分
-
爆速の生成AIを手軽に体験、SambaNovaが無料で使えるFast APIの提供を開始
マイナビニュース / 2024年7月25日 6時56分
-
Llama 3.1発表、4050億パラメータの最先端モデル公開「オープンなAIを主流に」
マイナビニュース / 2024年7月24日 7時22分
-
「Phi-3」「Llama-3」「GPT-4o mini」などの小規模言語モデルを使用して生成AIの回答精度を向上させる「SLMファインチューニング」カスタムサービスを開始
PR TIMES / 2024年7月23日 18時15分
ランキング
-
1これは一体……? おつりでもらった“見たことのない500円玉”に「初めて見た!」「かっこええ」
ねとらぼ / 2024年8月5日 7時30分
-
2「Nintendo Switch サマーセール」が開催!『あつ森』『モンハンライズ』ら人気タイトルが最大75%オフ
インサイド / 2024年8月5日 0時0分
-
3330円で買えるダイソーの「人感センサーケーブル」はニッチだけどちょっと便利
ITmedia Mobile / 2024年8月4日 13時5分
-
4元祖携帯電話のモトローラ この夏に良コスパのスマホを多数リリースだが、筆者が買ったのはコレ
ASCII.jp / 2024年8月4日 12時0分
-
5「他の猫ちゃんはかわいいのにうちの子はどうして……」 あくびで化けるインパクト大のギャップが話題「完全に黙れ小僧ッ!!の顔w」
ねとらぼ / 2024年8月5日 10時0分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)