Inflection AI、インテル(R) Gaudi(R) AI アクセラレーターとインテル(R) Tiber(TM) AI クラウドを採用した企業向けAIシステムを発表
PR TIMES / 2024年10月9日 17時45分
2024年10月7日に米国で発表された資料の抄訳です。
Inflection AIとインテルは本日、企業や開発者向けにAI(人工知能)の導入とその効果を増進させるための協業を発表しました。Inflection AIは、インテル(R) Gaudi(R) AI アクセラレーターとインテル(R) Tiber(TM) AI クラウド(AI Cloud)を採用した、業界初のエンタープライズ向けAIシステムとなるInflection for Enterpriseの提供を開始します。同システムは共感的で対話的、従業員に優しいAI機能を提供すると同時に、複雑で大規模な導入に必要な制御能力、カスタマイズ性、拡張性を提供します。このシステムは現在、AI Cloudを通じて提供開始されていますが、2025年第1四半期にはインテル(R) Gaudi(R)3 AI アクセラレーターを搭載した業界初のAIアプライアンスとして、顧客向けに出荷開始を予定しています。
「インテルは、Inflection AIとの戦略的なコラボレーションを通じて、迅速に高い成果をもたらすAIソリューションの新しい基準を確立しています。オープンソースのモデルやツールをサポートし、優れたワットあたりの性能(ワット/パフォーマンス)を提供するインテル(R) Gaudi(R) 3ソリューションは、あらゆる規模の企業が生成AIを手軽に、コスト効率高く、効率的に導入できるようにします」-- インテル コーポレーション 主席副社長 兼 データセンター&AI事業本部 本部長 ジャスティン・ホタード(Justin Hotard)
注目される理由:通常、AIシステムの構築には、広範なモデル開発と学習、そしてエンジニアやデータサイエンティスト、アプリケーション開発者間の協力など、かなりのインフラが必要です。企業顧客は今日、Inflection 3.0に基づいて構築されたInflection for Enterpriseが有する包括的なAIソリューションを活用し、各社独自の企業データやポリシー、企業文化に特化した学習による仮想AI協働者を得て、従業員の能力を強化できます。インテルとのパートナーシップに基づき、効率的で高い効果、さらに業界をリードする価格性能比を提供するインテル(R) Gaudi(R) 3 AIアクセラレーターを活用し、比類のないパフォーマンスを実現します。インテルのテクノロジーは、高い効果をもたらす柔軟性と拡張性を有しています。加えて、AI クラウドは統一された環境でのAIアプリケーションの構築、テスト、デプロイを合理化し、市場投入までの時間を短縮します。インテルとInflection AIはこのサービスがもたらす価値と利点を考慮し、インテルがInflection for Enterpriseの初期顧客となることを視野にインテル社内でのデプロイに協力しています。
Inflection AI COO(最高業務責任者)テッド・シェルトン(Ted Shelton)は「私たちが会話する機会のあるCEOやCTOの全員が、市場の既存のAIツールが真に企業が求める高い信頼性を兼ね備えたエンタープライズ・グレードではない点にフラストレーションを感じています。企業や組織は、既製の汎用AIよりも優れたAIを求めていますが、自社でモデルをファインチューニングできる専門知識を持ち合わせていません。私たちはこれらの問題を解決するAIシステムを提供できることを誇りに思います。そして、私たちのシステムは、インテル(R) Gaudi(R)上での動作で得られるパフォーマンスの向上により、あらゆる企業のニーズにも対応できる拡張性を有しています」と述べています。
利用法:Inflection AIは、モデルを各組織に則したものになるようにファインチューニングを行い、ユーザー間での採用を加速し、企業のトーンや目的、そして独自の製品、サービス、運用情報との整合性を通じてユースケースの有用性を向上させます。Inflection 3.0は、従業員に優しい生成AI体験を通じて、企業顧客により迅速な価値実現を可能にすると同時に、価格、パフォーマンス、そしてセキュリティー/コンプライアンスの面で優位性を提供します。
- 生成AIの障壁を撤廃 - AIクラウド上に構築された「Inflection for Enterprise」は、企業がハードウェアのテストやモデル構築を行うことなく、整備投資を抑えながら迅速に拡張できるように設計されたアプリケーションテンプレートを提供します。2025年第1四半期には、顧客は完全なターンキー型AIアプライアンスとして「Inflection for Enterprise」を購入するオプションも利用可能になります。このアプライアンスではインテル(R) Gaudi(R)3 AI アクセラレーターを搭載し、現在の競合製品と比較して、価格性能が最大2倍向上し、さらに128GBの高帯域幅メモリー容量の活用により、生成AIの性能をさらに最適化できます。
- 価格/性能の最適化 - Inflection AIの消費者向けアプリケーションPiはこれまでNVIDIAのGPUで動作していましたが、Inflection 3.0ではインテル(R) Gaudi(R)3 AI アクセラレーターを採用し、オンプレミスまたはクラウド上のAI Cloudにより運用されます。これにより、デプロイまでの時間が短縮されるだけでなく、総所有コスト(TCO)も削減されます。
- 企業向けに最適化 - Inflection AIのチャット型AIツールのPiによる微調整および人間のフィードバックによる強化学習(RLHF)の専門知識を活用し、Inflection for Enterpriseのモデルはそれぞれの企業の理念や運営方法に合わせた独自の仕様となります。企業の歴史や方針、コンテンツ、トーン、製品、運営情報に基づくデータやインサイトを基にモデル化され、Inflection AIは組織全体の生産性向上と一貫性の推進に貢献します。
- 所有権とセキュリティーの強化 - Inflection for Enterpriseは、企業が自社のインテリジェンスを完全に所有できるようにします。微調整されたモデルは顧客専用のものであり、外部の組織と共有されることは一切ありません。さらに、顧客はモデルをオンプレミス、クラウド、またはハイブリッドのいずれかの選択したアーキテクチャ上でホストし、実行できます。
今後の展開:今後、Inflection AIとインテルは、開発者がInflection for Enterprise向けの企業アプリケーションを構築できるようにします。これは、堅牢で人間中心のInflection 3.0システムを活用して、重要なソフトウェアツールを生成するためのものです。Inflection for Enterpriseの詳細やデモ・サインアップは、Inflection AIのウェブサイト( https://inflection.ai/intel )をご覧ください。
Source: Intel measured results vs H100 data sources: https://github.com/NVIDIA/TensorRT-LLM/blob/main/docs/source/performance/perf-overview.md input-output
Sequences: 128-2048tps on 2 accelerators/GPUs. Intel results obtained on September 9th 2024.
Hardware: Two Intel Gaudi 3 AI Accelerators (128 GB HBM) vs two Nvidia H100 GPU (80 GB HBM).
Software: Intel Gaudi software release 1.18.0.
See Nvidia link for H100 software details.
Results may vary.
Pricing estimates based on publicly available information and Intel internal analysis
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
エクセルソフト、インテルGaudi AIアクセラレーターのトレーニング開催
週刊BCN+ / 2024年10月22日 16時31分
-
エクセルソフトは、10月24日 (木) にインテル(R) Tiber(TM) AI クラウド上でインテル(R) Gaudi(R) AI アクセラレーターを用いたディープラーニング/LLM トレーニングを開催
PR TIMES / 2024年10月17日 11時15分
-
スーパーマイクロ、エッジで最適化と柔軟性を提供するAI向けの新しい汎用システム設計を導入
共同通信PRワイヤー / 2024年10月10日 9時50分
-
インテルがP-core搭載「Xeon 6」と「Gaudi 3」を正式発表 - AI開発効率化に貢献へ
マイナビニュース / 2024年10月2日 6時59分
-
「Intel Gaudi 3」が正式発表、実機を見てきた。PCIeカード版も投入して小規模利用にもアピール
マイナビニュース / 2024年10月1日 13時11分
ランキング
-
1船井電機「給料払えません。即時解雇です」 社員が気づけなかった「3つ」の危険信号
ITmedia ビジネスオンライン / 2024年10月30日 7時10分
-
2【速報】NHK子会社で社員が経費200万円以上を私的に不正利用、掃除機など購入 7年間で70件繰り返す
TBS NEWS DIG Powered by JNN / 2024年10月30日 15時55分
-
3なぜ今「昭和の町中華」が若者に人気なのか…「ミシュラン掲載ラーメン店」増加のウラで起きている意外な動き
プレジデントオンライン / 2024年10月30日 8時15分
-
4「サブウェイ」なぜワタミに?利点3つ考えてみた 「オーダーが難しい」問題は改善できるのか
東洋経済オンライン / 2024年10月30日 14時0分
-
5最低賃金1500円へ協議開始 政府経済対策、慎重論にも配慮
共同通信 / 2024年10月30日 19時49分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください