AIプロセッサー「GAUDI 2」と「GRECO」が年内に登場予定 インテルCPUロードマップ
ASCII.jp / 2022年9月26日 12時0分
今月、インテルはイスラエルでIntel Tech Tour.ilと題したTech Dayを開催した。なぜイスラエルか? というと、実は間もなく詳細が公開されるRaptor Lakeの設計と製造はイスラエルが主導しており、それもあってキーパーソンインタビューやDeep Diveなども開催されたのだが、このあたりの詳細はまた回を改めてお届けする。
イスラエルと言えば、インテルが買収したMobileyeやHabana Labsなども全部イスラエルの企業であり、それもあって今回のTech DayではHabana Labsによる製品アップデートも説明があった。
Habana Labsの話は連載575回で紹介したが、この時はGAUDIとGOYAという、同社にとって第1世代の製品の説明に留まった。ただ同社(というのか、同部門というのか)はこれに続いて第2世代製品をすでに出荷しているので、このあたりを中心に説明したい。
クライアント向けにVPUを導入
Habana Labsの話を中心に、と書きながら最初はクライアント側の話である。インテルはIce Lake世代でGNAと呼ばれるAIアクセラレーターを導入したが、これは連載665回で説明したように、非常に限られた用途向けのもので、汎用というには性能的に不十分なものだった。その一方で、クライアントではさまざまなところでAIを利用しよう、という機運が急速に高まりつつあるとする。
![](https://ascii.jp/img/2022/09/24/3424199/x/f8b13470ea0339a1.jpg)
これに向けて、インテルとしてもクライアント向けに本腰を入れてAIを実装していこう、としている。具体的には、クライアントにもVPUを標準で導入する、というのが今回の大きな発表である。
![](https://ascii.jp/img/2022/09/24/3424200/x/901fafa27cbbd9a8.jpg)
VPUはVision Processing Unitの略で、インテルが買収したMovidiusのMyriadシリーズのアクセラレーターに採用されている名称だが、これを全面的にクライアントに導入することを正式に発表した。
![](https://ascii.jp/img/2022/09/24/3424201/x/c905de5c8bf4391b.jpg)
まずRaptor Lake世代が最初の導入プラットフォームになる。そしてMeteor LakeではこれがCPU側に統合されることが明確にされた。
![](https://ascii.jp/img/2022/09/24/3424180/x/1b4bf61d23793211.jpg)
もともと今年2月に開催されたInvestor Meetingの際に、Raptor Lakeには“AI M.2 Module”なるものが追加されると明らかにされていた。
連載657回でも「現時点で一番可能性が高いのはこのMyriad X VPUベースということになる」と書いたが、上の画像でMicrosoft(おそらくWindows MLのVPU対応をするのだろう)のほかにDell/HP/Lenovo/Acerのロゴがあるのは、この4社から投入されるRaptor Lakeベースのクライアント機には、Myriad X VPUを搭載したM.2 Moduleが搭載されると考えていいだろう。
実際にさまざまなアプリケーションがVPU対応になるのはまだまだ先のことであろうが、AMDもZen 5世代でXNAという名称で旧XilinxのAI Engineを搭載することを発表しており、クライアントにAIアクセラレーターが標準搭載される日が近づいたことになる。もっともスマートフォン向けのSoCではもうNPU(Neural Processing Unit)を標準搭載するのが当たり前の昨今からすると、むしろ動きが遅いともいえるが。
GAUDI 2は管理維持の経費削減に効果大
今年5月に行なわれたIntel Vision 2022で、インテルはGAUDI 2を初公開した。といっても詳細はあまり明らかになっておらず、唯一示されたのはNVIDIAのA100と比較して約2倍のスループットを実現できるということだけだった。
![](https://ascii.jp/img/2022/09/24/3424181/x/4170e34d07d6707c.jpg)
![](https://ascii.jp/img/2022/09/24/3424182/x/348a7e928d734c6d.jpg)
A100の2倍というのは新製品としては全然十分ではない(H100の3分の2の性能ということになる)わけだが、ここでHabana Labsはおもしろい見解を出してきた。
昨今のデータセンターでは、ディープラーニングに要するコストがどんどん上がっているとする。理由はより複雑なモデルと繰り返し回数の増加、アプリケーション利用の広がりなどだ。
![](https://ascii.jp/img/2022/09/24/3424183/x/e3faeb02d490393f.jpg)
ところが、GAUDI 2はディープラーニングに要するコストの削減に大きな効果がある、というのがHabana Labsの主張である。要するに絶対性能だけでなく、TCOの削減に効果が大きいとしたわけだ。
![](https://ascii.jp/img/2022/09/24/3424184/x/367cf230494fd930.jpg)
GAUDI 2そのものはプロセスの微細化と処理エンジン強化(3倍)、メモリーの容量増加と高速化、ネットワーク強化(100G×10→100G×24)と、猛烈に内部構造を強化したGAUDIといった形になっている。その内部構造が下の画像だ。
![](https://ascii.jp/img/2022/09/24/3424185/x/b1fbe788760e86a2.jpg)
TPC(Tensor Processing Cores)が3倍に増やされた以外に、新たにMME(Matrix Multiplication Engine)が2つ追加されている。またHEVC/H.264/VP9/JPEGなどのデコードが可能なMedia Engineも新たに追加された。
ちなみに図には出ていないが、初代GAUDIでは24MBの共有SRAMが搭載されており、これを利用して送受信やTPC間でのデータ共有などを行なっていたが、GAUDI 2ではこれも48MBに増やされている。
GAUDI2が他のAIアクセラレーターと異なることの1つは、マルチチップ構成でのインターコネクトである。制御そのものはホスト(Ice Lake-SPサーバーをここでは念頭に置いている)からPCIeレーンでつながるが、カード同士は100GbEで接続する、という独特の構成である。
![](https://ascii.jp/img/2022/09/24/3424186/x/6dd49ad090c2d3b4.jpg)
なにせ1つのGAUDIから24本の100GbEが取り出せるので、そのうち3本はネットワーク接続用に回すとして、残り21本は丸々余っている。これを300GbE×7構成にして、GAUDI 2同士の相互接続に使う、という構成である。下手な独自インターコネクトを作るより、100GbEを流用した方が効率的と考えたのだろう。
さてGAUDI 2の性能であるが、これはIntel Innovationで示されたものと大差ない。
![](https://ascii.jp/img/2022/09/24/3424187/x/9381583e06c51923.jpg)
今回新たに示されたのはスケーラビリティーで、複数枚のカード(初代GAUDIを含む)を利用したケースで、枚数に応じてリニアに性能が増えるとしている。
![](https://ascii.jp/img/2022/09/24/3424188/x/8eab7843479a4e5c.jpg)
GAUDI 2は2022年第4四半期に出荷
出荷に関しては、オンプレミス向けにはSuper Microが8枚のGAUDI 2を搭載したシステムが今年第4四半期に出荷するとしている。このシステム(の下半分)は会場でも展示された。
![](https://ascii.jp/img/2022/09/24/3424189/x/1f6eaca7378acda0.jpg)
![](https://ascii.jp/img/2022/09/24/3424190/x/555daf4977fff85f.jpg)
![](https://ascii.jp/img/2022/09/24/3424191/x/438ac96fe6926ea8.jpg)
ところでHabana Labsの製品の場合、ソフトウェアはインテルのOneAPIやOpenVINOではなく、独自のSynapseAIを利用する。
![](https://ascii.jp/img/2022/09/24/3424192/x/944cfeaa49a4220a.jpg)
このSynapseAIを使う場合、例えばTensorFlowのモデルだったら冒頭に2行追加するだけでSynapseAIを利用してGAUDI 2を活用できるようになるという話であった。
![](https://ascii.jp/img/2022/09/24/3424193/x/a49f0e0291e75106.jpg)
第2世代GOYAはGRECOに名称変更
トレーニング/推論向けのGAUDIがGAUDI 2になったので、推論専用のGOYAはGOYA 2になったか? と思ったら、なぜかGRECOになった。
![](https://ascii.jp/img/2022/09/24/3424194/x/559bdf695d2ff4aa.jpg)
GRECOもGAUDI 2同様に7nmプロセスに移行、オンチップメモリーの増量やLPDDR5の搭載、INT 4のサポートなど、さまざまな機能強化が施されているが、最大の特徴は200W→75Wに減った消費電力である。
この結果として、2スロット/フルレングスだったGOYAのPCIeカードは、GRECOでは1スロット/ハーフレングスに小型化されている。
![](https://ascii.jp/img/2022/09/24/3424196/x/5ab75066372ecc72.jpg)
実際GOYAのカードの実物はかなりごっつく、強制空冷が必要な構成だったのに対し、GRECOはかなりシンプルな構造になっている。ちなみにGRECOは今年後半に発売予定となっている。
![](https://ascii.jp/img/2022/09/24/3424197/x/d0331cc322d93821.jpg)
![](https://ascii.jp/img/2022/09/24/3424198/x/6fac582676c219a6.jpg)
というわけで、2023年以降のインテルは、Intel ArcやCPU/VPUと、Habana LabsのGAUDI 2/GRECOの組み合わせでAIソリューションを提供していく、という方針が明確に示された説明会であった。
この記事に関連するニュース
-
Intel Tech Talkで見えたLunar Lakeにおける低消費電力と高性能の両立へのこだわり
マイナビニュース / 2024年6月27日 6時45分
-
【Gaudiシリーズを解説】生成AIに対し、広がる選択肢―Fugaku-LLMも快適に動作
マイナビニュース / 2024年6月18日 11時0分
-
Xeon 6にLunar Lake 全方位で競合をリードする、信用のブランドがIntelだ――基調講演でパット・ゲルシンガーCEOが語ったこと
ITmedia PC USER / 2024年6月5日 17時5分
-
インテル、Computex 2024でAI Everywhereのさらなる推進を発表
PR TIMES / 2024年6月4日 18時45分
-
Intelが「Lunar Lake」「Xeon 6」「Gaudi 3」をアンベール、AI Everywhereの要 - COMPUTEX TAIPEI 2024
マイナビニュース / 2024年6月4日 12時0分
ランキング
-
1Googleが連続スクロール廃止、2ページ目以降の検索結果が見られなくなる?
マイナビニュース / 2024年6月26日 19時15分
-
2BOSAI POINTサービス終了に伴い、nanacoポイントからのポイント交換サービスを終了
ポイ探ニュース / 2024年6月27日 8時43分
-
3ダイソー商品18種の材質表示にミス発覚…… 返金対応実施「深くお詫び」
ねとらぼ / 2024年6月27日 7時30分
-
4アニメ「しかのこ」公式X、架空新CMが人類には早すぎると話題に 「なんもわからん」「公式が狂っているアニメは神アニメ」
ねとらぼ / 2024年6月26日 19時15分
-
5「低価格・高リスク」の非純正バッテリーに消費者庁が注意喚起 過去10年で火災227件
ITmedia NEWS / 2024年6月27日 12時29分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)