Google Cloud、第6世代のTPU「Trillium」発表 - 前世代から性能が4.7倍に
マイナビニュース / 2024年5月17日 14時41分
米Google Cloudは5月15日、第6世代のGoogle Cloud TPU(Tensor Processing Unit)「Trillium」を発表した。
○「Trillium」の概要
Trillium TPUは、前世代の「TPU v5e」と比較してチップあたりのピークコンピューティングパフォーマンスが4.7倍、高帯域幅メモリ(HBM)の容量と帯域幅が2倍、チップ間相互接続(ICI)の帯域幅もTPU v5eの2倍となっている。Trillium TPU のエネルギー効率はTPU v5eと比べて67%以上向上しているという。
また、度なランキングやレコメンデーションのワークロードでよくある大規模なエンベディングを処理するための、特別なアクセラレータである第3世代の「SparseCore」を搭載。これにより、基盤モデルを素早くトレーニングし、レイテンシと費用を低く抑えてモデルをサービングすることを可能としている。
さらに、高帯域幅かつ低レイテンシの単一のPod内で256TPUまでスケールアップでき、マルチスライステクノロジーと、Titanium Intelligence Processing Unit(IPU)により、数百Podにスケーリングできるという。その際、マルチペタビット/秒のデータセンターネットワークで相互接続された、建物規模のスーパーコンピュータの数万に及ぶチップを接続する。
JAX、PyTorch/XLA、Keras 3などのオープンソースをサポートするため、前世代のTPU向けに書かれた宣言型モデルの説明が、Trillium TPUの新しいハードウェアとネットワークの機能に直接対応できる。また、Optimum-TPUに関してHugging Faceと提携し、モデルのトレーニングとサービングを効率化している。
(岩井 健太)
外部リンク
この記事に関連するニュース
-
NEDO事業でルネサスが高効率で低コストのミリ波トランシーバー技術を開発
PR TIMES / 2024年5月30日 16時45分
-
EdgeCortix、エッジにおける次世代の生成系AIを促進するSAKURA-II プラットフォームを発表
PR TIMES / 2024年5月22日 10時45分
-
Google、第6世代Cloud TPU「Trillium」発表 - TPU v5e比でピーク4.7倍の性能強化
マイナビニュース / 2024年5月16日 14時9分
-
グーグル、AIデータセンター向け新型半導体発表 処理性能4.7倍に
ロイター / 2024年5月15日 10時18分
-
AIの可能性を再定義するHBM、その構造を理解する
マイナビニュース / 2024年5月10日 7時20分
ランキング
-
1iPhoneへの「マイナンバーカード」にまつわる誤解を解く プラスチックカードより安全だが課題もある
ITmedia PC USER / 2024年5月31日 18時0分
-
2DMMからビットコイン482億円分が不正流出
ITmedia NEWS / 2024年5月31日 22時35分
-
3「僕らが何を言われてもいい」仮面ライダー俳優、余命1カ月の少年の下に訪れる ディケイド俳優も「君の世界に通りすがりに行きます」
ねとらぼ / 2024年5月31日 14時13分
-
4Xで収益得るユーザーに本人確認求める通知 身分証の写真や“自撮り”提出が必要に
ITmedia NEWS / 2024年6月1日 6時30分
-
5ゾウガメVS猫⁉ 好奇心を抑えられない猫ちゃんが、達人の間合いでジリジリと亀に忍び寄る
ニコニコニュース / 2024年6月1日 11時30分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください