NTT Com、IOWN APNを活用した分散データセンターでの生成AI学習実証実験に世界で初めて成功
@Press / 2024年10月7日 11時0分
ドコモグループの法人事業ブランド「ドコモビジネス」を展開するNTTコミュニケーションズ株式会社(以下 NTT Com)は、超高速かつ超低消費電力を実現するIOWN構想※1の主要技術であるオールフォトニクス・ネットワーク(以下 APN)で接続した複数のデータセンターにNVIDIA GPU搭載サーバーを分散配置した環境で、NVIDIA AI Enterprise プラットフォームの一部であるNVIDIA NeMo(TM)※2を用いた生成AIモデル学習の実証実験(以下 本実証)に世界で初めて成功しました。
1.背景
生成AI、データ利活用、画像処理などの分野でGPUクラスタの重要性が高まる中、サービス提供事業者や利用者にとって従来は単一のデータセンター内でGPUクラスタを構築・利用することが一般的でした。しかし、単一のデータセンターでは、生成AIのモデルサイズ増大に伴う処理量の変動に応じてオンデマンドにGPUリソースを入手できないことや、1拠点のデータセンターのキャパシティや電力供給に制限があること、利用者の拠点から移動できない機密度の高いデータの取り扱いが難しいことが課題でした。
本実証により、IOWN APNを用いた分散データセンターにおける、GPUクラスタでの処理の有効性を確認することで、GPUクラスタ利用者や提供事業者の課題解決に貢献します。
2.本実証の概要
NVIDIA GPU搭載サーバーを約40km離れた三鷹と秋葉原のデータセンターに分散配置し、データセンター間を100Gbps回線のIOWN APNで接続しました。NVIDIA NeMo(TM)を使用して、両拠点のGPUサーバーを連携させ、生成AIモデルの分散学習を実施しました。なお、本実証はデル・テクノロジーズ株式会社によるGPUサーバーやストレージなどの機器提供および協力のもとで実施しました。
本実証で用いた技術の主な特長は以下の通りです。
(1) IOWN APN
IOWN APNの高速大容量・低遅延接続により、GPUサーバー間のデータ転送が迅速かつ効率的に行われ、小規模なAIモデルの事前学習や追加学習などの比較的軽量な処理に対して、単一のデータセンターと遜色ない性能を発揮できます。これによって、複数のデータセンター環境で柔軟にGPUクラスタを構築し、効率的なリソース利用を実現することが可能です。
(2) NVIDIA NeMo(TM)
分散学習に対応した大規模言語モデルの学習、カスタマイズ、展開のためのエンド ツー エンド プラットフォームであるNVIDIA NeMo(TM)を活用しました。今回の実証で扱ったLlama 2 7B※3以外のモデルなど、将来的にさまざまな生成AIの処理に対応可能です。
画像1: https://www.atpress.ne.jp/releases/412670/img_412670_1.png
<実証のイメージ>
3.本実証の成果
本実証は世界で初めて、高速大容量・低遅延な接続を可能とするIOWN APNとNVIDIA NeMo(TM)を組み合わせた環境で、生成AIのモデル学習(Llama 2 7Bの事前学習※4)を動作させることに成功しました。
単一のデータセンターで学習させる場合の所要時間と比較して、インターネット経由の分散データセンターでは29倍の時間がかかるが、IOWN APN経由の分散データセンターでは1.006倍と、単一のデータセンターとほぼ同等の性能を発揮できることを確認しました。
4.今後の展開
本実証の成果をもとに、IOWN APNで接続された分散データセンターにおけるGPUクラスタの可能性をさらに広げ、国内70拠点以上のデータセンター間などを接続可能な「APN専用線プラン powered by IOWN」や、液冷方式サーバーに対応した超省エネ型データセンターサービス「Green Nexcenter(R)」、などを組み合せたGPUクラウドソリューションとしてお客さまへ提供をめざします。
5. docomo business Forum'24 出展情報
2024年10月10日(木)~11日(金)に開催する「docomo business Forum'24」にて、本実証を展示予定です。公式Webサイトの展示情報よりご確認ください。
公式Webサイト:https://www.ntt.com/business/go-event.html?ir=nr
■展示名:その瞬間を感じるIOWNの世界
■展示番号:IV-01
*会場:ザ・プリンス パークタワー東京 B2フロア
https://www.ntt.com/business/go-event/access.html
*日時:2024年10月10日(木)~11日(金) 9:30~17:30
*参加方法:公式Webサイトより事前に来場お申し込みをお願いします
*参加費用:無料
画像2: https://www.atpress.ne.jp/releases/412670/img_412670_2.png
※1:IOWN (Innovative Optical and Wireless Network)構想とは、NTTが提唱する次世代情報通信基盤です。
https://group.ntt/jp/group/iown/ 「IOWN(R)」は、日本電信電話株式会社の商標又は登録商標です。
※2:NVIDIA NeMo(TM)とは、生成AIモデルを構築・カスタマイズ・デプロイするための開発プラットフォームです。https://docs.nvidia.com/nemo-framework/index.html
※3:Llama 2 7Bとは、Meta社が公開している大規模言語モデル(LLM)の1つで、パラメータ数が70億のものです。
※4:事前学習(Pre-training)とは、大規模なデータセットを使用してモデルに基本的な知識を習得させるプロセスのことです。
【関連リンク】
2024年2月29日:「APN専用線プラン powered by IOWN」の提供を開始
https://www.ntt.com/about-us/press-releases/news/article/2024/0229.html
2023年10月4日:液冷方式サーバー機器に対応した超省エネ型データセンターサービス「Green Nexcenter(TM)」の展開を開始
https://www.ntt.com/about-us/press-releases/news/article/2023/1004_2.html
2024年9月12日:NTT Comの大阪第7データセンターが「NVIDIA DGX-Ready Data Center」プログラムに認定
https://www.ntt.com/about-us/press-releases/news/article/2024/0912.html
詳細はこちら
プレスリリース提供元:@Press
【関連画像】
この記事に関連するニュース
-
NTT Com、分散データセンターにIOWN APNを用いて生成AI学習の実証に成功
マイナビニュース / 2024年10月7日 16時47分
-
GMOインターネットグループ、「NVIDIA H200 GPU」搭載環境の性能を実証
PR TIMES / 2024年9月26日 19時45分
-
米Magic、1億トークンモデルの研究開発でAIコードツール市場に存在感示す|元Google CEOら出資
Techable / 2024年9月18日 8時0分
-
オラクル、業界初となるゼタスケールのクラウド・コンピューティング・クラスタを発表
PR TIMES / 2024年9月13日 19時15分
-
NTT Comの大阪第7データセンターが「NVIDIA DGX-Ready Data Center」プログラムに認定
@Press / 2024年9月12日 11時0分
ランキング
-
1消費者とオンラインで開発の日本酒 ラベルも一般公募 酔鯨酒造
食品新聞 / 2024年10月7日 13時25分
-
2川崎重工、「相次ぐ不正」で業界3位に凋落の危機 防衛の裏金問題と舶用エンジン不正に社長陳謝
東洋経済オンライン / 2024年10月7日 9時0分
-
3「晴海フラッグの過剰供給でタワマン暴落」は大ウソだった…日本の専門家が「肝心な時に間違える」本当の理由
プレジデントオンライン / 2024年10月7日 7時15分
-
4恐ろしい…軽快なBGMのもと繰り返される「家電量販店の最安値宣言」に込められた、本当の意味【経済評論家が解説】
THE GOLD ONLINE(ゴールドオンライン) / 2024年10月6日 9時15分
-
5爆笑しながらスキンヘッドに注射…美容外科大手・TCB「医師の悪ふざけ動画」が流出! 看護師「ヤバいなと思った」《不適切動画入手》
文春オンライン / 2024年10月6日 17時0分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください