NTT Com、分散データセンターにIOWN APNを用いて生成AI学習の実証に成功
マイナビニュース / 2024年10月7日 16時47分
オープンモデルのLLM(Large Language Models:大規模言語モデル)である「Llama 2 7B」を用いて事前学習を行い、処理完了までの所要時間を計算したところ、単一データセンター内での学習の所要時間に対して分散データセンターとAPNの組み合わせでは約1.006倍の処理時間だったという。ほぼ互角であることが明らかになった。なお、従来のインターネット回線を模した環境では28.579倍の時間を要したとのことだ。
次に、遠隔地に置いたストレージにアクセスする実証実験では、GPUサーバからストレージサーバへのNFS(Network File System)アクセスの性能をGPU Direct Storageベンチマークツールであるgdsioにより測定した。その結果、単一データセンターの結果に対し分散データセンターとAPNの組み合わせでは約1.1倍の結果となった。従来のインターネットを模した場合は約2613倍だ。
上記の通り、今回の実証によってGPU-GPU間、およびGPU-ストレージ間のどちらのユースケースにおいても、分散データセンターとIOWN APNの組み合わせによる有用性が確認された。特に、小規模な生成AIモデルの事前学習や追加学習などの比較的軽量な処理においては、分散データセンターであっても単一データセンターと同程度の性能を発揮できることが確認された。
張氏は「今後はより大規模なクラスタへの適用などGPU over APNの実証環境を順次拡大するとともに、GPU利用者と提供者のニーズの具体的な汲み取りなどに着手する。また、実証で得られたノウハウを商用サービスに反映し複合的ソリューションとしての事業化も目指す。実証に興味のあるパートナー企業がいれば共創し共に発展させたい」と今後の展望を述べていた。
(熊谷知泰)
-
- 1
- 2
外部リンク
この記事に関連するニュース
-
NTT Com、IOWN APNを活用した分散データセンターでの生成AI学習実証実験に世界で初めて成功
@Press / 2024年10月7日 11時0分
-
レノボ、迅速でシンプルなAI導入を加速するTruScale GPU-as-a-ServiceとAI駆動の管理システムを発表
PR TIMES / 2024年10月4日 23時40分
-
GMOインターネットグループ、「NVIDIA H200 GPU」搭載環境の性能を実証
PR TIMES / 2024年9月26日 19時45分
-
オラクル、業界初となるゼタスケールのクラウド・コンピューティング・クラスタを発表
PR TIMES / 2024年9月13日 19時15分
-
NTT Comの大阪第7データセンターが「NVIDIA DGX-Ready Data Center」プログラムに認定
@Press / 2024年9月12日 11時0分
ランキング
-
1Google、Kasperskyのウイルス対策製品をGoogle Playから削除
マイナビニュース / 2024年10月7日 15時5分
-
2Copilotをスマホから使う方法 「Microsoft Copilot」と「Microsoft Edge」はどっちが良い?
ITmedia PC USER / 2024年10月7日 13時40分
-
3Windows 11 Ver.24H2が登場 Copilot+ PCとそうでないPCで実質Windowsが2つに分かれる
ASCII.jp / 2024年10月6日 10時0分
-
4Xiaomi Japanが10月10日に新製品発表 スマホの予告画像に「LEICA」のロゴ、14Tシリーズか
ITmedia Mobile / 2024年10月7日 17時31分
-
5Windows 11 version 24H2に複数の不具合、提供を一時停止
マイナビニュース / 2024年10月7日 9時22分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください