1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

NTT Com、分散データセンターにIOWN APNを用いて生成AI学習の実証に成功

マイナビニュース / 2024年10月7日 16時47分

オープンモデルのLLM(Large Language Models:大規模言語モデル)である「Llama 2 7B」を用いて事前学習を行い、処理完了までの所要時間を計算したところ、単一データセンター内での学習の所要時間に対して分散データセンターとAPNの組み合わせでは約1.006倍の処理時間だったという。ほぼ互角であることが明らかになった。なお、従来のインターネット回線を模した環境では28.579倍の時間を要したとのことだ。

次に、遠隔地に置いたストレージにアクセスする実証実験では、GPUサーバからストレージサーバへのNFS(Network File System)アクセスの性能をGPU Direct Storageベンチマークツールであるgdsioにより測定した。その結果、単一データセンターの結果に対し分散データセンターとAPNの組み合わせでは約1.1倍の結果となった。従来のインターネットを模した場合は約2613倍だ。

上記の通り、今回の実証によってGPU-GPU間、およびGPU-ストレージ間のどちらのユースケースにおいても、分散データセンターとIOWN APNの組み合わせによる有用性が確認された。特に、小規模な生成AIモデルの事前学習や追加学習などの比較的軽量な処理においては、分散データセンターであっても単一データセンターと同程度の性能を発揮できることが確認された。

張氏は「今後はより大規模なクラスタへの適用などGPU over APNの実証環境を順次拡大するとともに、GPU利用者と提供者のニーズの具体的な汲み取りなどに着手する。また、実証で得られたノウハウを商用サービスに反映し複合的ソリューションとしての事業化も目指す。実証に興味のあるパートナー企業がいれば共創し共に発展させたい」と今後の展望を述べていた。
(熊谷知泰)



この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください