1. トップ
  2. 新着ニュース
  3. 経済
  4. プレスリリース

連合学習において一部のクライアントに異常や悪意がある場合にも高精度にAIモデルを学習可能な手法を開発 ~LLM tsuzumi の学習への適用やIOWN機能としての実用化を目指す~

Digital PR Platform / 2024年5月7日 15時10分

モメンタム:学習ごとの勾配ではなく、過去の勾配の指数平均を用いて学習
スクリーニング:各クライアントのモメンタム同士を比較し、近いモメンタムの割合を閾値以上であれば正常、そうでなければ異常と判断

 モメンタムは図3のように過去の勾配の指数平均と勾配を加算し、勾配の代わりに用いることです。スクリーニングは図4のように各クライアントのモメンタム同士を比較し、近いモメンタムが閾値以上あれば正常、そうでなければ異常と判断することです。異常と判断されたモメンタムの情報は使わずにモデル全体の更新を行います。


[画像3]https://digitalpr.jp/simg/2341/87612/700_281_2024050108115266317ab87acf8.JPG


 このようにモメンタムにスクリーニングを適用し、精度の高いモデルを学習することができます。また、数理的な証明により、一般的なクライアント間のデータの統計的な偏りを想定した目的関数において、CClipと比べて学習誤差を小さくできることを確認し、さらに、提案手法を上回る手法が存在しないことを確認しました※4。また図5に示すように、画像認識のベンチマークテストを通じて、ビザンチンノードが存在する状況下で、いくつかの従来手法(CClipを含む)よりも、異常挙動に対する最悪ケースの比較において高いテスト認識率のモデルを学習できることを実験的に確認しました。


[画像4]https://digitalpr.jp/simg/2341/87612/700_243_2024050108115266317ab86a05c.JPG


4. 役割
NTT:ビザンチン耐性のあるアルゴリズムの考案
NTTデータ数理システム:主に考案手法の数理的およびシミュレーションにおける正確さの検証実施

5. 今後の取り組み
 NTTおよびNTTデータ数理システムは、情報の保護と活用を両立する技術として期待される連合学習技術の開発を通じて、組織横断的に分散蓄積されるデータを用いたAI等の利活用の促進に貢献するとともに、共同実験などを通じて連合学習技術の研究を邁進していきます。また、将来的にはNTTが研究するLLM tsuzumi の学習への適用やNTTが推進するIOWN PETs ※5機能として実用化することを目指します。

〈参考・用語解説〉
※1. T. Murata, K. Niwa, T. Fukami, and I. Tyou, “Simple Minimax Optimal Byzantine Robust Algorithm for Nonconvex Objectives with Uniform Gradient Heterogeneity,” ICLR 2024.
URL:https://openreview.net/forum?id=1ii8idH4tH

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください