1. トップ
  2. 新着ニュース
  3. 経済
  4. プレスリリース

データ分析の適用範囲を広げるバラバラなデータの回帰分析を世界で初めて実現 ~「万能近似能力」を持つ深層学習によるデータ分析の適用領域の拡大~

Digital PR Platform / 2024年4月26日 15時0分

写真

 日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:島田 明、以下「NTT」)は、 入力変数と出力変数の対応関係が失われたバラバラなデータから、深層学習を用いて入出力の関係を表す関数を推定する新たなデータ分析手法を世界で初めて実現しました。この方法を用いることで、入力と出力に該当する情報が別の部署や組織で収集されたデータや、個人が識別できない集団単位で収集されたデータなどから、入出力の関係を表す関数を推定し、データを分析することが可能になります。なお、本成果は 2024年2月20日から27日まで、カナダ・バンクーバーで開催される人工知能分野の最高峰国際会議 38th AAAI Conference on Artificial Intelligence (AAAI 2024)* において発表されました。
*https://aaai.org/aaai-conference/

1.研究の背景 
 スマートフォンやウェアラブルデバイスなどの普及に伴い、ヒトの状態や行動などに関する多種多様なデータが蓄積されています。しかし、観測コストやプライバシ保護などのために網羅的なデータ収集を行うことは困難であり、データの活用が難しい場面が今もなお多く存在しています。例えば、図1に示すように、取扱商品やサービスの情報や紹介動画をオンラインサイトに掲載・実店舗で商品販売を行う企業などでは、オンラインサイトの閲覧者に関する情報(閲覧時間など)と実店舗の商品購入者に関する情報(購入金額など)はバラバラに得られていることが多く、閲覧者と購入者の情報の対応関係は分かりません (閲覧時間が何秒の人が何百円購入したのかは分からない)。同様に、プライバシに配慮し、試験の点数のようなセンシティブな情報を学級ごとに集団単位で集めた場合も、入力である生徒の属性と出力である点数の対応関係が不明なデータとして表現されます。これまでNTTでは、観測範囲に制限のある軌跡データや群衆単位の位置情報集計データのように現実的に収集可能なデータを用いてヒトの状態や行動の推定・予測・制御を可能とする手法を実現してきました。前述の対応関係の失われたバラバラなデータの分析には、通常の回帰分析の手法を適用することはできないため、分析可能とする手法が望まれていました。

2.研究の成果
 対応関係の失われたデータを分析する従来の手法では、入出力の関係を表す関数は線形(例えば、閲覧時間に比例して購入額が増えるなど)である等という非常に強い制約が成り立つことを仮定していました。そのため、現実の多くのデータに存在する非線形な関係を推定することができず、適用可能なシーンは限定されていました。当該手法により、「万能近似能力」(※1)
を持つ深層学習による高い表現力を活用し、任意の関数を推定することが可能になりました。これにより、ある特定の閲覧時間で購入額がピークとなるような、非線形な関数を推定しデータを分析できるようになります(図2)。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください