新しいプライバシー保護データ解析プロトコル「local-noise-free protocol」を開発
共同通信PRワイヤー / 2024年11月29日 12時16分
シャッフルモデルは、中央集権型モデルと局所型モデルの両方の短所を解決するためのモデルとして近年提案されたものです。具体的には、ユーザとサービス事業者の間に「shuffler」と呼ばれる中間サーバを導入します。従来のシャッフルモデルのプロトコル(図1)では、各ユーザが自身のデータにノイズを加えて暗号化した上でshufflerに送信し、shufflerが受け取ったデータをランダムにシャッフルした上で、サービス事業者に送信します。サービス事業者は受け取ったデータを復号することで、シャッフルされたノイズ付きデータを取り出し、そこからデータ解析結果を求めます。このshufflerによるシャッフルが匿名性を高める効果を持っており、その分、ユーザが加えるノイズを少なくすることができます。また、サービス事業者には元データは送られないため、局所型モデルより高いデータ解析精度を実現しつつ、中央集権型モデルと比べてサービス事業者からの元データの漏洩リスクを低減できます。
しかし、従来のシャッフルモデルは大きな課題を3つ抱えていました。1つ目の課題は、一部の悪意を持ったユーザが自身のデータと異なる偽のデータを送ることで、データ解析の精度を下げる「ポイズニング攻撃」に対する脆弱性です。特に、プライバシーを高めようとするほど、本来ユーザが加えるべきノイズ量が増加する一方、攻撃者は偽データにノイズを加えなくて良いため、データ解析の精度劣化の度合いが大きくなります。2つ目の課題は、サービス事業者が一部のユーザと結託する「結託攻撃」に対する脆弱性です。具体的には、サービス事業者が、結託したユーザ達のノイズ付きデータを入手することで、シャッフルによる匿名化の効果を下げることができ、その分、他のユーザ達の元データを推定する(即ち、プライバシー情報を暴露する)ことが可能となります。3つ目の課題は、データ解析精度です。具体的には、局所型モデルよりはユーザが加えるノイズを少なくできるものの、依然としてユーザのノイズ量がまだ大きいという問題を抱えています。例えば、全ユーザのデータの頻度分布(Frequency Distribution)※2を推定するタスクにおいては、頻度の小さいカテゴリー(あるいは区間)がノイズに埋もれてしまって高精度な解析ができなくなります。従来では、このような課題に対して、根本的な解決策は提示されていませんでした。
この記事に関連するニュース
-
医療機関のウェブデータを活用し、新型コロナワクチン接種対応施設を調査 - AIによる3,800以上の医療機関分析から見えた傾向
PR TIMES / 2024年11月27日 15時15分
-
電子顕微鏡技術を駆使して高機能膜脂質の超微細分布を解明
PR TIMES / 2024年11月15日 17時40分
-
AIを利用した音声分析技術でシカの行動実態に迫る
PR TIMES / 2024年11月14日 17時40分
-
【東芝デジタルソリューションズ】「SATLYS 映像解析AI」の人物/物体検出・追跡など4種のAIモデルがNVIDIA Jetsonに対応
Digital PR Platform / 2024年11月11日 15時1分
-
アドエビス、AI推定クロスデバイス分析をリリース。日次更新でデバイスを横断したユーザー行動を分析し、スピーディーな意思決定を実現
PR TIMES / 2024年11月2日 12時40分
ランキング
-
1LUUPと交通違反、タイミーと闇バイト、メルカリとさらし行為――“性善説サービス”はいずれ崩壊するのか
ITmedia ビジネスオンライン / 2024年11月29日 8時10分
-
2JR東日本「廃線予備軍」はいくつある? 久留里線に続いてしまうのか 被災も引き金に
乗りものニュース / 2024年11月29日 14時12分
-
3風呂キャンセル界隈?「日本の偉人」まさかの素顔 凄い人物でも部屋が汚い、そんな姿に親近感も
東洋経済オンライン / 2024年11月29日 11時0分
-
4スーパーやコンビニなどのレジ袋は有料化されたのに、なぜ「しまむら」は無料なの?ほかの小売業者の対応は?
ファイナンシャルフィールド / 2024年11月28日 5時20分
-
5コーヒー豆が歴史的高騰、NY市場で最高値…産地のブラジルやベトナムで不作
読売新聞 / 2024年11月29日 0時0分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください