SNS上のフェイクニュースや誤情報をAIで検出する試みはさかんに行われています。フェイクニュースの拡散性の高さや、一度信じた情報は修正しづらいというヒトの性質から、できる限り早い段階で誤情報を検出して拡散阻止することが重要になります。
ただし、誤情報との判断はとてもむつかしいため、ともすれば公的なアカウントが根も葉もない情報を拡散してしまうリスクも。人の生き死ににも関わる新型コロナ関連の情報については、誤情報の拡散がより深刻です。
こうしたなか、アメリカのロスアラモス国立研究所は、機械学習アプローチによって新型コロナ関連の陰謀論に関するSNS投稿を特定し、時間の経過とともにどうように進化したかをモデル化しました。
180万件のTwitterデータを分析研究では、約180万件の匿名Twitterデータを収集し、4つのテーマについて、パンデミック最初の5カ月間を対象に分析しています。
4つのテーマとは、「5G基地局がウイルスを拡散する」「ビル&メリンダゲイツ財団は新型コロナ関連の活動に悪意を持って取り組んでいる」「ウイルスがバイオエンジニアリング、あるいは実験室で開発された」「新型コロナワクチンは危険なもの」といった、誰もが目にしたことがあるだろう内容です。
研究チームはパターンフィルタリングによって、一連のデータの中から4つのテーマに属するものを特定。それぞれのテーマについて、数百のツイートに手作業でラベルを付けしてトレーニングセットを作成しました。機械学習手法のランダムフォレストによるモデルで収集ツイートを分類。これにより、人々が陰謀論についてどのように話し、時間の経過とともに内容がどう変化したかを明らかにしています。
誤情報に関するツイートには否定的な感情が多く含まれていた研究からは、誤情報に関するツイートには事実に関するものと比較して、否定的な感情がより多く含まれていたことがわかりました。また、陰謀論は時間の経過とともに進化し、本来無関係なイベントが関連付けられる傾向が示されています。
たとえば、ビル・ゲイツは2020年3月にReddit上に新型コロナに関するAMA(Ask Me Anything:なにか質問ある?)トピックを立てた際、ワクチンの接種記録に使用できる、注射式の見えないインクについて言及していますが、その直後に新型コロナワクチンが市民管理に利用されるとの陰謀論増加が目立ったようです。
この研究では、教師あり学習アプローチを使用して陰謀論を特定でき、教師なし学習アプローチによって各陰謀論における単語の重要性の経時変化を調査できることが判明していて、SNS上の陰謀論監視に役立てられそうです。
参照元:New AI tool tracks evolution of COVID-19 conspiracy theories on social media/ Los Alamos National Laboratory
(文・山田洋路)