「ネット言論のダークサイド」を計算機で解析する ── データ分析による報道の技術とその再現性 ──
ニューズウィーク日本版 / 2016年5月10日 20時8分
はたして、その結果はうんざりするものでした:
The 10 regular writers who got the most abuse were eight women (four white and four non-white) and two black men. Two of the women and one of the men were gay. And of the eight women in the "top 10", one was Muslim and one Jewish.
And the 10 regular writers who got the least abuse? All men.
定期的に記事を執筆している記者のうち、最も多くの嫌がらせを受けた10人の内訳は、8人が女性で2人が黒人男性だった。そのうち2人の女性と1人の男性はゲイだった。その「トップテン」の8人の女性うち、1人はムスリムで、1人はユダヤ人だった。
そして最も嫌がらせを受けた回数が少なかった10人は、全員男性だった。
この結果を導き出したのは、計算機によるデータ解析でした。解析結果についても思うところはあるのですが、ここでは技術的な部分についてのみ注目してみます。実はこの記事に合わせて、解析チームの方がこの解析に使った手法についてかなり詳細に書いています:
対象とする読者
本稿ではこの記事に書いてある手法を、技術者ではない方に向けて解説してみます。ですからプログラマの方などが読まれると冗長に感じられるかと思いますが、そこはご勘弁を。専門家向けの記事と、「データ解析」という言葉が事実上「魔法」と同義語で使われている全く技術に触れない記事はたくさんあるのですが、その中間が埋まっていないように感じていたというのが執筆の動機の一つです。実例の解説は、その「魔法」にかかった靄を取り除き、実際の作業がどのくらい地味なものかを明らかにすることができると思います。
元の記事では、結果を可視化したものが見られる (© The Guardian)
なお結果の詳細は、D3.jsを使ったインタラクティブなチャートとして元記事に掲載されていますので是非ご覧になってみてください。「ジャズや競馬[注]の話題に関しては穏やかなコメントが比較的多いが、フェミニズムやパレスチナ問題のコメント欄はかなり荒れる」と言う、どこかで聞いたような話だな...と思わず苦笑してしまうような事実がデータに基づき図表で解説されています。実際の嫌がらせの内容にも触れていますので、読んでいてあまり気持ちのいいものではない部分もありますが、「誰でも自由に発信できる世界」に対して記者の方々が払っているコストの生々しい実態が読めます。
[注]: イギリスの記事ですから、日本の競馬とは雰囲気や意味合いがかなり異なるので、そこは注意して読んでください 。
この記事に関連するニュース
-
熊本大など、データベースを更新し疾患を引き起こすゲノム状態を“地図化”
マイナビニュース / 2024年5月17日 22時22分
-
AWS、高機能な生成 AI アシスタント Amazon Q の一般提供を開始、ソフトウェア開発の迅速化と社内データ活用を支援
PR TIMES / 2024年5月2日 11時45分
-
AWS、高機能な生成 AI アシスタント Amazon Q の一般提供を開始、ソフトウェア開発の迅速化と社内データ活用を支援
Digital PR Platform / 2024年5月2日 10時49分
-
ローカスブルー株式会社の株式取得(子会社化)に関するお知らせ
PR TIMES / 2024年4月27日 12時40分
-
株式会社ゼンリンによる当社株式の取得(子会社化)に関するお知らせ
PR TIMES / 2024年4月26日 12時45分
ランキング
-
1イラン大統領、事故で死亡=不時着ヘリ発見
時事通信 / 2024年5月20日 13時39分
-
2イラン大統領死亡、中東の状況注視する=林官房長官
ロイター / 2024年5月20日 16時50分
-
3ロシア企業が開発のAI、「ひどい臆病者」と前大統領激怒…ウクライナ問題に「勉強中」とのみ回答
読売新聞 / 2024年5月20日 17時23分
-
4アングル:「働いた証ない」、労働者の権利求めるメキシコのセックスワーカー
ロイター / 2024年5月20日 8時52分
-
5台湾の頼総統、中国に軍事威嚇の停止呼びかけ 「世界平和への挑戦」
産経ニュース / 2024年5月20日 13時35分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください