「ネット言論のダークサイド」を計算機で解析する ── データ分析による報道の技術とその再現性 ──
ニューズウィーク日本版 / 2016年5月10日 22時31分
しかしこのうんざりするような長年の手作業の副産物として、彼らは一つの巨大なデータセットを生み出しました。すなわち、人の手によって分類された膨大な数のコメントです。ガーディアン紙では、モデレータにより不適切なコメントを、ガイドラインに沿ってブロック、もしくは削除しています。
このように人がコメントの内容に沿って掲載するかブロックするかを決めているのですが、ブロックされたコメントもデータベースには記録として残っています。7,000万のコメントのうち、およそ2%に当たる140万件のコメントが不適切なものとして分類されたそうです。多くは攻撃的で不適切な内容だったそうですが、これには脱線しすぎたコメント、いわゆるオフ・トピックなものも含まれています。つまり、彼らは人の手で分類された膨大な量の「攻撃的なもの/そうで無いもの」と仕分けされたコメントのデータベースを持っているのです。
この記事からはブロックされたコメントのリアルタイム表示が見られる (上のスクリーンショットは4/13/2016 7:05PM PSTに取られたもの)
ガーディアン紙の解析チームは一つの仮説を立て、それをこの長年蓄積されたデータを使って定量的に検証してみることにしました。その仮説は以下のものです:
Articles written by women attract more abuse and dismissive trolling than those written by men, regardless of what the article is about.
女性によって書かれた記事は、その内容に関わらず、嫌がらせや軽蔑的な煽りの対象になりやすい
つまり女性によって書かれた記事は、女性が書いたという理由だけで軽んじられたり、おかしな人をひきつけやすいと言う仮説です。これはしばしば言われてきたことですが、定量的に大規模なデータから分析した例はあまりないと思います。そこで彼らは実際にやってみることにしました。
なぜジェンダーに関する仮説なのか?
これは割とシンプルな理由で、仮説としてわかりやすいのと、データの分類時に真偽の二値で扱えるために解析が行いやすかったからだと思います。他の性的マイノリティーや人種に関する属性をメインにすると、よりデータの自動分類が難しいという理由もあったと思います(後述)。
解析の結果
この記事に関連するニュース
-
熊本大など、データベースを更新し疾患を引き起こすゲノム状態を“地図化”
マイナビニュース / 2024年5月17日 22時22分
-
AWS、高機能な生成 AI アシスタント Amazon Q の一般提供を開始、ソフトウェア開発の迅速化と社内データ活用を支援
PR TIMES / 2024年5月2日 11時45分
-
AWS、高機能な生成 AI アシスタント Amazon Q の一般提供を開始、ソフトウェア開発の迅速化と社内データ活用を支援
Digital PR Platform / 2024年5月2日 10時49分
-
ローカスブルー株式会社の株式取得(子会社化)に関するお知らせ
PR TIMES / 2024年4月27日 12時40分
-
株式会社ゼンリンによる当社株式の取得(子会社化)に関するお知らせ
PR TIMES / 2024年4月26日 12時45分
ランキング
-
1「社会へ強いメッセージを伝える人に与えられる」“建築界のノーベル賞”プリツカー賞授賞式に山本理顕さん出席 日本人9人目の快挙
TBS NEWS DIG Powered by JNN / 2024年5月19日 11時13分
-
2イスラエル 政権内の亀裂深まる、戦時内閣メンバー・ガンツ前国防相 ネタニヤフ政権に戦闘終結後のガザ統治など行動計画要求「策定しなければ離脱」
TBS NEWS DIG Powered by JNN / 2024年5月19日 12時27分
-
3ロシア、ハリコフ州でさらに1集落制圧=ウクライナ北東部、1万人避難
時事通信 / 2024年5月19日 8時26分
-
4イスラエル軍、ガザ北部ジャバリヤ侵攻「これまでで最も激しい戦闘」…戦闘員200人殺害と主張
読売新聞 / 2024年5月18日 22時7分
-
5敵前上陸「地上の地獄だった」 対ロシア渡河作戦、兵士ら証言
共同通信 / 2024年5月19日 20時8分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください