データを収集できても「読み取り方がわからない」あなたに贈る記事
プレジデントオンライン / 2020年3月13日 11時15分
■統計学ではわからないデータの使い方
プレゼンのために関連がありそうなデータを収集してみたはいいものの、そこから何を読み取ればいいのかわからなくなった、という経験がある方は少なくないのではないでしょうか。
相手を説得するためのデータ・分析と、複雑で精度の高いデータ・分析は、一見同じに見えて、全く異なるものです。
まず知っておかないといけないのは、「データは、目的に対する手段でしかない」ということ。データは、目的に対して適切に使われて、はじめて価値を発揮します。しかし、統計学もデータサイエンスもこの事実を教えてはくれません。
例えば、アイスクリームの製造計画を立てるため、いつごろたくさん売れるのかを知りたいとします。
最新のデータサイエンスを用いて、各月ごとにアイスが多く売れる確率をそれぞれ小数点以下数桁にわたり計算することが可能です。これは「精度の高い」データではありますが、本当に「必要なデータ」でしょうか。
暑い7~9月にアイスクリームがたくさん売れることは、最新のデータサイエンスを用いずともわかることでしょう。「いつごろたくさん売れるのかを知りたい」という目的に対して、この計算は本当に必要なのでしょうか。
また、過去の分析と、将来の予測の精度の高さは、全く異なるものであることも認識しておく必要があります。
サイコロを1万回振って4の目がでた確率を正確に計算しても、次に4が出る確率が1/6であることに変わりはありません。この場合は、過去のデータの正確性は将来の予測のためになんの意味も為しません。
■正確なデータより目的の設定が重要
データによって分析をする際は、自分が集めようとしているデータが、「本当に伝えたい内容という目的に対して適切な手段なのか?」ということを考えましょう。
分析のインプットとして、目的を明確にし、その目的に沿ったデータを使うことに加え、アウトプットを考える際に重要なのは、データ分析の「結果」を伝えることではなく、「結論」を伝えることです。
数字や統計用語が入っていないシンプルな結論こそが説得力を持つのであり、データの精度の高さそのものが説得力向上につながるわけではありません。
自分が今知る必要があることを理解していれば、必要となるデータの精度も自ずと見えてきます。
正しい目的に対して正しいデータとはどういうものなのか、その一例を確認してみましょう。
例えば、コールセンターにて「お客さまからのクレーム対応が不十分ではないか?」という状況を確認したい場合、どのようなデータ分析が有用でしょうか。こういったケースでよく用いられるのは、図にあるような内容別の苦情件数の推移グラフです。
しかし、それでは先の目標は達成できません。件数が減っている項目があったとしても、それが偶然なのか、クレームに対応できたため減っているのかが確認できないからです。
つまり、このグラフでは説得力があるとはいえません。
では、どのようなデータならば有用でしょうか。苦情の件数に対して、どれだけ対応できているか、というデータが必要です。全クレーム数に対して対応を行った比率、つまり「クレーム対応率」の比率を出すべきではないでしょうか。その推移を追うのか、カテゴリーごとの数値を出すのか、競合他社との比較を出すのかは、さらに目的に応じて選択します。
対応率という1つの数字より、内容別の苦情件数の推移のほうが、情報量が多く、データの精度は高いといえるかもしれません。
しかし、目的に立ち返れば、そっけない「対応率50%」というデータのほうが、今知りたいことに直結したデータだといえるでしょう。これが、目的に対してデータを手段として適切に使うということです。
まずすべきことは、自分が伝えたいこと=目的や、証明したい仮説を定めること。それからデータを集めるべきでしょう。
断片的、表面的な情報は視点を固定してしまい、「このデータの中に答えはきっとある」という思考に陥らせてしまいます。
■正解は探すな、創造するものだ
自分が知っている情報や今手元にあるデータは、あくまで自分が知るべき情報の一部でしかないという認識が必要です。
目的もなくデータを分析して、発見したことを出発点や仮説にしてはいけません。「データからこんなことがわかりました」では、他者を説得することはできないでしょう。
では、仮説はどうやって立てればいいのでしょうか。必要になるのは、いわゆる「ロジカルシンキング」の知識と場数です。自分の知識や経験からだけではなく、論理的な可能性を探るのです。
単にデータから何かしらの法則を見出すことは、AIやデータサイエンスでも可能です。ただ、それを「正解」と呼べるのでしょうか。われわれに今後必要になるのは、「正解を見つけ出す」のではなく「自ら正解を創り出す」スキルでしょう。
残念ながらそういったスキルを身に付けることは、これまでの日本の教育との間にはギャップがあるため、自力でしなければなりません。
論理的思考によって、広い設計図を描くことを目指すべきです。
----------
データ&ストーリー代表 横浜国立大学非常勤講師
企業を中心にデータ分析・ロジカルシンキングの研修・セミナーなどを行う。『「それ、根拠あるの?」と言わせないデータ・統計分析ができる本』のほか、著書多数。
----------
(データ&ストーリー代表 横浜国立大学非常勤講師 柏木 吉基 構成=梁 観児)
外部リンク
この記事に関連するニュース
-
テレビの「統計っぽいコメント」はウソばかり…東大入試が「統計的な推測」を重視するようになった背景
プレジデントオンライン / 2024年4月26日 9時15分
-
事業が行き詰る一番の要因は「計画」? 参考にしたい3つのステップ
ITmedia ビジネスオンライン / 2024年4月18日 17時35分
-
「キャッシュレスセキュリティレポート」2023年10-12月版を公開
PR TIMES / 2024年4月16日 18時15分
-
「『いいものをつくれば高額になるのは仕方がない』は言い訳」――元・味の素マーケティングマネージャーが教える「ヒット商品」「誰も買わない商品」の分岐点
THE GOLD ONLINE(ゴールドオンライン) / 2024年4月15日 7時30分
-
中高生向けプログラミング教室Ex-Gramが10周年を迎え学習カリキュラムを全面改訂 5月12日より新オンラインクラスがスタート
@Press / 2024年4月11日 11時0分
ランキング
-
1円下落、一時158円台に迫る 介入観測後も円安止まらず
共同通信 / 2024年5月1日 18時30分
-
2「テーマパーク化した大学」を経たZ世代の不都合 先生と生徒が共犯でうみだす「いい子症候群」
東洋経済オンライン / 2024年5月1日 11時0分
-
3経営者目線 ジム・ロジャーズ氏「今後1年の間に大暴落」を警告 ワタミ来月40周年
zakzak by夕刊フジ / 2024年5月1日 15時30分
-
4観光業で働く人のためにも「GWは廃止すべき」 こう提言しても、何も変わらなかった理由
ITmedia ビジネスオンライン / 2024年5月1日 6時40分
-
5チャウヌさんのオリジナルステッカー入り「サブウェイオリジナルステッカーセット」プレゼントキャンペーン
共同通信PRワイヤー / 2024年5月1日 0時0分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください