データを収集できても「読み取り方がわからない」あなたに贈る記事
プレジデントオンライン / 2020年3月13日 11時15分
■統計学ではわからないデータの使い方
プレゼンのために関連がありそうなデータを収集してみたはいいものの、そこから何を読み取ればいいのかわからなくなった、という経験がある方は少なくないのではないでしょうか。
相手を説得するためのデータ・分析と、複雑で精度の高いデータ・分析は、一見同じに見えて、全く異なるものです。
まず知っておかないといけないのは、「データは、目的に対する手段でしかない」ということ。データは、目的に対して適切に使われて、はじめて価値を発揮します。しかし、統計学もデータサイエンスもこの事実を教えてはくれません。
例えば、アイスクリームの製造計画を立てるため、いつごろたくさん売れるのかを知りたいとします。
最新のデータサイエンスを用いて、各月ごとにアイスが多く売れる確率をそれぞれ小数点以下数桁にわたり計算することが可能です。これは「精度の高い」データではありますが、本当に「必要なデータ」でしょうか。
暑い7~9月にアイスクリームがたくさん売れることは、最新のデータサイエンスを用いずともわかることでしょう。「いつごろたくさん売れるのかを知りたい」という目的に対して、この計算は本当に必要なのでしょうか。
また、過去の分析と、将来の予測の精度の高さは、全く異なるものであることも認識しておく必要があります。
サイコロを1万回振って4の目がでた確率を正確に計算しても、次に4が出る確率が1/6であることに変わりはありません。この場合は、過去のデータの正確性は将来の予測のためになんの意味も為しません。
■正確なデータより目的の設定が重要
データによって分析をする際は、自分が集めようとしているデータが、「本当に伝えたい内容という目的に対して適切な手段なのか?」ということを考えましょう。
分析のインプットとして、目的を明確にし、その目的に沿ったデータを使うことに加え、アウトプットを考える際に重要なのは、データ分析の「結果」を伝えることではなく、「結論」を伝えることです。
数字や統計用語が入っていないシンプルな結論こそが説得力を持つのであり、データの精度の高さそのものが説得力向上につながるわけではありません。
自分が今知る必要があることを理解していれば、必要となるデータの精度も自ずと見えてきます。
正しい目的に対して正しいデータとはどういうものなのか、その一例を確認してみましょう。
例えば、コールセンターにて「お客さまからのクレーム対応が不十分ではないか?」という状況を確認したい場合、どのようなデータ分析が有用でしょうか。こういったケースでよく用いられるのは、図にあるような内容別の苦情件数の推移グラフです。
![【図表】クレームの対応が不十分では?という指摘が正しいか検証したい](https://president.ismcdn.jp/mwimgs/d/b/670/img_dbf77dafccde06d6ea5c8c056169e8ba721435.jpg)
しかし、それでは先の目標は達成できません。件数が減っている項目があったとしても、それが偶然なのか、クレームに対応できたため減っているのかが確認できないからです。
つまり、このグラフでは説得力があるとはいえません。
では、どのようなデータならば有用でしょうか。苦情の件数に対して、どれだけ対応できているか、というデータが必要です。全クレーム数に対して対応を行った比率、つまり「クレーム対応率」の比率を出すべきではないでしょうか。その推移を追うのか、カテゴリーごとの数値を出すのか、競合他社との比較を出すのかは、さらに目的に応じて選択します。
対応率という1つの数字より、内容別の苦情件数の推移のほうが、情報量が多く、データの精度は高いといえるかもしれません。
しかし、目的に立ち返れば、そっけない「対応率50%」というデータのほうが、今知りたいことに直結したデータだといえるでしょう。これが、目的に対してデータを手段として適切に使うということです。
まずすべきことは、自分が伝えたいこと=目的や、証明したい仮説を定めること。それからデータを集めるべきでしょう。
断片的、表面的な情報は視点を固定してしまい、「このデータの中に答えはきっとある」という思考に陥らせてしまいます。
■正解は探すな、創造するものだ
自分が知っている情報や今手元にあるデータは、あくまで自分が知るべき情報の一部でしかないという認識が必要です。
目的もなくデータを分析して、発見したことを出発点や仮説にしてはいけません。「データからこんなことがわかりました」では、他者を説得することはできないでしょう。
では、仮説はどうやって立てればいいのでしょうか。必要になるのは、いわゆる「ロジカルシンキング」の知識と場数です。自分の知識や経験からだけではなく、論理的な可能性を探るのです。
単にデータから何かしらの法則を見出すことは、AIやデータサイエンスでも可能です。ただ、それを「正解」と呼べるのでしょうか。われわれに今後必要になるのは、「正解を見つけ出す」のではなく「自ら正解を創り出す」スキルでしょう。
残念ながらそういったスキルを身に付けることは、これまでの日本の教育との間にはギャップがあるため、自力でしなければなりません。
論理的思考によって、広い設計図を描くことを目指すべきです。
----------
データ&ストーリー代表 横浜国立大学非常勤講師
企業を中心にデータ分析・ロジカルシンキングの研修・セミナーなどを行う。『「それ、根拠あるの?」と言わせないデータ・統計分析ができる本』のほか、著書多数。
----------
(データ&ストーリー代表 横浜国立大学非常勤講師 柏木 吉基 構成=梁 観児)
外部リンク
この記事に関連するニュース
-
生成AIの時代だからこそ身につけたい「考える力」をアップデートする一冊『戦略コンサルタントが大事にしている シン・ロジカルシンキング』発売!
PR TIMES / 2024年7月20日 11時45分
-
「年の差婚が増えた」と信じる人が知らない実態 勘違いが発生してしまう3つの理由を分析
東洋経済オンライン / 2024年7月20日 10時0分
-
〈5分でわかる統計学入門〉全員から回答を集めなくても、なぜ信頼できるデータが得られるのか?
集英社オンライン / 2024年7月4日 8時0分
-
テラデータの「VantageCloud Lake」がGoogle Cloudで提供開始、Geminiとの連携も
マイナビニュース / 2024年6月27日 12時36分
-
SAS製品を活用した金融機関向けサービスを提供
PR TIMES / 2024年6月24日 12時15分
ランキング
-
1コメが品薄、価格が高騰 米穀店や飲食店直撃「ここまでとは」
産経ニュース / 2024年7月21日 17時41分
-
2システム障害、世界で余波続く=欠航、1400便超
時事通信 / 2024年7月21日 22時45分
-
3ウィンドウズ障害、便乗したフィッシング詐欺のリスク高まる…復旧名目に偽メール・偽ホームページ
読売新聞 / 2024年7月22日 0時0分
-
4円安は終わり?円高反転4つの理由。どうなる日経平均?
トウシル / 2024年7月22日 8時0分
-
5なぜユニクロは「着なくなった服」を集めるのか…「服屋として何ができるのか」柳井正氏がたどり着いた答え
プレジデントオンライン / 2024年7月22日 9時15分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)