「データ分析」と「データベース技術者の心」の距離は近いか遠いか

EnterpriseZine / 2014年8月30日 0時0分

 7月18日、IBM DB2の勉強会「ClubDB2」が開催された。テーマは「データベース技術者は、データとどう向き合えばいいのか。みんなで考えてみよう!」。ビッグデータをテーマに動向解説にディスカッションを交えた会となった。講師は一志達也氏。

 ビッグデータというキーワードが普及するにつれ、データの価値が重要視されるようになってきた。なかでもIBMは「データは天然資源である」と目している。ただしデータはデータとして存在するだけでは意味をなさない。データは分析というプロセスを経て磨かれ、価値を持つようになる。それでデータ分析のスペシャリストとなるデータサイエンティストも脚光を浴びるようになってきている。

 とはいえ、一般の業務やデータベース運用業務の現場ではデータ分析の重要性を理解しつつも、まだ本格的な実践や活用まで到達していないところが多いのが実情ではないだろうか。一志氏がデータ分析に関する話題を提供しつつ、皆で意見交換した。

 まず一志氏はIBMが出しているデータ分析のライフサイクルを示した。最初は業務を理解するところから始め、次にデータの理解、具体的にはどのようなデータ(項目)が必要なのかに落とし込んでいく。このあたりは計画段階といえようか。

 続いて実践段階。必要なデータを準備(調達)し、そのデータのモデリングを行う。言い換えれば、データモデルの仮説を作成して実際のビジネスに適用してみるということ。その後は評価段階へと進む。準備したデータとモデルを適用した結果を見て、仮説が正しかったかどうかを評価する。もし全く見当違いの結果なら振り出しに戻るということもある。ある程度評価できるならビジネスに展開していきつつ、改善点をモデリングにフィードバックする。……といった流れを延々と繰り返すのが全体の流れとなる。

 このサイクルはいわばIBMが示す「データ分析のお手本」のようなもの。これを見て一志氏がどう思う?と参加者に聞いてみると、いろんな意見が出てきた。

 「パラメータ(データ)を用意するといっても、いろいろあるのでは?」。つまり、知りたいことに対して影響を与える項目は無尽蔵にありそうだし、予想外な出来事がビジネスを大きく変えてしまうこともある。データ分析はそう簡単にはいかないのではという心情がうかがえる。

 「スタート(業務の理解)とエンド(モデルへのフィードバック)はそれでいいだろうか?」。分析した結果のフィードバックはデータモデルだけではなく、業務そのものにも向けられてもいいのでは?という指摘も出た。

EnterpriseZine

トピックスRSS

ランキング