アジャイルなデータ管理でエンタープライズ・データ・ハブを目指せ

EnterpriseZine / 2014年11月26日 0時0分

 ビッグデータという言葉が登場して間もなく、注目を浴びたのがHadoopだろう。一時期は「ビッグデータ=Hadoop」で、ビッグデータを活用したければ「Hadoopでなければだめ」くらいな勢いもあった。そんなブーム的な時期を越え、ここ最近はHadoopを企業なりが実際に活用するには具体的にどうすればいいかを考えるようになっている。

■Impalaの登場がHadoopの転機に
Cloudera チーフ・オペレーティング・オフィサー
カーク・ダン氏

 そんなHadoopの企業向けディストリビューションを提供しているClouderaのチーフ・オペレーティング・オフィサー カーク・ダン氏は「我々はHadoopを6年前に商業化しました。従来のデータ管理技術にはビッグデータを扱うには遅くて高いという問題がありました。大規模なデータの管理を低コストで行う。そのためには新しい技術を発明する必要があったのです」と語る。Hadoopが登場する以前はデータベースが遅くて高いがために、一部のデータを抽出しサマライズした結果のデータしか扱えなかった。それがHadoopの登場で「完璧なデータ」を扱えるようになり、企業にとって新たなチャンスをもたらしているというのだ。

 とはいえビッグデータ活用におけるHadoopは、蓄積したデータの「バッチ処理的なもの」が得意。それを低コストで高速に行えるのがこれまでの評価ポイントだっただろう。そんなHadoopの状況を変化させるきっかけとなったのがImpalaの登場だと言うのは、Clouderaのチーフ・テクノロジストのイーライ・コリンズ氏だ。Impalaは、MapReduceではなくSQLを使ってHadoopにアクセスするテクノロジー。しかし、それだけではない。

 「Hadoopのビッグデータに対し、低レイテンシーでのアクセスを可能にしました。これによりアドホックな分析をビッグデータに行えるようになり、洞察を得る時間の短縮が実現しました」(コリンズ氏)

 バッチ処理での利用ではHadoopは舞台裏にいる。Impalaの登場で表舞台に上がり、Hadoopはユーザーが直接利用するものになったのだ。とはいえ、Hadoopだけでビッグデータのすべてを賄えるものでもない。MongoDBのような新しいNoSQLもあれば、旧来のリレーショナル・データベース、さらにはその改良型とも言えるカラム指向のデータベースもある。そういう状況の中で、ClouderaとしてはHadoopをエンタープライズ・データ・ハブとして利用するとコリンズ氏は主張する。

  • 前のページ
    • 1
    • 2
  • 次のページ
EnterpriseZine

トピックスRSS

ランキング