オラクル一筋23年、チェティン・オズブトンさんに訊く、世界一わかりやすい「ビッグデータとオラクル」の話

EnterpriseZine / 2012年4月6日 0時0分

4月4日より六本木の各所で行われているOracle Open World。米オラクルコーポレーションからは、たくさんのバイスプレジデントやキーパーソンが来日、セッションを行っている。今回インタビューしたのは、チェティン・オズブトン(Çetin Özbütün)さん。いまをときめく「ビッグデータ」担当だが、実はオラクル歴23年。そんなオズブトンさんに「ビッグデータとオラクル」について、丁寧にお話していただいた。

■「ビッグデータ」は、今までの「データ」と何がどう、ちがうのか

 ―オラクルに長いこと勤めていらっしゃるとうかがいました。

 そうですね。大卒ですぐ入社して、それからずっとオラクルにいます。今年で23年目ですね。データベースチームの開発者として私のキャリアは始まりました。初めてかかわったリリースはOracle 6.0。当時はまだ小さい会社でしたね。最初の12年間は個別のソフトウェア開発をしていました。その後はデータウェアハウスとビッグデータのチームを率いています。

 ―それでは、今日はビッグデータについてお聞きかせいただければと思います。まずはデータの「ビッグ」な部分について教えてください。たとえば、テラ、ペタ、といわれても、どれくらいの量なのか、どれくらいの違いがあるのか、いまいち実感としてわからないのですが、どんな風にとらえればいいのでしょうか?

 ビッグデータというのは、実はサイズの話だけではないんです。ビッグデータというものを定義するにあたっては、「密度の高いデータ」と「密度の低いデータ」と考えるといいでしょう。

 たとえば、あなたが自分の銀行口座から、誰かの口座に送金をしたとしましょう。この時点でだいたい200バイトくらいのデータが生成されています。この200バイトの情報は、サイズは小さくても、銀行にとって失ってはいけない大切なデータです。つまり、とても「密度の高いデータ」です。バイトあたりの価値を考えたときに、価値の高いデータは「密度の高いデータ」なのです。

 同じように、たとえばあなたがインターネットで、オンラインバンキングのサイトにログインして、銀行のサービスや、金融商品の案内を見たとしましょう。こういった作業でもどこかにウェブのログが残ります。「このウェブサイトを見ましたよ」というデータが、およそ30キロバイトから50キロバイトぐらいです。しかし、こうしたデータは、「密度の低いデータ」なんです。あなたがどういったサービスや商品に関心を示したかというのは銀行にとっては役に立つ情報ではある。だけど、さっき話したような「密度の高いデータ」に比べてバイトあたりの価値は低いんですね。

  • 前のページ
    • 1
    • 2
  • 次のページ
EnterpriseZine

トピックスRSS

ランキング