GreenplumDBが持つ高速化機能とワークロード管理・可用性機能

EnterpriseZine / 2012年2月1日 0時0分

連載第5回目の今回は、前回に引き続き、効率的なデータ処理を行うための技術動向とGreenplum DBが持つ高速化機能、およびワークロード管理・可用性機能について解説いたします。まずは、データのストア方式についてです。

■Greenplum Polymorphic Data Storage(ポリモーフィックデータストレージ)ローストアとカラムストア

 エドガー・F・コッド博士が発表した論文から始まったリレーショナルデータベースの過去40年に渡る歴史を振り返ってみても、この1、2年は、新たな局面を迎えたといえるでしょう。主なトピックは、RDBMSベンダーの合併・買収やビッグデータ分析の盛り上がりなどです。

 技術面においても「カラムストア」と呼ばれるデータアクセス高速化機能の話題を目にすることが多くなってきています(「カラム型」「列指向」「Columnar(カラムナー)」などとも呼ばれています)。

 ローストア・カラムストアとは、その名の通り、データベースへのデータ格納方式を表しています。ローストアというのは、データを行(ロー)単位で格納する方式で、一般的なRDBMS製品はローストアを採用しています。一方、カラムストアというのは、データを列(カラム)単位で格納する方式で、従来よりSybase IQがこの仕組みを採用しています。

 Greenplum DBはどちらなのかといいますと、両方をとりいれた「ハイブリッド型」です。ローストアとカラムストアの両方のデータ格納方式を、テーブル単位やパーティション単位で使い分け・組み合わせることが可能です。つまり、(この後で説明しますが)ローストアとカラムストアをハイブリッドで構成し、両方のメリットを”いいとこどり”することができるのです。

 ちなみにGreenplum DBと比較されることの多い、他のDHW向けRDB製品では、最近発表されたTeradataの最新バージョンではカラムストアを実装し、ローストアとカラムストアのハイブリッド構成を取れるように追随しつつあるようです。一方、Oracle ExadataのHybrid Columnar Compression機能はカラムストアと見なされることもありますが、これはテーブルをCompression Unit(CU)という単位(圧縮方式によって異なる複数行単位)で分割し、CU内のデータをカラムごとに圧縮する方式であり、カラム圧縮ではありますが、今回取り上げているカラムストアとは異なります。
カラムストアが得意とするワークロード

  • 前のページ
    • 1
    • 2
  • 次のページ
EnterpriseZine

トピックスRSS

ランキング