Oracle Databaseのバックアップを大幅に効率化するData Domainの重複排除技術

EnterpriseZine / 2012年11月13日 0時0分

Data Domain にNASマウントし、RMAN を使って直接バックアップ・リストアが可能

DB Online読者の皆さんは、「重複排除」という言葉をご存じだろうか。これは、急激なペースでデータが増加し続ける昨今において、もっとも注目されているキーワードの1つ。データを圧縮しサイズを小さくするのはいまや当たり前だが、この重複排除は重複するデータを取り除くことでデータサイズを大幅に削減する技術だ。重複排除のソリューションは、いまやさまざまなベンダーが提供している。中でももっとも実績があり市場でも評価されているのは、EMCのソリューションだろう。その証拠に、国内におけるEMCの重複排除ストレージ製品の売上金額シェアは、約80%を占めている。

■Data Domainだけが実現できるインラインでのリアルタイム重複排除

 それではいったいEMCの重複排除は、どのようなポイントが評価されているのだろうか。その1つとして挙げられるのは、重複排除ストレージであるEMC Data Domainの重複排除の仕組みがきわめて高い効率性を持っていることだと、EMCジャパン BRS事業本部 システムズ・エンジニアリング部 シニア・システムズ・エンジニアの志間義治氏は言う。

 他の重複排除の多くが固定長ブロック単位で重複を排除するのに対し、Data Domainでは可変長ブロックとなっている。たとえばデータベースの処理で、データのインサートやアップデートが行われる際、更新データが元のデータとサイズが異なれば、ブロックのサイズが合わなくなり変更されたデータブロックだけでなくその後に続くデータブロックも辻褄が合うところまで変更されることになる。つまり、変更されるブロックが増えてしまうのだ。

 これに対し可変長であれば、仮に更新データのサイズが元とは異なっても変更するのは対象のデータブロックだけで済む。結果的には、変更のない重複ブロック数が多くなり、より効率的に重複排除が行えるのだ。

 もう1つの特長が、重複排除をインライン処理できる高い性能が挙げられる。Data Domainでは、特許を取得しているSISL(Stream-Informed Segment Layout)という独自アーキテクチャが採用されている。これは、重複しているかどうかの判断を演算で行うもので、その処理をストレージ上ではなく、メモリ上で3bitのフラグ位置の確認というシンプルな方法で実現している。ストレージIOを介さず、CPUの処理とメモリ上のデータアクセスだけで行えるので、高速な処理が可能なのだ。

  • 前のページ
    • 1
    • 2
  • 次のページ
EnterpriseZine

トピックスRSS

ランキング