あの「ワトソン」チームが開発したBLUとは?そして4つめのIBM PureData Systemの「ここがすごい」を訊いてきた

EnterpriseZine / 2013年4月12日 0時0分

IBMが先日、米国カリフォルニアで発表したデータベースの新しい技術は、たんなるニューバージョンのデータベースの登場ではなく、「ビッグデータという世界において、市場を変えることになるものです」と言うのは、IBMコーポレーション ソフトウェアグループ インフォメーション・マネジメント ゼネラル・マネージャーのボブ・ピッチャーノ氏。彼が市場を変えるといっているのが、DB2 10.5に新たに搭載されたBLU Accelerationと、日本では未発表のPureData System for Hadoopだ。

■2013年だ3四半期にPureData Systemに新たなラインナップが追加

 BLU Accelerationは、あの質問応答システムとして有名な「Watson」を開発したのと同じチームによって開発された技術。圧縮、カラム型、インメモリ、データ・スキッピングなどの複数の高性能化技術を組み合わせて、BLUは実現されている。このBLUが、圧縮やインメモリ、カラム型などの技術を利用した、他のデータベースの高速化製品や機能と異なるところは、「既存のDB2に統合されていることです」(ピッチャーノ氏)。まったく新しい製品としてこの機能を提供するのではなく、DB2に追加された1つの機能として実現。その結果、管理者や開発者は、簡単にこの機能の恩恵を享受できる。

 「BLUは、直感的に理解できるものになっています」

 たとえば、インメモリ上だけでこれらの技術を利用する高性能化機能も、IBMなら実現できたはずだ。ただしそれをしてしまうと特別なハードウェア構成が必要になるかもしれないし、特別な管理手法や信頼性向上の仕組みもいるかもしれない。BLUの場合は、DB2の機能に過ぎないので、DB2が動くハードウェアであれば基本的にこの高性能化の機能を利用できる。メモリ空間の大きなサーバーであれば、インメモリーの効果を最大限に発揮できるだろう。逆にそれほどメモリーが大きくなくてもBLUは利用でき、その際には圧縮やカラム型の恩恵を受けることできる。このようにソフトウェアだけで実現できていることが、BLUの大きな特長でもあるわけだ。

 もう1つの日本未発表の新製品が、PureData System for Hadoopだ。これはHadoopアプライアンスとも呼ぶことができる、PureData Systemの4つめのラインナップだ。その中身は、PureDataにInfoSphere BigInsightsを統合したもののようだ。これ1台で、莫大な規模の非構造化データの高速な処理を実現できる。アプライアンスの形でHadoopシステムを提供するので、面倒なHadoopクラスターの構成といった、特別なスキルがなくてもすぐにHadoopの世界を活用できる。

 さらにBigInsightsには、SQLでHadoopのファイルシステムであるHDFSにアクセスするBig SQLという新機能も追加される。現時点では、1台で非圧縮の1/4ペタバイトのデータを扱える構成となる。出荷時期は2013年の第3四半期を予定しており、すでにアーリーアクセスプログラムがあるので、興味があればこの新しいPureDataを試すこともできる。

谷川 耕一[著]

EnterpriseZine

トピックスRSS

ランキング