MapR Technologies、HadoopディストリビューションにApache Sparkのフルスタックを追加

@Press / 2014年4月22日 10時0分

ロゴ
* このプレスリリースは、2014年4月10日米国発、プレスリリースの抄訳です。
http://www.mapr.com/company/press-releases/mapr-adds-complete-apache-spark-stack-its-distribution-hadoop


Hadoopのリーダー企業である米国MapR Technologies社(以下MapR)は、米国時間2014年4月10日、米国Databricks社との戦略的パートナーシップと同時に、同社のHadoopディストリビューションにApache Sparkのフルスタックを搭載したことを発表しました。Sparkのインメモリ処理のフレームワークにより、さらなるスピード、容易なプログラミング、そしてリアルタイム処理を実現することができます。

昨今、ビッグデータを有効に活用するため、より簡単に、より素早く価値のある情報を引き出す方法を多くの組織が探し求めていますが、Sparkにより、パフォーマンスと開発者の生産性を同時に高めることができるようになります。

【パフォーマンス】:Sparkは、インメモリ・パイプラインを用いた汎用の実行フレームワークを提供し、エンド・ツー・エンドのアプリケーション性能を高めることができます。これにより、多くのアプリケーションのパフォーマンスが、5倍~100倍改善します。

【開発生産性】:Sparkジョブのコード量は、通常のHadoopのMapReduceジョブと比較し5分の1程度の行数ですみます。Sparkはシンプルなプログラム抽象化を提供し、開発者はデータセット(RDD, Resilient Distributed Dataset)に対する操作を記述する形でアプリケーションを設計することができます。開発者は、アプリケーションをJavaやScala、Python等の複数のプログラム言語で構築することができると同時に、同じコードをバッチ、インタラクティブ、ストリーミングの処理に再利用することもできます。

現在、多くの企業や組織が既にSparkをMapRの環境で使用しています。これらSparkを基にしたアプリケーションは、エンタープライズ・グレードのHadoopであるMapRディストリビューションの信頼性、パフォーマンス、そしてMapRのDirect Access NFS(TM)による業務データのリアルタイム処理能力の恩恵を受けています。SparkのスタックがMapRのディストリビューションに追加されたことにより、お客様はSparkスタックの全てのプロジェクトの保守サポートを受けることができるようになります。

  • 前のページ
    • 1
    • 2
  • 次のページ
@Press

トピックスRSS

ランキング