本/雑誌
詳解Apache Spark 大規模データ分析を基礎から、徹底的に
下田倫大/著 師岡一成/著 今井雄太/著 石川有/著 田中裕一/著 小宮篤史/著 加嵜長門/著
3960円
ポイント | 1% (39p) |
---|---|
発売日 | 2016年05月発売 |
出荷目安 | メーカー在庫あり:1-3日
※出荷目安について |
追跡可能メール便利用不可商品です
商品説明
Apach Sparkはより高速にビッグデータを処理するための分散処理フレームワークです。SQLインターフェースや機械学習などの機能が標準で組み込まれ、バッチ処理だけでなくストリーミング処理や対話的な処理にも対応できるため、さまざまなシーンのデータ分析を強力にサポートします。本書では、Sparkの基礎であるRDDのしくみ、Sparkを構成する各コンポーネントの機能を理解するところからはじめます。さらにSparkクラスタの構築と運用、構造化データを処理するためのDataFrame APIとSpark SQL、ストリーミング処理のためのSpark Streaming、機械学習ライブラリMLlib、グラフ処理のためのGraphXの各コンポーネントの実践的な利用方法を基礎から徹底的に解説します。
関連記事
収録内容
1 | 第1章 Sparkの基礎 |
2 | 第2章 Sparkの導入 |
3 | 第3章 RDD |
4 | 第4章 クラスタ構築と運用 |
5 | 第5章 DataFrameとSpark SQL |
6 | 第6章 Spark Streaming |
7 | 第7章 MLlib |
8 | 第8章 GraphX |
9 | Appendix YARN |