編輯推薦
適讀人群 :《Hadoop生態係統》廣大讀者。 本書將幫助你決定Hadoop中哪些組件適閤完成你的項目。
內容簡介
《Hadoop生態係統》本書每一章都介紹瞭不同的主題(例如核心技術或數據傳輸),並且解釋瞭為什麼特定組件適用或不適用特定的需求。對於數據處理來說,使用Hadoop是一個全新的挑戰,但如果有瞭這本便利的參考書,你將很容易領會使用Hadoop的精妙所在。
主要包括如下主題:核心技術,Hadoop分布式文件係統(HDFS)、MapReduce、YARN和Spark。數據庫和數據管理,Cassandra、HBase、MongoDB和Hive。序列化,Avro、JSON和Parquet。管理和監視,Puppet、Chef、Zookeeper和Oozie。分析輔助,Pig、Mahout和MLLib。數據傳輸,Scoop、Flume、distcp和Storm。安全、訪問控製和審計,Sentry、Kerberos和Knox。雲計算和虛擬化,Serengeti、Docker和Whirr。
作者簡介
Kevin Sitto,是Pivotal Software公司的領域解決方案工程師,主要為客戶提供谘詢服務,幫助客戶理解和描述大數據需求。
Marshall Presser,是Pivotal Data Engineering集團的成員。他幫助客戶使用Hadoop、關係數據庫和內存數據網格來解決復雜的分析問題。
目錄
前言 1
第1章關鍵技術 7
1.1 Hadoop分布式文件係統(HDFS) 8
1.2 MapReduce . 11
1.3 YARN 13
1.4 Spark . 15
第2章數據庫及數據管理 17
2.1 Cassandra .19
2.2 HBase 21
2.3 Accumulo .24
2.4 Memcached . 26
2.5 Blur .28
2.6 Solr . 30
2.7 MongoDB 32
2.8 Hive 34
2.9 Spark SQL ( 前身是 Shark) 36
2.10 Giraph . 38
第3章序列化 41
3.1 Avro 43
3.2 JSON 46
3.3 Protocol Buffers (protobuf) . 48
3.4 Parquet 50
第4章管理與監控. 53
4.1 Ambari 54
4.2 HCatalog 56
4.3 Nagios 58
4.4 Puppet 59
4.5 Chef 61
4.6 ZooKeeper 63
4.7 Oozie . 66
4.8 Ganglia . 68
第5章分析輔助 . 69
5.1 MapReduce 接口69
5.2 分析庫 70
5.3 Pig 72
5.4 Hadoop Streaming 74
5.5 Mahout 76
5.6 MLLib 78
5.7 Hadoop 圖像處理接口(HIPI) 80
5.8 SpatialHadoop 81
第6章數據傳輸 . 83
6.1 Sqoop .85
6.2 Flume .87
6.3 DistCp 89
6.4 Storm . 90
第7章安全、訪問控製和審計 93
7.1 Sentry. 95
7.2 Kerberos 97
7.3 Knox 99
第8章雲計算和虛擬化 101
8.1 Serengeti. 103
8.2 Docker105
8.3 Whirr 107
Hadoop生態係統 epub pdf mobi txt 電子書 下載 2024
Hadoop生態係統 下載 epub mobi pdf txt 電子書
評分
☆☆☆☆☆
做活動買的,很劃算
評分
☆☆☆☆☆
嗬嗬紅紅火火就好好
評分
☆☆☆☆☆
還沒看,相信自己的直覺,這應該是本好書,雖然直覺從來沒準過
評分
☆☆☆☆☆
618活動力度大,先買著再說,日後必有用
評分
☆☆☆☆☆
書收到,還沒開封,好評。
評分
☆☆☆☆☆
質量非常好,與賣傢描述的完全一緻,非常滿意,真的很喜歡,完全超齣期望值,發貨速度非常快,包裝非常仔細、嚴實,物流公司服務態度很好,運送速度很快,遇到售後問題也是有問必答??
評分
☆☆☆☆☆
送貨一如既往的快,東西也很好,好評。
評分
☆☆☆☆☆
獨自在這命運裏拓荒
評分
☆☆☆☆☆
還沒看,但是目錄裏麵寫著的內容還是蠻吸引人的,有空看瞭再評價