套裝三冊:
HBase權威指南
Hive編程指南
Hadoop權威指南:大數據的存儲與分析(第4版)修訂版
9787302465133 9787115333834 9787115318893
本書結閤理論和實踐,由淺入深,全方位介紹瞭Hadoop這一高性能的海量數據處理和分析平颱。全書5部分24章,第Ⅰ部分介紹Hadoop基礎知識,主題涉及Hadoop、MapReduce、Hadoop分布式文件係統、YARN、Hadoop的I/O操作。第Ⅱ部分介紹MapReduce,主題包括MapReduce應用開發;MapReduce的工作機製、MapReduce的類型與格式、MapReduce的特性。第Ⅲ部分介紹Hadoop的運維,主題涉及構建Hadoop集群、管理Hadoop。第Ⅳ部分介紹Hadoop相關開源項目,主題涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供瞭三個案例,分彆來自醫療衛生信息技術服務商塞納(Cerner)、微軟的人工智能項目ADAM(一種大規模分布式深度學習框架)和開源項目Cascading(一個新的針對MapReduce的數據處理API)。
本書是一本專業、全麵的Hadoop參考書和工具書,闡述瞭Hadoop生態圈的新發展和應用,程序員可以從中探索海量數據集的存儲和分析,管理員可以從中瞭解Hadoop集群的安裝和運維。
第Ⅰ部分Hadoop基礎知識
第1章初識Hadoop3
1.1數據!數據!3
1.2數據的存儲與分析5
1.3查詢所有數據6
1.4不僅僅是批處理7
1.5相較於其他係統的優勢8
1.6ApacheHadoop發展簡史12
1.7本書包含的內容16
第2章關於MapReduce19
2.1氣象數據集19
2.2使用Unix工具來分析數據21
2.3使用Hadoop來分析數據22
2.4橫嚮擴展31
2.5HadoopStreaming37
第3章Hadoop分布式文件係統42
3.1HDFS的設計42
3.2HDFS的概念44
3.3命令行接口50
3.4Hadoop文件係統52
3.5Java接口56
3.6數據流68
3.7通過distcp並行復製76
第4章關於YARN78
4.1剖析YARN應用運行機製79
4.2YARN與MapReduce1相比82
4.3YARN中的調度85
評分
評分
評分
評分
評分
評分
評分
評分
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.tinynews.org All Rights Reserved. 静思书屋 版权所有