市面上N0.1本关于Hadoop与Spark大数据处理技巧的教程,提供了丰富的算法和工具。
《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。
主要内容包括:
■ 完成超大量交易的购物篮分析。
■ 数据挖掘算法(K-均值、KNN和朴素贝叶斯)。
■ 使用超大基因组数据完成DNA和RNA测序。
■ 朴素贝叶斯定理和马尔可夫链实现数据和市场预测。
■ 推荐算法和成对文档相似性。
■ 线性回归、Cox回归和皮尔逊(Pearson)相关分析。
■ 等位基因频率和DNA挖掘。
■ 社交网络分析(推荐系统、三角形计数和情感分析)。
Mahmoud Parsian,计算机科学博士,是一位热衷于实践的软件专家,作为开发人员、设计人员、架构师和作者,他有30多年的软件开发经验。目前领导着Illumina的大数据团队,在过去15年间,他主要从事Java (服务器端)、数据库、MapReduce和分布式计算的有关工作。Mahmoud还著有《JDBC Recipes》和《JDBC Metadata, MySQL,and Oracle Recipes》等书(均由Apress出版)。
质量杠杠的,一定要认真的要读这本书,然后去jd面试去,哈哈!
评分质量不错,跟小时候的书香一摸一样,沁人心脾
评分很好,优惠力度很大,趁着618又购入了一大波书单
评分内部丰富,讲解深入,批注清楚,排版素雅。
评分好大一只皮皮虾纸质有点偏软
评分不错,很好用,很棒
评分一次买了好几本,够看好长时间了
评分质量非常好,与卖家描述的完全一致,非常满意,真的很喜欢,完全超出期望值,发货速度非常快,包装非常仔细、严实,物流公司服务态度很好,运送速度很快,遇到售后问题也是有问必答??
评分很信赖京东,书是正品,质量很好,字迹清晰,纸张厚实,下次还会再来,有活动买起来更合适呢
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有