| Python机器学习基础教程 | ||
| 定价 | 79.00 | |
| 出版社 | 人民邮电出版社 | |
| 版次 | 1 | |
| 出版时间 | 2018年01月 | |
| 开本 | 16开 | |
| 作者 | (德)安德里亚斯·穆勒 | |
| 装帧 | 平装 | |
| 页数 | ||
| 字数 | ||
| ISBN编码 | 9787115475619 | |
| 重量 | ||
本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中zui常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高ji方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。
本书适合机器学习从业者或有志成为机器学习从业者的人阅读。
前言 ix
第1章 引言 1
1.1 为何选择机器学习 1
1.1.1 机器学习能够解决的问题 2
1.1.2 熟悉任务和数据 4
1.2 为何选择Python 4
1.3 scikit-learn 4
1.4 必要的库和工具 5
1.4.1 Jupyter Notebook 6
1.4.2 NumPy 6
1.4.3 SciPy 6
1.4.4 matplotlib 7
1.4.5 pandas 8
1.4.6 mglearn 9
1.5 Python 2与Python 3的对比 9
1.6 本书用到的版本 10
1.7 第壹个应用:鸢尾花分类 11
1.7.1 初识数据 12
1.7.2 衡量模型是否成功:训练数据与测试数据 14
1.7.3 要事第壹:观察数据 15
1.7.4 构建第壹个模型:k近邻算法 16
1.7.5 做出预测 17
1.7.6 评估模型 18
1.8 小结与展望 19
第2章 监督学习 21
2.1 分类与回归 21
2.2 泛化、过拟合与欠拟合 22
2.3 监督学习算法 24
2.3.1 一些样本数据集 25
2.3.2 k 近邻 28
2.3.3 线性模型 35
2.3.4 朴素贝叶斯分类器 53
2.3.5 决策树 54
2.3.6 决策树集成 64
2.3.7 核支持向量机 71
2.3.8 神经网络(深度学习) 80
2.4 分类器的不确定度估计 91
2.4.1 决策函数 91
2.4.2 预测概率 94
2.4.3 多分类问题的不确定度 96
2.5 小结与展望 98
第3章 无监督学习与预处理 100
3.1 无监督学习的类型 100
3.2 无监督学习的挑战 101
3.3 预处理与缩放 101
3.3.1 不同类型的预处理 102
3.3.2 应用数据变换 102
3.3.3 对训练数据和测试数据进行相同的缩放 104
3.3.4 预处理对监督学习的作用 106
3.4 降维、特征提取与流形学习 107
3.4.1 主成分分析 107
3.4.2 非负矩阵分解 120
3.4.3 用t-SNE进行流形学习 126
3.5 聚类 130
3.5.1 k 均值聚类 130
3.5.2 凝聚聚类 140
3.5.3 DBSCAN 143
3.5.4 聚类算法的对比与评估 147
3.5.5 聚类方法小结 159
3.6 小结与展望 159
第4章 数据表示与特征工程 161
4.1 分类变量 161
4.1.1 One-Hot编码(虚拟变量) 162
4.1.2 数字可以编码分类变量 166
4.2 分箱、离散化、线性模型与树 168
4.3 交互特征与多项式特征 171
4.4 单变量非线性变换 178
4.5 自动化特征选择 181
4.5.1 单变量统计 181
4.5.2 基于模型的特征选择 183
4.5.3 迭代特征选择 184
4.6 利用专家知识 185
4.7 小结与展望 192
第5章 模型评估与改进 193
5.1 交叉验证 194
5.1.1 scikit-learn中的交叉验证 194
5.1.2 交叉验证的优点 195
5.1.3 分层k 折交叉验证和其他策略 196
5.2 网格搜索 200
5.2.1 简单网格搜索 201
5.2.2 参数过拟合的风险与验证集 202
5.2.3 带交叉验证的网格搜索 203
5.3 评估指标与评分 213
5.3.1 牢记zui终目标 213
5.3.2 二分类指标 214
5.3.3 多分类指标 230
5.3.4 回归指标 232
5.3.5 在模型选择中使用评估指标 232
5.4 小结与展望 234
第6章 算法链与管道 236
6.1 用预处理进行参数选择 237
6.2 构建管道 238
6.3 在网格搜索中使用管道 239
6.4 通用的管道接口 242
6.4.1 用make_pipeline方便地创建管道 243
6.4.2 访问步骤属性 244
6.4.3 访问网格搜索管道中的属性 244
6.5 网格搜索预处理步骤与模型参数 246
6.6 网格搜索选择使用哪个模型 248
6.7 小结与展望 249
我刚结束了学习 Python 机器学习的征程,真的太棒了!这本书的讲解方式简直是为初学者量身定制的,清晰明了,一点也不觉得枯燥。作者循序渐进地介绍了机器学习的基本概念,从最基础的算法,比如线性回归、逻辑回归,到更高级的模型,像是支持向量机和决策树,都讲得特别透彻。而且,这本书非常注重实操,每讲完一个概念,都会配上相应的 Python 代码示例。我尤其喜欢的是,它并没有直接扔给你一堆复杂的代码,而是一步一步地解释代码的逻辑,让你知道为什么这么写,这样做有什么意义。通过这些例子,我不仅学会了如何运用这些算法,更重要的是理解了它们背后的原理。书中的数据集也都很有代表性,涵盖了分类、回归、聚类等常见的机器学习任务。我跟着书本一步步实践,感觉自己真的掌握了将理论转化为实际应用的能力。对于那些和我一样,对机器学习充满好奇,又不知道从何入手的朋友们,这本书绝对是你们的绝佳选择。它不仅打开了我认识机器学习世界的大门,更让我对未来深入学习打下了坚实的基础。
评分我一直对人工智能充满了向往,但总觉得它离我太遥远。这本书的出现,彻底改变了我的看法。它用一种非常亲切、接地气的方式,将复杂的人工智能概念分解成易于理解的模块。我发现,原来机器学习并不是什么高不可攀的学科,它就隐藏在我们的日常生活中,并且可以被我们掌握。书中对一些经典的机器学习算法的介绍,比如 K-Means 聚类、朴素贝叶斯等,都非常直观。作者通过生动的类比和清晰的图示,让我能够迅速理解它们的工作原理。我尤其喜欢的是书中关于如何评估模型性能的部分,它让我明白了,一个好的模型不仅仅是能够做出预测,更重要的是它能够做出准确、可靠的预测。通过跟随书中的代码示例,我不仅学会了如何使用 Python 实现这些算法,更重要的是,我开始能够自己思考如何应用这些技术来解决一些身边的问题。这本书真的就像是一个引路人,它没有让我直接面对大海,而是先带我在岸边戏水,让我逐渐建立了信心,并让我渴望去探索更广阔的海洋。
评分说实话,我之前对编程和数据分析都有些畏惧,感觉自己很难学得会。但是,自从我开始阅读这本书,我的想法完全改变了!作者用非常通俗易懂的语言,将 Python 编程和机器学习的入门知识串联了起来。对于完全零基础的我来说,书中的每一步都显得格外友好。它并没有一开始就抛出复杂的数学公式或者晦涩的概念,而是从 Python 的基础语法开始,逐步引导读者上手。我跟着书中的例子,学会了如何安装必要的库,如何导入和处理数据,以及如何构建一个简单的机器学习模型。更重要的是,这本书强调了“动手实践”的重要性,每一个章节都附带了实际操作的代码,让我可以边学边练。我最喜欢的是书中关于数据可视化的部分,通过图表直观地展示数据和模型的结果,让我对数据的理解更加深刻,也更能感受到机器学习的神奇之处。这本书让我第一次体会到,原来学习编程和数据分析可以这么有趣,这么有成就感。它不仅教会了我技术,更重要的是,它点燃了我继续探索数据科学世界的兴趣。
评分我最近在深度学习领域钻研,发现这本书为我提供了非常宝贵的视角,尽管它侧重于更基础的机器学习。这本书最大的亮点在于它对“为什么”的解释,而不是仅仅罗列“怎么做”。作者深入浅出地阐述了机器学习的核心思想,比如偏差-方差权衡、过拟合与欠拟合的根源,以及如何通过特征工程来提升模型性能。读这本书就像是和一位经验丰富的导师对话,他会引导你思考问题的本质,而不是给你现成的答案。我特别喜欢它关于模型评估的部分,讲解了准确率、召回率、F1分数等各种评价指标的含义、适用场景以及它们之间的权衡关系。书中关于正则化的讲解也让我茅塞顿开,理解了 L1 和 L2 正则化为何能有效防止过拟合。此外,书中还介绍了一些经典的机器学习算法,虽然可能不是最新最前沿的,但它们却是理解更复杂模型的基础。通过对这些基础算法的深入理解,我发现自己在学习深度学习的各种网络结构时,能够更快地抓住核心思想,并且更能理解它们之间的联系。这本书的价值在于其深刻的理论洞察力,能够帮助读者建立起扎实的机器学习理论框架,这对任何想要在人工智能领域走得更远的人来说,都是不可或缺的。
评分我最近一直在关注如何将机器学习应用于实际业务场景,这本书为我提供了一些非常有价值的启发。虽然书中介绍的算法和技术相对基础,但其核心思想和解决问题的思路却非常实用。作者通过一系列贴近实际的案例,展示了如何利用机器学习来解决诸如客户流失预测、产品推荐、欺诈检测等问题。我特别欣赏的是书中关于特征选择和特征工程的讲解,它强调了在实际应用中,如何从原始数据中提取出有价值的特征,并对这些特征进行有效的处理,这对于构建高性能的模型至关重要。书中还讨论了模型的可解释性问题,以及如何理解模型的预测结果,这在很多需要决策支持的场景下是不可或缺的。这本书并没有过多地纠缠于复杂的数学推导,而是侧重于如何将机器学习的工具应用到解决实际问题中。它让我意识到,很多时候,一个简单而有效的模型,比一个过于复杂但难以理解的模型更有价值。这本书的价值在于它能够帮助读者建立起一个将机器学习理念落地到业务中的思维框架,这对于那些希望利用技术提升业务效率和竞争力的从业者来说,是非常宝贵的。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有