| 图书名称: | Python机器学习基础教程 |
| 作 者: | 安德里亚斯·穆勒 |
| 定价: | 79.00 |
| ISBN号: | 9787115475619 |
| 出版社: | 人民邮电出版社 |
| 开本: | 16 |
| 装帧: | 平装 |
| 出版日期: | 2018-1-1 |
| 印刷日期: | 2018-1-1 |
前言 ix
1 章 引言 1
1.1 为何选择机器学习 1
1.1.1 机器学习能够解决的问题 2
1.1.2 熟悉任务和数据 4
1.2 为何选择Python 4
1.3 scikit-learn 4
1.4 必要的库和工具 5
1.4.1 Jupyter Notebook 6
1.4.2 NumPy 6
1.4.3 SciPy 6
1.4.4 matplotlib 7
1.4.5 pandas 8
1.4.6 mglearn 9
1.5 Python 2 与Python 3 的对比 9
1.6 本书用到的版本 10
1.7 个应用:鸢尾花分类 11
1.7.1 初识数据 12
1.7.2 衡量模型是否成功:训练数据与测试数据 14
1.7.3 要事 :观察数据 15
1.7.4 构建 个模型:k 近邻算法 16
1.7.5 做出预测 17
1.7.6 评估模型 18
1.8 小结与展望 19
2 章 监督学习 21
2.1 分类与回归 21
2.2 泛化、过拟合与欠拟合 22
2.3 监督学习算法 24
2.3.1 些样本数据集 25
2.3.2 k 近邻 28
2.3.3 线性模型 35
2.3.4 朴素贝叶斯分类器 53
2.3.5 决策树 54
2.3.6 决策树集成 64
2.3.7 核支持向量机 71
2.3.8 神经网络(深度学习) 80
2.4 分类器的不确定度估计 91
2.4.1 决策函数 91
2.4.2 预测概率 94
2.4.3 多分类问题的不确定度 96
2.5 小结与展望 98
3 章 无监督学习与预处理 100
3.1 无监督学习的类型 100
3.2 无监督学习的挑战 101
3.3 预处理与缩放 101
3.3.1 不同类型的预处理 102
3.3.2 应用数据变换 102
3.3.3 对训练数据和测试数据进行相同的缩放 104
3.3.4 预处理对监督学习的作用 106
3.4 降维、特征提取与流形学习 107
3.4.1 主成分分析 107
3.4.2 非负矩阵分解 120
3.4.3 用t-SNE 进行流形学习 126
3.5 聚类 130
3.5.1 k 均值聚类 130
3.5.2 凝聚聚类 140
3.5.3 DBSCAN 143
3.5.4 聚类算法的对比与评估 147
3.5.5 聚类方法小结 159
3.6 小结与展望 159
4 章 数据表示与特征工程 161
4.1 分类变量 161
4.1.1 One-Hot 编码(虚拟变量) 162
4.1.2 数字可以编码分类变量 166
4.2 分箱、离散化、线性模型与树 168
4.3 交互特征与多项式特征 171
4.4 单变量非线性变换 178
4.5 自动化特征选择 181
4.5.1 单变量统计 181
4.5.2 基于模型的特征选择 183
4.5.3 迭代特征选择 184
4.6 利用专家知识 185
4.7 小结与展望 192
5 章 模型评估与改进 193
5.1 交叉验证 194
5.1.1 scikit-learn 中的交叉验证 194
5.1.2 交叉验证的优点 195
5.1.3 分层k 折交叉验证和其他策略 196
5.2 网格搜索 200
5.2.1 简单网格搜索 201
5.2.2 参数过拟合的风险与验证集 202
5.2.3 带交叉验证的网格搜索 203
5.3 评估指标与评分 213
5.3.1 牢记目标 213
5.3.2 二分类指标 214
5.3.3 多分类指标 230
5.3.4 回归指标 232
5.3.5 在模型选择中使用评估指标 232
5.4 小结与展望 234
6 章 算法链与管道 236
6.1 用预处理进行参数选择 237
6.2 构建管道 238
6.3 在网格搜索中使用管道 239
6.4 通用的管道接口 242
6.4.1 用make_pipeline 方便地创建管道 243
6.4.2 访问步骤属性 244
6.4.3 访问网格搜索管道中的属性 244
6.5 网格搜索预处理步骤与模型参数 246
6.6 网格搜索选择使用哪个模型 248
6.7 小结与展望 249
7 章 处理文本数据 250
7.1 用字符串表示的数据类型 250
7.2 示例应用:电影评论的情感分析 252
7.3 将文本数据表示为词袋 254
7.3.1 将词袋应用于玩具数据集 255
7.3.2 将词袋应用于电影评论 256
7.4 停用词 259
7.5 用tf-idf 缩放数据 260
7.6 研究模型系数 263
7.7 多个单词的词袋(n 元分词) 263
7.8 分词、词干提取与词形还原 267
7.9 主题建模与文档聚类 270
7.10 小结与展望 277
8 章 全书总结 278
8.1 处理机器学习问题 278
8.2 从原型到生产 279
8.3 测试生产系统 280
8.4 构建你自己的估计器 280
8.5 下步怎么走 281
8.5.1 理论 281
8.5.2 其他机器学习框架和包 281
8.5.3 排序、推荐系统与其他学习类型 282
8.5.4 概率建模、推断与概率编程 282
8.5.5 神经网络 283
8.5.6 推广到更大的数据集 283
8.5.7 磨练你的技术 284
8.6 总结 284
关于作者 285
关于封面 285
机器学习已成为许多商业应用和研究项目不可或缺的部分,海量数据使得机器学习的应用范围远超人们想象。本书将向所有对机器学习技术感兴趣的初学者展示,自己动手构建机器学习解决方案并非难事!
书中重点讨论机器学习算法的实践而不是背后的数学,全面涵盖在实践中实现机器学习算法的所有重要内容,帮助读者使用Python和scikit-learn库步步构建个有效的机器学习应用。
* 机器学习的基本概念及其应用
* 常用机器学习算法的优缺点
* 机器学习所处理的数据的表示方法,包括重点关注数据的哪些方面
* 模型评估和调参的方法
* 管道的概念
* 处理文本数据的方法,包括文本特有的处理方法
* 进步提高机器学习和数据科学技能的建议
本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了些文本特有的处理方法。
本书适合机器学习从业者或有志成为机器学习从业者的人阅读
作为一名有一定编程基础但对机器学习是新手的人,我对《正版 机器学习实战 python基础教程指南,python核心编程实例指导 python机》这本书抱有很高的期望。我希望它能提供一个从零开始的系统性学习路径,循序渐进地引导我进入机器学习的世界。我特别关注书中在数据可视化和探索性数据分析(EDA)方面的讲解。在实际的机器学习项目中,数据理解和分析往往是第一步,也是至关重要的一步。因此,我期待书中能教授如何使用Matplotlib、Seaborn等工具来绘制各种图表,从而更好地理解数据的分布、变量之间的关系,以及识别潜在的异常值和缺失值。 我希望书中不仅能教会我如何使用各种机器学习算法,还能让我理解这些算法的适用场景、优缺点以及背后的数学原理。例如,在介绍分类算法时,我希望书中能对比不同算法(如逻辑回归、支持向量机、K近邻、朴素贝叶斯、决策树、随机森林等)在不同数据集上的表现,并分析它们在准确率、召回率、F1分数等评估指标上的差异。同时,我也希望书中能提及一些模型调优的技术,比如网格搜索、随机搜索、交叉验证等,让我能够通过实际操作来提高模型的性能。
评分这本书的标题虽然有点长,但“python基础教程指南”和“python核心编程实例指导”这些字眼,足以引起我这个Python学习者的兴趣。我已经在Python方面有了一些基础,但很多时候在处理复杂的数据科学任务时,总觉得自己的Python功底还不够扎实,尤其是在面向对象编程和一些高级的库的使用方面。我希望这本书能够在我现有的Python知识之上,提供更深入的讲解,尤其是在数据处理和分析方面,如何更高效、更Pythonic地编写代码。 我尤其期待书中在“核心编程实例指导”部分,能够展示一些将Python语言特性与机器学习算法相结合的例子。比如,如何利用Python的装饰器来优化模型的训练过程,如何使用生成器来处理大规模数据集以节省内存,或者如何利用多线程/多进程来加速模型的训练。不仅仅是算法的调用,而是真正理解如何在Python层面进行优化和工程化实现。如果能有一些关于Python代码风格、性能调优以及调试技巧的建议,那就更完美了。
评分作为一名对机器学习充满热情但又担心学习门槛的业余爱好者,我被《正版 机器学习实战 python基础教程指南,python核心编程实例指导 python机》的名称所吸引。我深知Python是目前机器学习领域最主流的编程语言,而“实战”和“实例指导”则意味着我可以通过动手实践来掌握知识,而不是仅仅停留在理论层面。我希望这本书能够为我提供一个坚实的Python基础,让我能够无障碍地进行后续的机器学习学习。 我尤其关注书中在数据预处理和特征工程方面的讲解。我知道,在真实的机器学习项目中,数据质量直接影响着模型的性能。因此,我期待书中能够详细介绍如何处理缺失值、异常值,如何进行数据标准化、归一化,如何进行特征编码、特征选择等等。我希望书中能够通过实际案例,展示这些步骤是如何在Python中实现的,并解释每一步的目的和重要性。如果书中还能提及一些常用的数据处理库,如Pandas的高级用法,那将非常有帮助。
评分作为一个对机器学习领域充满好奇的初学者,我最近入手了一本广受好评的书籍,名为《正版 机器学习实战 python基础教程指南,python核心编程实例指导 python机》。尽管书名有些冗长,但我被其中“实战”、“基础教程”、“核心编程”、“实例指导”等关键词深深吸引。我抱持着能够迅速上手,通过实际操作来理解机器学习原理的期望。 在阅读初期,我最看重的是书籍能否提供清晰易懂的Python基础知识。毕竟,Python是实现机器学习算法的通用语言,没有扎实的Python基础,后续的学习将举步维艰。我期待书中能够详细讲解Python的变量、数据类型、控制流、函数、类等基本概念,并且能够通过丰富的代码示例来辅助理解。特别是对于数据结构,如列表、元组、字典、集合的深入剖析,以及文件I/O操作的演示,都将是我关注的重点。只有打牢了Python的根基,我才能更自信地去探索机器学习的奥秘。
评分这本书的另一大吸引力在于其“机器学习实战”的承诺。我明白,学习理论知识固然重要,但真正掌握一门技术,离不开大量的实践。因此,我非常期待书中能够提供一系列贴近实际应用的机器学习项目,从数据预处理、特征工程,到模型选择、训练、评估,每一个步骤都能够有详细的指导。我希望这些实例能够覆盖监督学习、无监督学习、甚至一些深度学习的基础概念,并且能够使用当下流行的机器学习库,如Scikit-learn、Pandas、NumPy等。如果书中还能提供每个项目的代码,并附带清晰的解释,那么学习效率将会大大提升。 我对书中“核心编程实例指导”的部分充满了期待。这意味着我不仅仅是被动地学习如何调用现成的函数,而是能够深入理解算法的底层实现逻辑。例如,对于线性回归、逻辑回归、决策树、支持向量机等经典算法,我希望能看到它们在Python中的具体代码实现,哪怕是简化的版本,也能帮助我建立起对算法原理的直观认识。通过理解代码,我才能更好地调试程序,优化模型,并在遇到问题时找到解决方案。这种深入的指导,对于我从“使用者”转变为“理解者”至关重要。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有