9787111595137 9787111593737
机器学习算法
内容简介
本书采用理论与实践相结合的方式,在简明扼要地阐明机器学习原理的基础上,通过大量实例介绍了不同场景下机器学习算法在scikit-learn中的实现及应用。书中有大量的代码示例及图例,便于读者理解和学习并实际上手操作。另一方面,书中还有很多的延伸阅读指导,方便读者性地了解机器学习领域的现有技术及其发展状况。
目录
译者序
前言
作者简介
审校人员简介
1章 机器学习简介1
1.1 经典机器和自适应机器简介1
1.2 机器学习的分类2
1.2.1 监督学习3
1.2.2 无监督学习5
1.2.3 强化学习7
1.3 越机器学习——深度学习和仿生自适应8
1.4 机器学习和大数据9
延伸阅读10
本章小结10
2章 机器学习的重要元素11
2.1 数据格式11
2.2 可学习性13
2.2.1 欠拟合和过拟合15
2.2.2 误差度量16
2.2.3 PAC学习18
2.3 统计学习方法19
2.3.1 大后验概率学习20
2.3.2 大似然学习20
2.4 信息论的要素24
参考文献26
本章小结26
3章 特征选择与特征工程28
3.1 scikit-learn练习数据集28
3.2 创建训练集和测试集29
3.3 管理分类数据30
3.4 管理缺失特征33
3.5 数据缩放和归一化33
3.6 特征选择和过滤35
3.7 主成分分析37
3.7.1 非负矩阵分解42
3.7.2 稀疏PCA42
3.7.3 核PCA43
3.8 原子提取和字典学习45
参考文献47
本章小结47
4章 线性回归48
4.1 线性模型48
4.2 一个二维的例子48
4.3 基于scikit-learn的线性回归和更高维50
4.4 Ridge、Lasso和ElasticNet53
4.5 随机采样一致的鲁棒回归57
4.6 多项式回归58
4.7 保序回归60
参考文献62
本章小结62
5章 逻辑回归64
5.1 线性分类64
5.2 逻辑回归65
5.3 实现和优化67
5.4 随机梯度下降算法69
5.5 通过网格搜索找到优参数71
5.6 评估分类的指标73
5.7 ROC曲线77
本章小结79
6章 朴素贝叶斯81
6.1 贝叶斯定理81
6.2 朴素贝叶斯分类器82
6.3 scikit-learn中的朴素贝叶斯83
6.3.1 伯努利朴素贝叶斯83
6.3.2 多项式朴素贝叶斯85
6.3.3 高斯朴素贝叶斯86
参考文献89
本章小结89
7章 支持向量机90
7.1 线性支持向量机90
7.2 scikit-learn实现93
7.2.1 线性分类94
7.2.2 基于内核的分类95
7.2.3 非线性例子97
7.3 受控支持向量机101
7.4 支持向量回归103
参考文献104
本章小结104
8章 决策树和集成学习105
8.1 二元决策树105
8.1.1 二元决策106
8.1.2 不纯度的衡量107
8.1.3 特征重要度109
8.2 基于scikit-learn的决策树分类109
8.3 集成学习113
8.3.1 随机森林114
8.3.2 AdaBoost116
8.3.3 梯度树提升118
8.3.4 投票分类器120
参考文献122
本章小结122
9章 聚类基础124
9.1 聚类简介124
9.1.1 k均值聚类125
9.1.2 DBSCAN136
9.1.3 光谱聚类138
9.2 基于实证的评价方法139
9.2.1 同质性140
9.2.2 完整性140
9.2.3 修正兰德指数141
参考文献142
本章小结142
10章 层次聚类143
10.1 分层策略143
10.2 凝聚聚类143
10.2.1 树形图145
10.2.2 scikit-learn中的凝聚聚类147
10.2.3 连接限制149
参考文献151
本章小结152
11章 简介153
11.1 朴素的基于用户的153
11.2 基于内容的156
11.3 无模式(或基于内存的)协同过滤158
11.4 基于模型的协同过滤160
11.4.1 奇异值分解策略161
11.4.2 交替小二乘法策略163
11.4.3 用Apache Spark MLlib实现交替小二乘法策略164
参考文献167
本章小结167
12章 自然语言处理简介169
12.1 NLTK和内置语料库169
12.2 词袋策略171
12.2.1 标记172
12.2.2 停止词的删除174
12.2.3 词干提取175
12.2.4 向量化176
12.3 基于路透社语料库的文本分类器例子180
参考文献182
本章小结182
13章 自然语言处理中的主题建模与情感分析183
13.1 主题建模183
13.1.1 潜在语义分析183
13.1.2 概率潜在语义分析188
13.1.3 潜在狄利克雷分配193
13.2 情感分析198
参考文献202
本章小结202
14章 深度学习和TensorFlow简介203
14.1 深度学习简介203
14.1.1 人工神经网络203
14.1.2 深层结构206
14.2 TensorFlow简介208
14.2.1 计算梯度210
14.2.2 逻辑回归212
14.2.3 用多层感知器进行分类215
14.2.4 图像卷积218
14.3 Keras内部速览220
参考文献225
本章小结225
15章 构建机器学习框架226
15.1 机器学习框架226
15.1.1 数据收集227
15.1.2 归一化227
15.1.3 降维227
15.1.4 数据扩充228
15.1.5 数据转换228
15.1.6 建模、网格搜索和交叉验证229
15.1.7 可视化229
15.2 用于机器学习框架的scikit-learn工具229
15.2.1 管道229
15.2.2 特征联合232
参考文献233
本章小结233
基于深度学习的自然语言处理
内容简介本书重点介绍了神经网络模型在自然语言处理中的应用。首先介绍有监督的机器学习和前馈神经网络的基本知识,如何将机器学习方法应用在自然语言处理中,以及词向量表示(而不是符号表示)的应用。然后介绍更多专门的神经网络结构,包括一维卷积神经网络、循环神经网络、条件生成模型和基于注意力的模型。后,讨论树形网络、结构化预测以及多任务学习的前景。
目录
前言
致谢
第1章引言
1.1自然语言处理的挑战
1.2神经网络和深度学习
1.3自然语言处理中的深度学习
1.4本书的覆盖面和组织结构
1.5本书未覆盖的内容
1.6术语
1.7数学符号
注释
部分有监督分类与前馈神经网络
第2章学习基础与线性模型
2.1有监督学习和参数化函数
2.2训练集、测试集和验证集<
现货 正版 机器学习算法+基于深度学习的自然语言处理 2本 人工智能语音识别技术教程书籍 epub pdf mobi txt 电子书 下载 2025
现货 正版 机器学习算法+基于深度学习的自然语言处理 2本 人工智能语音识别技术教程书籍 下载 epub mobi pdf txt 电子书 2025
现货 正版 机器学习算法+基于深度学习的自然语言处理 2本 人工智能语音识别技术教程书籍 mobi pdf epub txt 电子书 下载 2025
现货 正版 机器学习算法+基于深度学习的自然语言处理 2本 人工智能语音识别技术教程书籍 epub pdf mobi txt 电子书 下载 2025