9787111595137 9787111593737
机器学习算法
内容简介本书采用理论与实践相结合的方式,在简明扼要地阐明机器学习原理的基础上,通过大量实例介绍了不同场景下机器学习算法在scikit-learn中的实现及应用。书中有大量的代码示例及图例,便于读者理解和学习并实际上手操作。另一方面,书中还有很多的延伸阅读指导,方便读者性地了解机器学习领域的现有技术及其发展状况。
译者序
前言
作者简介
审校人员简介
1章 机器学习简介1
1.1 经典机器和自适应机器简介1
1.2 机器学习的分类2
1.2.1 监督学习3
1.2.2 无监督学习5
1.2.3 强化学习7
1.3 越机器学习——深度学习和仿生自适应8
1.4 机器学习和大数据9
延伸阅读10
本章小结10
2章 机器学习的重要元素11
2.1 数据格式11
2.2 可学习性13
2.2.1 欠拟合和过拟合15
2.2.2 误差度量16
2.2.3 PAC学习18
目录
前言
致谢
第1章引言
1.1自然语言处理的挑战
1.2神经网络和深度学习
1.3自然语言处理中的深度学习
1.4本书的覆盖面和组织结构
1.5本书未覆盖的内容
1.6术语
1.7数学符号
注释
部分有监督分类与前馈神经网络
第2章学习基础与线性模型
2.1有监督学习和参数化函数
2.2训练集、测试集和验证集
2.3线性模型
2.3.1二分类
2.3.2对数线性二分类
2.3.3多分类
2.4表示
2.5独热和稠密向量表示
2.6对数线性多分类
2.7训练和优化
2.7.1损失函数
2.7.2正则化
2.8基于梯度的优化
2.8.1随机梯度下降
2.8.2实例
2.8.3其他训练方法
第3章从线性模型到多层感知器
3.1线性模型的局限性:异或问题
3.2非线性输入转换
3.3核方法
3.4可训练的映射函数
第4章前馈神经网络
4.1一个关于大脑的比喻
4.2数学表示
4.3表达能力
4.4常见的非线性函数
4.5损失函数
4.6正则化与丢弃法
4.7相似和距离层
4.8嵌入层
第5章神经网络训练
5.1计算图的抽象概念
5.1.1前向计算
5.1.2反向计算(导数、反向传播)
5.1.3软件
5.1.4实现流程
5.1.5网络构成
5.2实践经验
5.2.1优化算法的选择
5.2.2初始化
5.2.3重启与集成
5.2.4梯度消失与梯度爆炸
5.2.5饱和神经元与死神经元
5.2.6随机打乱
5.2.7学习率
5.2.8minibatch
第二部分处理自然语言数据
第6章文本特征构造
6.1NLP分类问题中的拓扑结构
6.2NLP问题中的特征
6.2.1直接可观测特征
6.2.2可推断的语言学特征
6.2.3核心特征与组合特征
6.2.4n元组特征
6.2.5分布特征
第7章NLP特征的案例分析
7.1文本分类:语言识别
7.2文本分类:主题分类
7.3文本分类:作者归属
7.4上下文中的单词:词性标注
7.5上下文中的单词:命名实体识别
7.6上下文中单词的语言特征:介词词义消歧
7.7上下文中单词的关系:弧分解分析
第8章从文本特征到输入
8.1编码分类特征
8.1.1独热编码
8.1.2稠密编码(特征嵌入)
8.1.3稠密向量与独热表示
8.2组合稠密向量
8.2.1基于窗口的特征
8.2.2可变特征数目:连续词袋
8.3独热和稠密向量间的关系
8.4杂项
8.4.1距离与位置特征
8.4.2补齐、未登录词和词丢弃
8.4.3特征组合
8.4.4向量共享
8.4.5维度
8.4.6嵌入的词表
8.4.7网络的输出
8.5例子:词性标注
8.6例子:弧分解分析
第9章语言模型
9.1语言模型任务
9.2语言模型评估:困惑度
9.3语言模型的传统方法
9.3.1延伸阅读
9.3.2传统语言模型的限制
9.4神经语言模型
9.5使用语言模型进行生成
9.6副产品:词的表示
第10章预训练的词表示
10.1随机初始化
10.2有监督的特定任务的预训练
10.3无监督的预训练
10.4词嵌入算法
10.4.1分布式假设和词表示
10.4.2从神经语言模型到分布式表示
10.4.3词语联系
10.4.4其他算法
10.5上下文的选择
10.5.1窗口方法
10.5.2句子、段落或文档
10.5.3句法窗口
10.5.4多语种
10.5.5基于字符级别和子词的表示
10.6处理多字单元和字变形
10.7分布式方法的限制
第11章使用词嵌入
11.1词向量的获取
11.2词的相似度
11.3词聚类
11.4寻找相似词
11.5同中选异
11.6短文档相似度
11.7词的类比
11.8改装和映射
11.9实用性和陷阱
第12章案例分析:一种用于句子意义推理的前馈结构
12.1自然语言推理与 SNLI数据集
12.2文本相似网络
第三部分特殊的结构
第13章n元语法探测器:卷积神经网络
13.1基础卷积池化
13.1.1文本上的一维卷积
13.1.2向量池化
13.1.3变体
13.2其他选择:特征哈希
13.3层次化卷积
第14章循环神经网络:序列和栈建模
14.1RNN抽象描述
14.2RNN的训练
14.3RNN常见使用模式
14.3.1接收器
14.3.2编码器
14.3.3传感器
14.4双向RNN
14.5堆叠RNN
14.6用于表示栈的RNN
14.7文献阅读的注意事项
第15章实际的循环神经网络结构
15.1作为RNN的CBOW
15.2简单RNN
15.3门结构
15.3.1长短期记忆网络
15.3.2门限循环单元
15.4其他变体
15.5应用到RNN的丢弃机制
第16章通过循环网络建模
16.1接收器
16.1.1情感分类器
16.1.2主谓一致语法检查
16.2作为特征提取器的RNN
16.2.1词性标注
16.2.2RNN�睠NN文本分类
16.2.3弧分解依存句法分析
第17章条件生成
17.1RNN生成器
17.2条件生成(编码器)
17.2.1序列到序列模型
17.2.2应用
17.2.3其他条件上下文
17.3无监督的句子相似性
17.4结合注意力机制的条件生成
17.4.1计算复杂性
17.4.2可解释性
17.5自然语言处理中基于注意力机制的模型
17.5.1机器翻译
17.5.2形态屈折
17.5.3句法分析
第四部分其他主题
第18章用递归神经网络对树建模
18.1形式化定义
18.2扩展和变体
18.3递归神经网络的训练
18.4一种简单的替代——线性化树
18.5前景
第19章结构化输出预测
19.1基于搜索的结构化预测
19.1.1基于线性模型的结构化预测
19.1.2非线性结构化预测
19.1.3概率目标函数(CRF)
19.1.4近似搜索
19.1.5重排序
19.1.6参考阅读
19.2贪心结构化预测
19.3条件生成与结构化输出预测
19.4实例
19.4.1基于搜索的结构化预测:一阶依存句法分析
19.4.2基于Neural�睠RF的命名实体识别
19.4.3基于柱搜索的NER�睠RF近似
第20章级联、多任务与半监督学习
20.1模型级联
20.2多任务学习
20.2.1多任务设置下的训练
20.2.2选择性共享
20.2.3作为多任务学习的词嵌入预训练
20.2.4条件生成中的多任务学习
20.2.5作为正则的多任务学习
20.2.6注意事项
20.3半监督学习
20.4实例
20.4.1眼动预测与句子压缩
20.4.2弧标注与句法分析
20.4.3介词词义消歧与介词翻译预测
20.4.4条件生成:多语言机器翻译、句法分析以及图像描述生成
20.5前景
第21章结论
21.1我们学到了什么
21.2未来的挑战
参考文献
我必须要给这本关于生物信息学中的统计建模的书点个赞!内容涉及的领域非常前沿,涵盖了从基因表达谱分析到蛋白质结构预测的统计方法。这本书的厉害之处在于,它没有回避复杂的统计学工具,而是将贝叶斯推断和马尔可夫链蒙特卡洛(MCMC)方法,毫不含糊地应用到了实际的生物数据集上。作者提供了大量的R和Python代码示例,手把手教你如何处理高维、稀疏的生物数据。我特别欣赏它在讨论降维技术时,不仅讲解了PCA,还深入探讨了t-SNE在可视化高维空间中的优缺点。如果你在做科研,需要用严谨的统计学方法来解释实验结果,这本书无疑是一座知识的灯塔,让你在数据海洋中不再迷失方向。
评分这是一本关于高级数据库系统架构的实战手册,简直是运维和架构师的案头必备!我过去在处理高并发读写时总有些模糊不清的概念,这本书直接把CAP理论放在了不同的分布式数据库(如Cassandra和PostgreSQL集群)的实际部署案例中进行对比分析。它详细剖析了MVCC(多版本并发控制)在不同隔离级别下的具体实现细节,这一点对我优化慢查询帮助太大了。书中还包含了大量的SQL性能调优的实战技巧,比如索引失效的常见陷阱、事务隔离级别的选择策略等,甚至还涉及到了最新的NewSQL数据库的架构优选。对于希望从“会用”数据库升级到“精通”数据库内核的专业人士来说,这本书的价值无法估量,我感觉我的系统性能至少能提升30%!
评分说实话,我本来对量子信息与计算这个主题是有点望而生畏的,总觉得它离我的日常工作太遥远了。但这本书的叙事方式简直是化腐朽为神奇!作者没有一上来就抛出薛定谔方程,而是从最基础的量子比特(Qubit)概念讲起,用非常形象的比喻解释了叠加态和纠缠的魔力。我印象最深的是关于Shor算法的章节,它不是简单地给出公式,而是用历史的视角,讲解了为什么这个算法的出现会对现有的加密体系造成颠覆性的影响。阅读体验非常流畅,那种“豁然开朗”的感觉贯穿始终。如果你对未来计算技术抱有好奇心,想了解一下超越经典计算机的极限在哪里,这本书绝对是你的最佳启蒙读物,读完后对“不确定性”的理解都上升到了一个新的哲学高度。
评分终于找到一本能把计算机图形学中的渲染管线讲得如此透彻的书了!这本书的侧重点似乎更偏向于底层实现,特别是对光线追踪(Ray Tracing)算法的数学基础进行了百科全书式的梳理。它从向量代数的基础开始,逐步构建出如何精确计算光线与复杂曲面(如Bézier曲面)的交点,以及如何高效地管理场景中的几何数据结构(如BVH树)。书中关于全局光照和着色模型的章节,简直是艺术品级别的讲解,它让你明白为什么电影里的画面看起来如此真实。我过去总觉得PBR(基于物理的渲染)很玄乎,读完这本书后,我终于明白了菲涅尔效应和微上面模型背后的物理学原理。这本书对于想深入理解游戏引擎底层渲染机制或从事专业视觉特效制作的人来说,是不可多得的内功心法。
评分哇,最近刚看完这本关于图论与网络流的宝典,简直是为我这种理论派的工程师量身定做的!这本书的深度和广度都超乎我的想象。它不是那种浮于表面的入门读物,而是扎扎实实地把Kruskal和Prim算法的每一步推导都讲得清清楚楚,连那些看似微不足道的边界条件都考虑进去了。特别是讲到最大流最小割定理那几章,作者引入了一个非常巧妙的例子,用一个复杂的城市交通调度问题来贯穿始终,让你在实际应用中理解那些枯燥的数学公式的意义。我花了整整一个周末才把“多项式时间复杂度”和“NP完全性”那部分吃透,书中对NP-Hard问题的各种近似算法的讨论非常到位,推荐给所有想在算法竞赛中有所突破的朋友们,绝对能帮你把理论基础打得比钻石还硬!
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有