深入浅出深度学习:原理剖析与Python实践
定价: 79.00元
作者: 黄安埠
出版社:电子工业出版社
ISBN:9787121312700
上架时间:2017-5-12
出版日期:2017 年5月
开本:16开
页码:344
版次:1-1
所属分类:计算机
编辑推荐
本书*大的特色在于取舍明确,一切无助于迅速理解深度学习精髓的内容全被摒弃了,并着重阐述了技术上的重点和难点;表达上深入浅出:即便是从未接触过AI知识的人,也能从作者简明清晰的表述中,一窥深度学习的殿堂。
对任何一位想成为AI/深度学习领域工程师的读者来说,《深入浅出深度学习:原理剖析与Python实践》能帮你迅速打开AI的大门,并成长为一名合格的AI工程师。
计算机书籍
《深入浅出深度学习:原理剖析与Python实践》介绍了深度学习相关的原理与应用,全书共分为三大部分,,部分主要回顾了深度学习的发展历史,以及Theano的使用;第二部分详细讲解了与深度学习相关的基础知识,包括线性代数、概率论、概率图模型、机器学习和*优化算法;在第三部分中,针对若干核心的深度学习模型,如自编码器、受限玻尔兹曼机、递归神经网络和卷积神经网络等进行详细的原理分析与讲解,并针对不同的模型给出相应的具体应用。
《深入浅出深度学习:原理剖析与Python实践》适合有一定高等数学、机器学习和Python编程基础的在校学生、高校研究者或在企业中从事深度学习的工程师使用,书中对模型的原理与难点进行了深入分析,在每一章的*后都提供了详细的参考文献,读者可以对相关的细节进行更深入的研究。*后,理论与实践相结合,《深入浅出深度学习:原理剖析与Python实践》针对常用的模型分别给出了相应的应用,读者也可以在Github中下载和查看《深入浅出深度学习:原理剖析与Python实践》的代码(https://github.com/innovation-cat/DeepLearningBook)。
作译者
黄安埠,2012年毕业于清华大学,获硕士学位,在校期间活跃于TopCoder等编程竞赛社区。现为腾讯基础研究高级工程师,研究领域包括个性化推荐、自然语言处理和大规模的相似度优化计算,特别是对于深度学习在推荐系统的应用有深入的研究,并申请了国内十余项相关专利。
本书的配套代码,读者也可以在作者的Github主页中下载查看:
https://github.com/innovation-cat/DeepLearningBook)
第1 部分 概要 1
1 绪论 2
1.1 人工智能、机器学习与深度学习的关系 3
1.1.1 人工智能--机器推理 4
1.1.2 机器学习--数据驱动的科学 5
1.1.3 深度学习--大脑的仿真 8
1.2 深度学习的发展历程 8
1.3 深度学习技术概述 10
1.3.1 从低层到高层的特征抽象 11
1.3.2 让网络变得更深 13
1.3.3 自动特征提取 14
1.4 深度学习框架 15
2 Theano 基础 19
2.1 符号变量 20
2.2 符号计算的抽象--符号计算图模型 23
2.3 函数 26
2.3.1 函数的定义 26
2.3.2 Logistic回归 27
2.3.3 函数的复制 29
2.4 条件表达式 31
2.5 循环 32
2.6 共享变量 39
2.7 配置 39
2.7.1 通过THEANO_FLAGS配置 40
2.7.2 通过. theanorc文件配置 41
2.8 常用的Debug技巧 42
2.9 小结 43
第2 部分 数学与机器学习基础篇 45
3 线性代数基础 46
3.1 标量、向量、矩阵和张量 46
3.2 矩阵初等变换 47
3.3 线性相关与向量空间 48
3.4 范数 49
3.4.1 向量范数 49
3.4.2 矩阵范数 53
3.5 特殊的矩阵与向量 56
3.6 特征值分解 57
3.7 奇异值分解 58
3.8 迹运算 60
3.9 样例:主成分分析 61
4 概率统计基础 64
4.1 样本空间与随机变量 65
4.2 概率分布与分布函数 65
4.3 一维随机变量 66
4.3.1 离散型随机变量和分布律 66
4.3.2 连续型随机变量和概率密度函数 67
4.4 多维随机变量 68
4.4.1 离散型二维随机变量和联合分布律 69
4.4.2 连续型二维随机变量和联合密度函数 69
4.5 边缘分布 70
4.6 条件分布与链式法则 71
4.6.1 条件概率 71
4.6.2 链式法则 73
4.7 多维随机变量的独立性分析 73
4.7.1 边缘独立 74
4.7.2 条件独立 74
4.8 数学期望、方差、协方差 75
4.8.1 数学期望 75
4.8.2 方差 76
4.8.3 协方差 76
4.8.4 协方差矩阵 78
4.9 信息论基础 81
4.9.1 信息熵 81
4.9.2 条件熵 83
4.9.3 互信息 84
4.9.4 相对熵与交叉熵 84
5 概率图模型 87
5.1 生成模型与判别模型 89
5.2 图论基础 90
5.2.1 图的结构 90
5.2.2 子图 91
5.2.3 路径、迹、环与拓扑排序 92
5.3 贝叶斯网络 95
5.3.1 因子分解 96
5.3.2 局部马尔科夫独立性断言 99
5.3.3 I-Map与因子分解 100
5.3.4 有效迹 103
5.3.5 D-分离与全局马尔科夫独立性 108
5.4 马尔科夫网络 108
5.4.1 势函数因子与参数化表示 109
5.4.2 马尔科夫独立性 111
5.5 变量消除 114
5.6 信念传播 116
5.6.1 聚类图 116
5.6.2 团树 120
5.6.3 由变量消除构建团树 123
5.7 MCMC采样原理 126
5.7.1 随机采样 127
5.7.2 随机过程与马尔科夫链 128
5.7.3 MCMC采样 132
5.7.4 Gibbs采样 134
5.8 参数学习 137
5.8.1 *大似然估计 137
5.8.2 期望*大化算法 138
5.9 小结 140
6 机器学习基础 142
6.1 线性模型 143
6.1.1 线性回归 143
6.1.2 Logistic回归 148
6.1.3 广义的线性模型 150
6.2 支持向量机 151
6.2.1 *优间隔分类器 152
6.2.2 对偶问题 155
6.2.3 核函数 156
6.3 朴素贝叶斯 160
6.4 树模型 162
6.4.1 特征选择 163
6.4.2 剪枝策略 165
6.5 聚类 166
6.5.1 距离度量 167
6.5.2 层次聚类 168
6.5.3 K-means聚类 171
6.5.4 谱聚类 172
7 数值计算与*优化 177
7.1 无约束极小值的*优化条件 177
7.2 梯度下降 179
7.2.1 传统更新策略 181
7.2.2 动量更新策略 183
7.2.3 改进的动量更新策略 184
7.2.4 自适应梯度策略 187
7.3 共轭梯度 188
7.4 牛顿法 192
7.5 拟牛顿法 194
7.5.1 拟牛顿条件 194
7.5.2 DFP算法 195
7.5.3 BFGS算法 196
7.5.4 L-BFGS算法 197
7.6 约束*优化条件 200
第3 部分 理论与应用篇 205
8 前馈神经网络 206
8.1 生物神经元结构 207
8.2 人工神经元结构 208
8.3 单层感知机 209
8.4 多层感知机 212
8.5 激活函数 217
8.5.1 激活函数的作用 217
8.5.2 常用的激活函数 219
9 反向传播与梯度消失 225
9.1 经验风险*小化 227
9.2 梯度计算 228
9.2.1 输出层梯度 228
9.2.2 隐藏层梯度 230
9.2.3 参数梯度 234
9.3 反向传播 235
9.4 深度学习训练的难点 237
9.4.1 欠拟合--梯度消失 237
9.4.2 过拟合 240
10 自编码器及其相关模型 243
10.1 自编码器 243
10.2 降噪自编码器 245
10.3 栈式自编码器 247
10.4 稀疏编码器 250
10.5 应用:cifar10图像分类 254
11 玻尔兹曼机及其相关模型 258
11.1 玻尔兹曼机 258
11.2 能量模型 261
11.2.1 能量函数 261
11.2.2 从能量函数到势函数 262
11.2.3 从势函数到概率分布 263
11.3 推断 264
11.3.1 边缘分布 265
11.3.2 条件分布 267
11.4 学习 270
11.4.1 *大似然估计 271
11.4.2 对比散度 274
11.5 应用:个性化推荐 276
11.5.1 个性化推荐概述 276
11.5.2 个性化推荐架构与算法 279
11.5.3 RBM与协同过滤 285
12 递归神经网络 291
12.1 Elman递归神经网络 292
12.2 时间反向传播 295
12.3 长短时记忆网络 299
12.4 结构递归神经网络 302
12.5 应用:语言模型 308
12.5.1 N元统计模型 308
12.5.2 基于LSTM 构建语言模型 312
13 卷积神经网络 318
13.1 卷积运算 319
13.2 网络结构 320
13.3 卷积层 324
13.4 池化层 329
13.5 应用:文本分类 333
↑折 叠
2.
深度学习原理与TensorFlow实践
出版社: 电子工业出版社; 第1版 (2017年6月1日)
平装
ISBN: 9787121312984
条形码: 9787121312984
品牌: 电子工业出版社
3.
Tensorflow:实战Google深度学习框架(首著惊现 豪门力促一统DL江湖 面向未来 抢占人工智能至高点)
才云科技Caicloud郑泽宇 顾思宇 著
ISBN 978-7-121-30959-5
2017年3月出版
定价:79.00元
4.
Tensorflow:实战Google深度学习框架
定价:¥79.00
作者:才云科技Caicloud 郑泽宇 顾思宇
出版社:电子工业出版社
ISBN:9787121309595
上架时间:2017-2-10
出版日期:2017 年3月
开本:16开
页码:296
版次:1-1
5.
深度学习——Caffe之**模型详解与实战
定价:¥79.00
作者: 乐毅
出版社:电子工业出版社
ISBN:9787121301186
上架时间:2016-11-8
出版日期:2016 年10月
开本:16开
页码:344
版次:1-1
所属分类:计算机 > 人工智能 > 综合
6.
神经网络与深度学习
定价:¥59.00
作者: 吴岸城
出版社:电子工业出版社
ISBN:9787121288692
上架时间:2016-6-16
出版日期:2016 年6月
开本:16开
页码:232
版次:1-1
所属分类:计算机 > 人工智能 > 综合
7.
解析深度学习:语音识别实践
定价:¥79.00
作者: 俞栋
出版社:电子工业出版社
ISBN:9787121287961
上架时间:2016-6-15
出版日期:2016 年6月
开本:16开
页码:336
版次:1-1
所属分类:计算机 > 人工智能 > 综合
编辑推荐
AlphaGo与李世石的围棋大战激发了人们对人工智能是非的诸多争论。人工智能背后的工作原理深度学习跳入大众的视野。AlphaGo的大获全胜一定程度展示了深度学习在应用领域的成功,而语音识别正是深度学习取得显著成功的应用领域之一。
本书是首次以深度学习为主线介绍语音识别应用的书籍,对读者了解语音识别技术及其发展历程有重要的参考价值。
本书作者俞栋、邓力均是该领域的著名专家,他们是深度学习在应用领域取得突破性进展的推动者与实践者,他们在书中分享的研究成果一定程度上代表了本领域·新的研究进展;译者俞凯、钱彦旻也是本领域的资深专家,并有众多实践成果。对于从事此领域研究的读者来说,本书无疑有重要的参考价值。
我最近沉醉在一本关于深度学习在时间序列分析中的应用的书籍中。这本书的视角非常独特,它不仅仅局限于传统的统计模型,而是将目光投向了如何利用深度学习强大的模式识别能力来处理具有时间依赖性的数据。我特别喜欢书中对ARIMA、ETS等经典时间序列模型的简要回顾,并在此基础上,详细介绍了如何将其与神经网络结合。例如,作者讲解了如何使用RNN、LSTM和GRU来捕捉时间序列中的长期依赖关系,以及如何利用卷积神经网络(CNN)来提取时间序列中的局部特征。书中还重点探讨了Transformer模型在时间序列预测中的应用,解释了其自注意力机制如何有效地捕捉序列中的任意位置关系,而不仅仅是局部的依赖。我印象最深刻的是书中关于天气预测、股票市场分析和用户行为预测等多个实际案例的详细分析。作者通过具体的代码示例,展示了如何构建和训练深度学习模型来解决这些复杂的时间序列问题。这本书的理论深度和实践指导性都非常强,它让我看到了深度学习在处理金融、气象、交通等多个领域的时间序列数据方面的巨大潜力。
评分我近期深入阅读了一本聚焦于自然语言处理(NLP)核心技术的书籍。这本书的重点在于词嵌入(Word Embeddings)和循环神经网络(RNN)的演进,以及Transformer模型的崛起。作者以一种非常细腻的笔触,从最基础的One-hot编码讲起,逐步引出了Word2Vec、GloVe等词向量模型,清晰地解释了它们如何捕捉词语之间的语义关系。我尤其赞赏书中对RNN及其变种(如LSTM和GRU)的讲解,他用生动的比喻,比如“记忆长廊”,来形容RNN的循环结构,并详细阐述了它们在处理序列数据时的优势和局限性。然而,这本书的真正亮点在于对Transformer模型的全面解读。作者花了大量的篇幅,从自注意力机制(Self-Attention)到多头注意力(Multi-Head Attention),再到位置编码(Positional Encoding),一步步构建起Transformer的宏伟蓝图。书中还深入探讨了BERT、GPT等预训练模型的原理和应用,并提供了一些将这些模型应用于文本生成、机器翻译、情感分析等任务的实践指导。读完这本书,我感觉自己对NLP领域的前沿技术有了前所未有的深入理解,也为我未来在该领域的深入研究奠定了坚实的基础。
评分我最近沉迷于一本关于强化学习在复杂系统中的应用的书籍。这本书的视角非常独特,它不是简单地罗列算法,而是从“智能体如何与环境交互并做出最优决策”这一核心问题出发,构建了一个完整的知识体系。书中详细讲解了Q-learning、Deep Q-Networks (DQN)、Policy Gradients等经典强化学习算法,并用生动的案例,比如机器人导航、游戏AI设计等,来阐述这些算法的原理和适用场景。我印象最深刻的是关于“信用分配问题”的讨论,作者通过一个复杂的迷宫游戏,一步步剖析了智能体如何学习到哪些动作是真正带来奖励的关键,以及如何处理延迟奖励带来的挑战。这本书的逻辑性非常强,从基础概念到高级应用,过渡自然流畅。它还特别强调了在实际应用中,如何处理高维状态空间、稀疏奖励等问题,并提供了一些实用的技巧和经验。读完这本书,我感觉自己对如何设计能够解决现实世界复杂问题的AI系统有了全新的认识。它让我明白,强化学习不仅仅是算法的堆叠,更是一种解决问题的思维方式,一种不断试错、学习和优化的过程。这本书的深度和广度都令人称赞,对于想要深入了解强化学习并将其应用于实际的读者来说,是一本必读之作。
评分我最近花了大量时间研究一本关于计算机视觉中的深度学习模型的书。这本书非常系统地梳理了从早期的卷积神经网络(CNN)到如今最前沿的注意力机制在视觉领域的应用。我特别喜欢作者对CNN的经典架构,如LeNet、AlexNet、VGG、GoogLeNet和ResNet的详细剖析。他不仅仅是列出网络结构,而是深入讲解了每一代网络在设计上的创新点,比如AlexNet中的ReLU激活函数、GoogLeNet中的Inception模块,以及ResNet中残差连接的妙用。书中的配图非常精美,清晰地展示了卷积、池化、全连接等基本操作,以及特征图的演变过程。更难得的是,这本书还花费了大量篇幅介绍目标检测(如Faster R-CNN、YOLO)和图像分割(如FCN、U-Net)等具体任务的模型。作者通过实际的代码片段和算法流程图,让这些复杂的技术变得触手可及。我尝试用书中提供的方法在自己的数据集上训练一个简单的图像分类模型,效果出乎意料的好。这本书不仅仅是知识的传授,更是一种思维的启迪,它让我看到了深度学习在理解和处理图像方面的强大能力,也为我未来的研究方向提供了明确的指引。
评分这本书的名字是《包邮7册 深入浅出深度学习+深度学习原理与TensorFlow实践+TensorFlow实》,但我的阅读体验聚焦在了其中一本关于生成式AI模型原理与应用的探索的图书上。这本书以一种非常直观的方式,从最基础的数学概念讲起,层层递进,揭示了Transformer架构的精妙之处。我尤其喜欢作者对于Attention机制的讲解,他用类比和图示相结合的方式,将一个看似复杂的技术概念变得清晰易懂。书中还详细介绍了如何从零开始构建一个简单的语言模型,并提供了丰富的代码示例,让我能够亲手实践,加深理解。更令人惊喜的是,这本书还深入探讨了Diffusion Model和GANs等生成式模型的原理,并结合实际案例,讲解了如何在图像生成、文本创作等领域应用这些技术。我曾尝试用书中的方法复现一些知名的生成式模型,虽然过程充满挑战,但最终的成果让我非常有成就感。这本书不仅仅是理论的堆砌,更是一份实践的指南,对于想要进入生成式AI领域的研究者或开发者来说,绝对是一份不可多得的宝藏。它让我看到了AI在创造性领域的巨大潜力,也激发了我对未来AI发展的无限遐想。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有