1 深度学习简介 1
1.1 深度学习介绍 1
1.2 深度学习的趋势 7
1.3 参考资料 10
2 TensorFlow系统介绍 12
2.1 TensorFlow诞生的动机 12
2.2 TensorFlow系统简介 14
2.3 TensorFlow基础概念 16
2.3.1 计算图 16
2.3.2 Session会话 18
2.4 系统架构 19
2.5 源码结构 21
2.5.1 后端执行引擎 22
2.5.2 前端语言接口 24
2.6 小结 24
2.7 参考资料 25
3 Hello TensorFlow 26
3.1 环境准备 26
3.1.1 Mac OS安装 27
3.1.2 Linux GPU服务器安装 28
3.1.3 常用Python库 32
3.2 Titanic题目实战 34
3.2.1 Kaggle平台介绍 34
3.2.2 Titanic题目介绍 35
3.2.3 数据读入及预处理 38
3.2.4 构建计算图 40
3.2.5 构建训练迭代过程 44
3.2.6 执行训练 46
3.2.7 存储和加载模型参数 47
3.2.8 预测测试数据结果 50
3.3 数据挖掘的技巧 51
3.3.1 数据可视化 52
3.3.2 特征工程 54
3.3.3 多种算法模型 57
3.4 TensorBoard可视化 58
3.4.1 记录事件数据 58
3.4.2 启动TensorBorad服务 60
3.5 数据读取 62
3.5.1 数据文件格式 63
3.5.2 TFRecord 63
3.6 SkFlow、TFLearn与TF-Slim 67
3.7 小结 69
3.8 参考资料 69
4 CNN“看懂”世界 71
4.1 图像识别的难题 72
4.2 CNNs的基本原理 74
4.2.1 卷积的数学意义 75
4.2.2 卷积滤波 77
4.2.3 CNNs中的卷积层 81
4.2.4 池化(Pooling) 83
4.2.5 ReLU 84
4.2.6 多层卷积 86
4.2.7 Dropout 86
4.3 经典CNN模型 87
4.3.1 AlexNet 88
4.3.2 VGGNets 95
4.3.3 GoogLeNet & Inception 98
4.3.4 ResNets 106
4.4 图像风格转换 109
4.4.1 量化的风格 109
4.4.2 风格的滤镜 116
4.5 小结 120
4.6 参考资料 121
5 RNN“能说会道” 123
5.1 文本理解和文本生成问题 124
5.2 标准RNN模型 128
5.2.1 RNN模型介绍 128
5.2.2 BPTT算法 130
5.2.3 灵活的RNN结构 132
5.2.4 TensorFlow实现正弦序列预测 135
5.3 LSTM模型 138
5.3.1 长期依赖的难题 138
5.3.2 LSTM基本原理 139
5.3.3 TensorFlow构建LSTM模型 142
5.4 更多RNN的变体 144
5.5 语言模型 146
5.5.1 NGram语言模型 146
5.5.2 神经网络语言模型 148
5.5.3 循环神经网络语言模型 150
5.5.4 语言模型也能写代码 152
5.5.5 改进方向 163
5.6 对话机器人 164
5.6.1 对话机器人的发展 165
5.6.2 基于seq2seq的对话机器人 169
5.7 小结 181
5.8 参考资料 182
6 CNN+LSTM看图说话 183
6.1 CNN+LSTM网络模型与图像检测问题 184
6.1.1 OverFeat和Faster R-CNN图像检测算法介绍 185
6.1.2 遮挡目标图像检测方法 187
6.1.3 ReInspect算法实现及模块说明 188
6.1.4 ReInspect算法的实验数据与结论 204
6.2 CNN+LSTM网络模型与图像摘要问题 207
6.2.1 图像摘要问题 208
6.2.2 NIC图像摘要生成算法 209
6.2.3 NIC图像摘要生成算法实现说明 214
6.2.4 NIC算法的实验数据与结论 243
6.3 小结 249
6.4 参考资料 250
7 损失函数与优化算法 253
7.1 目标函数优化策略 254
7.1.1 梯度下降算法 254
7.1.2 RMSProp优化算法 256
7.1.3 Adam优化算法 257
7.1.4 目标函数优化算法小结 258
7.2 类别采样(Candidate Sampling)损失函数 259
7.2.1 softmax类别采样损失函数 261
7.2.2 噪声对比估计类别采样损失函数 281
7.2.3 负样本估计类别采样损失函数 286
7.2.4 类别采样logistic损失函数 286
7.3 小结 287
7.4 参考资料 288
结语 289
书名:深度学习原理与TensorFlow实践
作者:王琛,胡振邦,高杰 著
出版社:电子工业出版社
出版时间:2017-6
版次:1
印刷时间:2017-6
印次:2
开本:16开
装帧:平装
页数:288
字数:364800
ISBN:9787121312984
定价:79.00
与市面上已有的TensorFlow书相比,《深度学习原理与TensorFlow实践》的特色在于一是所有案例来自作者团队工作中的亲身实践,所选案例均是深度学习的经典应用,非常具有代表性;二是结合了深度学习的关键原理,强化读者对深度学习及TensorFlow架构的理解,从而能在知其然、并知其所以然的基础上,更好地运用TensorFlow来开发各类应用。
《深度学习原理与TensorFlow实践》所梳理出来的清晰脉络和关键知识点, 能让读者在内外兼修的基础上,循序渐进地提升功力,在人工智能时代大放异彩。
《深度学习原理与TensorFlow实践》主要介绍了深度学习的基础原理和TensorFlow系统基本使用方法。TensorFlow是目前机器学习、深度学习领域优秀的计算系统之一,《深度学习原理与TensorFlow实践》结合实例介绍了使用TensorFlow开发机器学习应用的详细方法和步骤。同时,《深度学习原理与TensorFlow实践》着重讲解了用于图像识别的卷积神经网络和用于自然语言处理的循环神经网络的理论知识及其TensorFlow实现方法,并结合实际场景和例子描述了深度学习技术的应用范围与效果。
《深度学习原理与TensorFlow实践》非常适合对机器学习、深度学习感兴趣的读者,或是对深度学习理论有所了解,希望尝试更多工程实践的读者,抑或是对工程产品有较多经验,希望学习深度学习理论的读者。
喻俨,百纳信息(海豚浏览器)研发副总裁。2007年加入微软亚洲工程院,2011年加入百纳信息负责海外业务线,从0到1做过多个项目,现致力于AI和大数据产品的研究与应用。
莫瑜,先后任职于微软和海豚浏览器,从事搜索引擎、音乐检索/哼唱搜索、内容分发推荐算法和对话机器人技术研发。长期以来持续关注和实践大规模数据算法性能优化、搜索引擎、推荐系统和人工智能技术。
王琛,英国爱丁堡大学人工智能专业硕士,现为百纳信息技术有限公司人工智能方向负责人。早年参加过信息学奥林匹克竞赛获得河北省1名、全国三等奖,并保送进入中山大学。大学期间,在ACM竞赛上也屡获佳绩。硕士毕业后就职于百度基础架构部,参与大数据平台研发工作,对大数据分析处理、分布式系统架构等方面都有比较深刻的理解。2014年加入百纳,负责多个项目的研发,自2016年起负责人工智能方向的探索。
胡振邦,拥有博士学位,百纳信息技术有限公司高级算法研究员,毕业于中国地质大学计算机学院地学信息工程专业。读博期间,参与了关于遥感卫星图像识别分析的863项目,并且是主要的研发人员。毕业以来,一直从事图像识别方面的算法研发工作,主要方向包括目标检测、图文检索、图像分类与验证等,在图像处理、计算机视觉等方面都有深厚的积累和经验。
高杰,是一位1980年出生于苏北的“爱学习、能折腾、有情怀”的大叔。毕业于扬州中学特招班,1998年入学华中科技大学机械系,兼修管理、会计,自学计算机,2003年考入南京大学软件学院,曾任德国西门子内部SAP咨询师,还在中银国际TMT投行、金山软件集团投资部任过职,2015年与合伙人联合创立了图灵科技集团,与华尔街优秀交易团队一起致力于量化交易、算法模型和人工智能在金融领域的应用,目前这家公司管理着超过20亿元的资产,是细分市场的 公司。
这本书在图文结合和排版设计上,也体现出了极高的用心程度。很多技术书籍为了节省篇幅或降低成本,图表经常模糊不清或者布局混乱,导致阅读体验极差。然而,这本书中的图示非常清晰、专业,尤其是那些关于数据流向和权重更新的示意图,简洁明了,极大地辅助了抽象概念的理解。例如,在解释注意力机制(Attention Mechanism)时,作者绘制的权重分布热力图,比任何文字描述都更具说服力。再者,代码块的格式化也做得无可挑剔,关键变量和函数调用都有清晰的注释,而且代码示例的长度和复杂度都经过了精心设计,确保读者可以在不被冗余信息干扰的情况下,专注于核心逻辑。这种对细节的关注,体现了作者对读者的尊重,也让整个学习过程变成了一种享受,而不是一场与晦涩文字和粗糙图表的搏斗。毫不夸张地说,它的阅读体验,在技术书籍中属于第一梯队。
评分这本书的叙事结构和逻辑推演,展现了作者极高的专业素养和清晰的思维脉络。它不像某些技术书籍那样,章节之间互相割裂,或者知识点跳跃性太大。相反,它构建了一个非常平滑的学习曲线。从最基础的神经网络结构开始,逐步引入优化器、正则化、到后期的卷积网络和循环网络,每引入一个新概念,都会清晰地指出它解决了前一阶段的哪个痛点,或者扩展了哪种能力。这种“问题驱动-方案解决”的叙事方式,让阅读过程充满了探索的乐趣。我尤其欣赏作者在处理复杂算法时的那种“庖丁解牛”般的分解能力,能将一个看似庞大的模块拆解成几个易于理解的小单元。阅读过程中,我很少需要反复查阅前面的章节来确认某个定义,因为作者总能在恰当的时机进行回顾和串联。这种连贯性,极大地降低了深度学习这种跨学科领域学习的认知负荷,让复杂的知识体系变得井井有条,便于长期记忆和应用。
评分这本书简直是打开了我对这个领域认知的一扇窗,它不仅仅是堆砌代码和公式的教科书,更像是一位经验丰富的导师,循循善诱地引导你穿越深度学习的迷雾。首先让我印象深刻的是它对基础理论的阐述,那种深入骨髓的讲解,完全不是那种浮于表面的介绍。比如,它对反向传播算法的推导,没有急于求成,而是层层递进,用最直观的方式让你理解梯度是如何一步步流动和修正网络参数的。我记得我之前在别的地方学的时候,总是记不住那个链式法则的细节,但读完这里的讲解,那种豁然开朗的感觉真的太棒了。而且,它在讲解这些原理的时候,总是能巧妙地联系到实际应用场景,让你明白每一个数学概念背后都有一个清晰的工程目标。书中对不同激活函数特性的分析也极其到位,从Sigmoid到ReLU家族,再到近年来兴起的各种变体,作者不仅告诉你“是什么”,更重要的是解释了“为什么会这样设计”,这种深层次的剖析,让我在选择模型架构时更有底气,不再是盲目跟风,而是真正理解了背后的权衡与取舍。这种对基础的夯实,为后续所有高级概念的学习都打下了坚实的基石,非常适合希望构建完整知识体系的学习者。
评分坦白说,市面上关于深度学习的书籍汗牛充栋,但大多要么过于偏重理论而缺乏代码实现,要么就是一味地堆砌代码片段而缺乏理论支撑。这本书的平衡感拿捏得非常好,达到了一种“刚刚好的”境界。它对各种经典网络结构的介绍,比如经典的CNN架构(LeNet到ResNet的演变),不仅仅是画出结构图,更重要的是深入探讨了“为什么ResNet要引入残差连接”,这种对创新背后的动机的挖掘,是很多同类书籍所缺乏的。此外,书中对现代深度学习中几个核心挑战的讨论也相当深入,例如对抗性攻击(Adversarial Attacks)和模型的可解释性(Explainability)。这些前沿话题的引入,使得这本书的知识体系不仅立足于经典,更面向未来。阅读这些章节时,我能感受到作者在努力打破理论与前沿研究之间的壁垒,确保读者读完后,不仅能解决眼前的问题,还能对行业未来的发展方向有所预判。
评分这本书的实战部分,可以说是为我解决了不少燃眉之急。我们都知道,理论学得再好,如果不能落地,终究是空中楼阁。这本书的厉害之处在于,它没有停留在“Hello World”的层面,而是真正深入到了工程实践中的那些“坑”和“技巧”。特别是在使用TensorFlow进行模型构建和部署时,作者分享的那些“小窍门”和“最佳实践”,简直是血泪的结晶。比如,关于如何有效地进行数据预处理和管道构建,书中给出的建议比官方文档还要清晰实用。我记得有一次我尝试用一个复杂的数据集进行训练,遇到了内存爆炸的问题,翻阅这本书后,我找到了解决方案——通过调整数据批次大小和使用TensorFlow的`tf.data`的高级特性,问题迎刃而解。它对模型调试(Debugging)的论述也极其有价值,不仅仅是告诉你“模型不收敛了怎么办”,而是系统地分析了可能是学习率设置、梯度消失/爆炸、数据泄漏等哪个环节出了问题,并提供了对应的诊断工具和方法。这种注重实战细节的写作风格,极大地提升了我的开发效率,让我感觉这本书更像是一位随时待命的资深工程师。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有