内容简介
本书共11章,将高效机器学习的理论、设计原则以及实际应用有机结合,深入探讨了机器学习的主要课题,包括知识发现、分类、遗传算法、神经网络、内核方法和生物启发技术等。读者可从中了解机器学习技术可以解决的相关问题和相应解决方案的实现,以及新系统的设计方法。本书讲解由浅入深,适合算法工程师、高校工科专业的学生、IT专业人员以及机器学习爱好者,为他们设计和创建全新有效的机器学习系统提供知识和实践指导。
作者简介
Rahul Khanna 英特尔公司专注于节能算法开发的平台架构师。在过去17年里,他从事服务器系统软件技术的研发工作,包括平台自动化、电力/热力优化技术、可靠性、优化和预测方法。他已经编写了与能量优化、平台无线互连、传感器网络、互连可靠性、预测建模、运动估计和安全的大量技术论文和图书。他拥有17项专利。他是英特尔高速互连内置自测试IBIST方法的联合发明人。他的研究兴趣包括基于机器学习的电力/热力优化算法,窄信道高速无线互连,稠密传感器网络中的信息检索。他是IEEE成员;并且由于其在平台技术改进领域的贡献,3次获得英特尔成就奖。
Mariette Awad 贝鲁特美国大学电子和计算机工程系助理教授。她从佛蒙特大学大学获得电子工程博士学位,曾是弗吉尼亚联邦大学、麻省理工学院客座教授。她还曾在IBM公司系统和技术团队担任无线产品工程师。她的研究兴趣包括机器学习、数据分析和能耗感知计算。
目录
目 录
Efficient Learning Machines:Theories,Concepts,and Applications for Engineers and System Designers
译者序
作者简介
技术评审简介
致谢
第1章 机器学习1
1.1 关键术语2
1.2 机器学习的步骤4
1.3 机器学习算法6
1.4 流行的机器学习算法9
1.4.1 C4.59
1.4.2 k均值9
1.4.3 支持向量机10
1.4.4 Apriori算法10
1.4.5 估计最大化11
1.4.6 PageRank算法11
1.4.7 AdaBoost12
1.4.8 k近邻算法13
1.4.9 朴素贝叶斯14
1.4.10 分类回归树14
1.5 数据挖掘研究中的挑战性问题14
1.5.1 针对高维数据和高速数据流的扩展15
1.5.2 挖掘序列数据和时间序列数据15
1.5.3 从复杂数据中挖掘复杂知识15
1.5.4 分布式数据挖掘与挖掘多代理数据15
1.5.5 数据挖掘过程的相关问题16
1.5.6 安全性、隐私性和数据完整性16
1.5.7 处理非静态、不平衡和代价敏感的数据16
1.6 总结16
参考文献16
第2章 机器学习与知识发现18
2.1 知识发现20
2.1.1 分类20
2.1.2 聚类20
2.1.3 降维21
2.1.4 协同过滤21
2.2 机器学习:分类算法21
2.2.1 逻辑回归21
2.2.2 随机森林22
2.2.3 隐马尔可夫模型23
2.2.4 多层感知机24
2.3 机器学习:聚类算法26
2.3.1 k均值聚类26
2.3.2 模糊k均值(模糊c均值)26
2.3.3 流k均值算法27
2.4 机器学习:降维28
2.4.1 奇异值分解28
2.4.2 主成分分析29
2.4.3 Lanczos算法31
2.5 机器学习:协同过滤32
2.5.1 基于用户的协同过滤32
2.5.2 基于项目的协同过滤32
2.5.3 权值-λ-正规化的交替最小二乘法33
2.6 机器学习:相似矩阵34
2.6.1 Pearson相关系数34
2.6.2 Spearman等级相关系数34
2.6.3 欧氏距离35
2.6.4 Jaccard相似系数35
2.7 总结35
参考文献36
第3章 支持向量机分类37
3.1 从几何角度看待SVM37
3.2 SVM的主要性能38
3.3 硬间隔SVM41
3.4 软间隔SVM43
3.5 核SVM44
3.6 多分类SVM47
3.7 SVM用于非平衡数据集49
3.8 提升SVM计算需求51
3.9 案例研究:SVM用于手写识别53
3.9.1 预处理54
3.9.2 特征提取54
3.9.3 分层的、三级SVM55
3.9.4 实验结果56
3.9.5 复杂度分析57
参考文献59
第4章 支持向量回归63
4.1 SVR概述63
4.2 SVR:概念、数学模型和图形表示64
4.3 核SVR和不同的损失函数:数学模型和图形表示68
4.4 贝叶斯线性回归69
4.5 案例研究:非对称SVR电源预测72
参考文献75
第5章 隐马尔可夫模型76
5.1 离散的马尔可夫过程76
5.1.1 定义178
5.1.2 定义278
5.1.3 定义378
5.2 HMM简介78
5.2.1 HMM的要点80
5.2.2 HMM的三种基本问题80
5.2.3 HMM基本问题的解决81
5.3 连续观测HMM86
5.3.1 多元高斯混合模型88
5.3.2 示例:工作负载相位识别88
5.3.3 监视和观测89
5.3.4 工作负载和相位89
5.3.5 相位探测的混合模型91
参考文献98
第6章 仿生计算:群体智能100
6.1 应用101
6.1.1 演化硬件101
6.1.2 仿生网络103
6.1.3 数据中心优化105
6.2 仿生计算算法106
6.3 群体智能106
6.3.1 蚁群优化算法107
6.3.2 粒子群优化算法109
6.3.3 人工蜂群算法111
6.4 细菌觅食优化算法113
6.5 人工免疫系统114
6.6 数据中心的分布式管理116
6.6.1 工作负载特征116
6.6.2 热度优化117
6.6.3 负载均衡117
6.6.4 算法模型118
参考文献120
第7章 深度神经网络122
7.1 ANN简介122
7.1.1 早期的ANN结构123
7.1.2 经典的ANN124
7.1.3 ANN训练和反向传播算法127
7.2 DBN概述128
7.3 受限玻尔兹曼机130
7.4 DNN训练算法131
7.5 DNN相关研究133
7.5.1 DNN应用134
7.5.2 利用并行实现加快DNN训练135
7.5.3 类似于DBN的深度网络135
参考文献136
第8章 皮质算法141
8.1 皮质算法入门141
8.1.1 皮质算法的结构141
8.1.2 皮质算法的训练143
8.2 权重更新145
8.3 案例研究:改进的皮质算法在阿拉伯语口语数字化中的应用149
8.3.1 基于熵的权重更新规则149
8.3.2 实验验证150
参考文献153
第9章 深度学习156
9.1 层级时序存储概述156
9.2 层级时序存储的演化157
9.2.1 稀疏分布表征160
9.2.2 算法实现160
9.2.3 空间池160
9.2.4 时间池162
9.3 相关工作163
9.4 脉冲神经网络概述164
9.4.1 Hodgkin-Huxley模型165
9.4.2 integrate-and-fire模型165
9.4.3 leaky integrate-and-fire模型165
9.4.4 Izhikevich模型166
9.4.5 Thorpe’s模型166
精彩书摘
数据中心在处理电力传输、能源消耗、热量管理、安全性、存储性能、服务保证以及动态资源分配关键问题时所处的环境是复杂的。这些挑战与提供有效的协调性以提高数据中心的稳定性和效率相关。变动的需求和大型数据中心的工作负载特性使得维持工作负载性能、冷却效率和能源目标(在下面的章节讨论)的任务变得复杂。在如此庞大的系统集群中,多目标优化策略通过避免重复分配促动器,提供约束、时序粒度、方法类型、控制序列的复杂组合来达到预期的服务水平。然而,组合解空间可能非常大,无法在有限时间内收敛到全局最优。因此,集中式的数据中心管理系统可能无法在限定的时间内实现较好地扩展,因此可能无法提供一个最佳管理解决方案。
SI已成为一个有前途的领域,它可以用来构建分布式的管理策略,并产生不受集中控制的可扩展的解决方案。以下各节将介绍可为工作负载配置识别合适目标的控制系统,主要包括如下基本控制元件:
控制过程:该控制过程实现了反馈控制环路,这用于约束给定策略下服务器计算集群的温度和功率。最优的处理过程运行在策略约束和足够的能量供应范围内,从而实现最高的性能效率和最低的冷却效率。
适应度函数:适应度函数评估了最有利工作负载的配置,它是基于现有知识库的预期需求和可用性的资源。
知识库:知识库为一个由代理传感器产生的调查数据组成的有限的数据库。这方面的知识有助于确定最合适的工作负载配置。由于系统是动态变化的,根据自定义数据保留策略,较新的数据会代替旧的数据。知识数据库增加了数据的保留程度以此可能调高解决方案的适应性,同时不断减少对现有的解决方案无益的数据。
控制参数:控制参数定义了最优决策的界限,决定了在选定的计算节点上的工作负载的配置。
群代理:代理群通过在分散和自组织的系统中扮演特定的角色来参与到系统优化过程中。这些代理相互之间以及与环境之间相协调,最终产生全局的智能行为。
……
高效机器学习:理论、算法及实践 epub pdf mobi txt 电子书 下载 2024
高效机器学习:理论、算法及实践 下载 epub mobi pdf txt 电子书 2024