本书介绍了异构信息网络挖掘的原理和方法,包括基于排名的聚类与分类、基于元路径的相似性搜索和挖掘、关系强度感知挖掘,以及若干有前景的研究方向。本书是伊利诺伊大学香槟分校数据挖掘高级课程的参考教材,适合作为数据挖掘方向的研究生教材,也适合数据挖掘研究人员和专业技术人员参考。
YizhouSun拥有伊利诺伊大学厄巴纳-尚佩恩分校计算机系博士学位,师从著名数据挖掘科学家JiaweiHan(韩家炜)教授。目前是西北大学计算机和信息科学学院副教授。
JiaweiHan(韩家炜)伊利诺伊大学厄巴纳-尚佩恩分校计算机科学系Bliss教授。由于在数据挖掘和数据库系统领域卓有成效的研究工作,他曾多次获得各种荣誉和奖励,其中包括2004年ACMSIGKDD颁发的佳创新奖,2005年IEEEComputerSociety颁发的技术成就奖,2009年IEEE颁发的W.WallaceMcDowell奖。他是ACM和IEEE会士。
丛书前言
译者序
摘要和关键词
第1章引言
1��1异构信息网络是什么
1��2为什么异构网络挖掘是一项新的挑战
1��3本书的内容组织
第一部分基于排名的聚类和分类
第2章基于排名的聚类
2��1概述
2��2RankClus算法
2��2��1排名函数
2��2��2从条件排名分布到新的聚类度量
2��2��3聚类中心和距离测量
2��2��4RankClus算法总结
2��2��5实验结果
2��3NetClus算法
2��3��1排名函数
2��3��2NetClus算法框架
2��3��3网络聚类中目标对象生成模型
2��3��4目标对象和属性对象的后验概率
2��3��5实验结果
第3章异构信息网络的分类
3��1概述
3��2GNetMine
3��2��1分类问题定义
3��2��2基于图的正则化框架
3��3RankClass
3��3��1RankClass框架
3��3��2基于图的排名
3��3��3调整网络
3��3��4后验概率计算
3��4实验结果
3��4��1数据集
3��4��2准确性研究
3��4��3案例研究
第二部分基于元路径的相似性搜索和挖掘
第4章基于元路径的相似性搜索
4��1概述
4��2PathSim:基于元路径的相似性度量
4��2��1网络模式和元路径
4��2��2基于元路径的相似性框架
4��2��3PathSim:全新的相似性度量
4��3单一元路径的在线查询处理
4��3��1单一元路径的连接
4��3��2基准算法
4��3��3基于共同聚类的剪枝
4��4多重元路径的组合
4��5实验结果
4��5��1有效性
4��5��2效率对比
4��5��3Flickr网络的案例研究
第5章基于元路径的关系预测
5��1概述
5��2基于元路径的关系预测框架
5��2��1基于元路径的拓扑特征空间
5��2��2监督式关系预测框架
5��3合著关系预测
5��3��1合著关系预测模型
5��3��2实验结果
5��4带时间的关系预测
5��4��1面向作者引用关系预测的基于元路径的拓扑特征
5��4��2关系建立时间预测模型
5��4��3实验结果
第三部分关系强度感知挖掘
第6章不完全属性的关系强度感知聚类
6��1概述
6��2关系强度感知聚类的问题定义
6��3聚类框架
6��3��1模型综述
6��3��2属性生成建模
6��3��3结构一致性建模
6��3��4统一模型
6��4聚类算法
6��4��1聚类优化
6��4��2链接类型强度学习
6��4��3整合:GenClus算法
6��5实验结果
6��5��1数据集
6��5��2有效性研究
第7章通过元路径选择的用户引导聚类
7��1概述
7��2用户引导聚类的元路径选择问题
7��2��1元路径选择问题
7��2��2用户引导的聚类
7��2��3问题定义
7��3概率模型
7��3��1关系生成建模
7��3��2用户引导建模
7��3��3对元路径选择的质量权重建模
7��3��4统一模型
7��4学习算法
7��4��1给定元路径权重优化聚类结果
7��4��2给定聚类结果优化元路径权重
7��4��3PathSelClus算法
7��5实验结果
7��5��1数据集
7��5��2有效性研究
7��5��3元路径权重的案例研究
7��6讨论
第8章研究前沿
参考文献
丛书前言陈寅恪先生说:“一时代之学术,必有其新材料与新问题。取用此材料,以研求问题,则为此时代学术之新潮流。治学之士,得预于此潮流者,谓之预流(借用佛教初果之名)。其未得预者,谓之未入流。”对今天的信息技术而言,“新材料”即为大数据,而“新问题”则是产生于“新材料”之上的新的应用需求。
当下大数据技术发展变化日新月异,大数据应用已经遍及工业和社会生活方方面面,原有的数据管理理论体系与大数据产业应用之前的差距日益加大,而工业界对于大数据人才的需求却极剧增加。大数据专业人才的培养是新一轮科技较量的基础,高等院校承担着大数据人才培养的重任。因此大数据相关课程将逐渐成为国内高校计算机相关专业的重要课程。近来越来越多的院校急切地开设大数据方面的人才培养计划,以求占得“先机”。但纵观大数据人才培养课程体系尚不尽如人意,多是已有课程的“冷拼盘”,顶多是加点“调料”,原材料没有新鲜感。现阶段无论多么新多么好的人才培养计划,都只能在六七十年代编写的计算机知识体系上施教,无法把当下的大数据带给我们的新思维方式和知识体系传导给学生。
为此我们意识到,缺少基础性工作和原始积累,就难以培养符合工业界需要的大数据复合型和交叉型人才。因此急需在思维和理念方面进行转变,为现有的课程和知识体系按大数据应用需求进行延展和补充,加入新的可以因材施教的知识模块。每一位学者都有责任和义务去为此“增砖添瓦”。
在此背景下,我们策划和组织了这套大数据管理丛书,希望能够培养数据思维的理念,对原有数据管理知识体系进行完善和补充,面向新的技术热点,提出新的知识体系/知识点,拉近教材体系与大数据应用的距离,为受教者应对现代技术带来的大数据领域的新问题和挑战,扫除障碍。现时要求学者编写大部头著作费时费力,不太现实。这使我们想到二十世纪八九十年代风靡一时的“五角丛书”,它短小精湛,题材丰富,选题新颖,恰到好处地迎合了那个时代人们对新知识的渴望,因此成为了那个时代的共同记忆。所以我们受此启发,选择了这种更容易实现的“五角丛书”的形式,促使学者们力所能及地把各自工作中的积累呈现给大家,为大数据人才培养的“大厦”增砖添瓦。我们相信,假以时日,这些小部头的著作汇溪成河,必将对未来大数据人才培养起到“基石”的作用。
丛书定位:面向新形势下的大数据技术发展对人才培养提出的挑战,旨在为学术研究和人才培养提供可供参考的“基石”。虽然是一些不起眼的“砖头瓦块”,但可以为大数据人才培养积累可用的新模块(新素材),弥补原有知识体系与应用问题之前的鸿沟,力图为现有的数据管理知识查漏补缺,聚少成多,最终形成适应大数据技术发展和人才培养的知识体系和教材基础。
丛书特点:丛书借鉴Morgan&ClaypoolPublishers;出版的SynthesisLecturesonDataManagement,特色在于选题新颖,短小精湛。选题新颖即面向技术热点,弥补现有知识体系的漏洞和不足(或延伸或补充),内容涵盖大数据管理的理论、方法、技术等诸多方面。短小精湛则不求系统性和完备性,但每本书要自成知识体系,重在阐述基本问题和方法,并辅以例题说明,便于施教。
丛书组织:丛书采用国际学术出版通行的主编负责制,为此特邀中国人民大学孟小峰教授(email:xfmeng@ruc�眅du�眂n)担任丛书主编,负责丛书的整体规划和选题。责任编辑为机械工业出版社华章分社姚蕾编辑(email:yaolei@hzbook�眂om)。
在此期望有志于大数据人才培养并具有丰富理论和实践经验的学者和专业人员能够加入到这套书的编写工作中来,共同为中国大数据研究和人才培养贡献自己的智慧和力量,共筑属于我们自己的“时代记忆”。欢迎读者对我们的出版工作提出宝贵意见和建议。
丛书即将出版书目大数据管理概论孟小峰主编2017年2月出版异构信息网络挖掘:原理和方法[美]孙艺洲(YizhouSun)韩家炜(JiaweiHan)著;段磊朱敏唐常杰译2017年1月出版大规模元搜索引擎技术[美]孟卫一(WeiyiMeng)於德(ClementT�盰u)著;朱亮译2017年1月大数据集成[美]董欣(XinLunaDong)戴夫士·斯里瓦斯塔瓦(DiveshSrivastava)著;王秋月杜治娟王硕译2017年2月短文本数据理解王仲远编著2017年2月个人数据管理李玉坤孟小峰编著2017年3月位置大数据隐私保护潘晓霍峥孟小峰编著2017年3月移动大数据挖掘连德富张富峥王英子袁晶谢幸编著2017年3月云数据管理挑战与机遇[美]迪卫艾肯特·阿格拉沃尔(DivyakantAgrawal)苏迪皮托·达斯(SudiptoDas)阿姆鲁·埃尔·阿巴迪(AmrElAbbadi)著;马友忠等译2017年3月流数据管理[加]卢卡斯·戈拉布(LukaszGolab)[德]M·塔纳·顾兹叙(M�盩amer�Zzsu)著;禹晓辉译2017年3月
我是一名对技术原理有着强烈探索欲的爱好者,尤其对那些能够揭示事物本质和内在规律的技术理论着迷。当我接触到《异构信息网络挖掘:原理和方法》这本书时,我立刻感受到了它背后所蕴含的深刻洞察力。它并没有停留在对表面现象的描述,而是深入到异构信息网络的核心,去剖析其运作的机制和内在的逻辑。我喜欢书中对不同挖掘任务的细致划分,以及对每种任务背后所依赖的理论基础的详细阐述。例如,在讲解节点分类任务时,书中不仅介绍了各种基于图嵌入的方法,还对其背后的数学原理进行了深入的推导,这让我能够真正理解为什么这些方法有效,而不是仅仅停留在“怎么用”的层面。此外,书中对异构信息网络中“度量”的深入探讨,也让我对网络的连接性、重要性有了更深刻的理解,这对于理解复杂系统的运行规律至关重要。这本书让我不仅仅是在学习一项技术,更是在学习一种思考和分析复杂世界的方法。
评分坦白说,一开始我对这本书抱持着一种谨慎的期待,毕竟“挖掘”这个词本身就带有一丝神秘和高深的色彩,我担心它会过于偏重理论的抽象,而忽略了实际操作的指导。然而,这本书的实践导向性完全打消了我的顾虑。作者在原理讲解之后,紧密结合了各种主流的挖掘方法,并且用大量的篇幅阐述了这些方法的适用场景、优缺点以及实现细节。我尤其喜欢书中对一些经典算法的剖析,例如基于路径的方法、基于嵌入的方法等等,作者不仅给出了算法的数学模型,还辅以清晰的伪代码和图示,使得原本复杂的算法逻辑变得清晰可见。更难能可贵的是,书中还探讨了一些实际应用中的挑战,如数据稀疏性、噪声干扰等,并提供了相应的解决策略,这对于我们这些在实际工作中面临类似问题的研究者和工程师来说,无疑是宝贵的经验分享。读这本书,我感觉就像是跟一位资深的导师在进行一对一的深度交流,他不仅传授知识,更分享经验,指导我如何将理论应用于解决实际问题。
评分我是一名在校的研究生,我的研究方向涉及到利用图神经网络进行多模态数据分析,而《异构信息网络挖掘:原理和方法》这本书,可以说是我近期阅读过的最贴合我研究需求的学术专著了。我一直苦于找不到一本能够全面概括异构信息网络在机器学习,特别是深度学习领域应用的著作,而这本书恰恰满足了我的这一需求。它不仅梳理了异构信息网络的基本理论,更重要的是,它深入探讨了如何将这些网络结构与现代机器学习模型相结合,例如如何构建异构图的表示学习,如何设计适用于异构图的神经网络架构,以及如何在异构图上进行各种预测和推理任务。书中对这些前沿方法的介绍,引用了大量最新的研究成果,这对于我撰写学术论文和跟进领域最新动态非常有帮助。而且,书中对各种方法的对比分析,使得我能够更清晰地认识到不同方法的优势和局限性,从而更好地选择适合我研究问题的模型。这本书的深度和广度,让我受益匪浅。
评分作为一名在数据分析领域工作多年的从业者,我一直在思考如何更有效地处理和理解那些结构复杂、信息量庞大的异构数据集。市面上充斥着各种关于数据挖掘的书籍,但大多聚焦于同质性网络或简单的关系型数据,对于真正意义上的“异构”网络,系统性的讲解少之又少。这本书的出现,让我眼前一亮。它不仅仅是介绍算法,更重要的是,它提供了理解异构信息网络的思维方式和分析框架。书中对不同维度、不同粒度信息的整合与分析,以及如何从错综复杂的关系中提取有价值的洞见,这些都极大地拓宽了我的视野。我尤其欣赏书中在案例分析部分,是如何将理论方法巧妙地应用于实际场景,例如在推荐系统、知识图谱构建、金融风控等领域的应用,这些案例让我看到了异构信息网络挖掘的巨大潜力,也启发了我如何将这些方法应用到我自己的工作中,去解决那些过去难以攻克的难题。
评分这本书的出现,可以说是一场及时雨,填补了我长久以来在理解和应用异构信息网络方面存在的知识空白。我一直对那些由不同类型节点和关系交织而成的复杂网络充满了好奇,但市面上真正能够系统讲解其背后原理和实用方法的书籍却屈指可数。当我翻开《异构信息网络挖掘:原理和方法》时,立刻就被其严谨的逻辑和清晰的结构所吸引。作者并没有直接抛出晦涩难懂的算法,而是从最基础的概念入手,循序渐进地构建起对异构信息网络的认知框架。无论是对异构性的定义、不同类型节点和关系的表示,还是对网络结构特征的度量,都进行了详尽且易于理解的阐述。尤其让我印象深刻的是,书中对现实世界中异构信息网络应用的生动描绘,例如社交网络中的用户、内容、关系,以及电商平台中的商品、用户、评价等,这些贴近生活的例子,让我能够更直观地感受到理论知识的应用价值。这本书不仅仅是技术手册,更像是一位经验丰富的向导,带领我一步步深入探索异构信息网络的奇妙世界,为我后续深入学习和实践打下了坚实的基础。
评分装订很好。书有点薄,内容还没开始看。
评分还没看
评分书很好,一直读这个作者的书,希望优惠多
评分京东服务好靠谱
评分京东的速度一直没的说,自营产品目前选购的都还比较满意
评分快递好快,不到24小时就送到了
评分专业书,还没看,应该不错,物流快
评分不错的好书~
评分购买了一套书,这一套书写的挺好的,完整,涉及大数据,搜索引擎等几个方面的知识,快递也非常快。挺好的书。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 book.idnshop.cc All Rights Reserved. 静思书屋 版权所有