编辑推荐
相关领域专家的研究经验和实战经验
总结当今互联网领域中和推荐有关的产品和服务
Web 2.0时代的必读著作
以实战为基础,理论和实践并重,适合不同层次的读者。
《数学之美》作者吴军等强力推荐
内容简介
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代 。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。
作者简介
项亮,毕业于中国科学技术大学和中国科学院自动化所,研究方向为机器学习和推荐系统,现任职于北京Hulu软件技术开发有限公司,从事视频推荐的研究和开发。2009年参加Netflix Prize推荐系统比赛获得团体第二名,且于当年参与创建了Resys China推荐系统社区。
内页插图
精彩书评
“工程师大都喜欢‘In Action’型的书籍,但这并非‘又一本’工具型的‘In Action’读物,透过它你将涉足现代互联网公司孜孜以求的用户核心价值所在——个性化服务。也许一次全新的旅程就从这里开始。”
——阿稳,豆瓣算法工程师
“作者结合了多年的推荐系统理论研究和在Hulu的具体实践经验,汲取精华并以深入浅出的方式展示给读者。无论是对于刚入门的新手还是推荐领域的老兵,这本书都是不可多得的参考,在此我诚挚地向大家推荐它。”
——郑华, Hulu软件开发主管
“2009年8月,我和项亮一起发起了 Resys China——一个面向推荐系统领域的专业社区。在组织 Resys China 业内分享活动的过程中,我们迫切感受到,出版《推荐系统实践》这样一本传授实战经验的书籍,对推动这个领域的发展是多么必要。项亮作为国内推荐系统领域一位理论与实践并重的专家,把具实用价值的推荐技术进行了系统整理,深入浅出地呈现到读者面前。作为一本主要面向业内人员的技术书籍,这点尤其难能可贵。个性化推荐技术是具人文关怀的技术之一,它尊重个体,相信每个人都是与众不同的,在这个以‘人’为中心的社会化时代,它的兴起与发扬光大只是时间问题。我与项亮相识,是因为对推荐技术的热爱,希望借助此书,可以让更多的人成为朋友。”
——谷文栋,个性化推荐社区Resys China发起人
“从大家经常使用的相关搜索、话题推荐、电子商务的各种产品推荐,到社交网络上的交友推荐等,推荐系统在今天互联网的产品和应用中被广泛采用。但是,至今还没有一本书系统地从理论上对此进行分析和论述。《推荐系统实践》恰恰弥补了这个空白。”
——吴军,腾讯副总裁,《数学之美》和《浪潮之巅》作者
目录
第1章 好的推荐系统
1.1 什么是推荐系统
1.2 个性化推荐系统的应用
1.2.1 电子商务
1.2.2 电影和视频网站
1.2.3 个性化音乐网络电台
1.2.4 社交网络
1.2.5 个性化阅读
1.2.6 基于位置的服务
1.2.7 个性化邮件
1.2.8 个性化广告
1.3 推荐系统评测
1.3.1 推荐系统实验方法
1.3.2 评测指标
1.3.3 评测维度
第2章 利用用户行为数据
2.1 用户行为数据简介
2.2 用户行为分析
2.2.1 用户活跃度和物品流行度的分布
2.2.2 用户活跃度和物品流行度的关系
2.3 实验设计和算法评测
2.3.1 数据集
2.3.2 实验设计
2.3.3 评测指标
2.4 基于邻域的算法
2.4.1 基于用户的协同过滤算法
2.4.2 基于物品的协同过滤算法
2.4.3 UserCF和ItemCF的综合比较
2.5 隐语义模型
2.5.1 基础算法
2.5.2 基于LFM的实际系统的例子
2.5.3 LFM和基于邻域的方法的比较
2.6 基于图的模型
2.6.1 用户行为数据的二分图表示
2.6.2 基于图的推荐算法
第3章 推荐系统冷启动问题
3.1 冷启动问题简介
3.2 利用用户注册信息
3.3 选择合适的物品启动用户的兴趣
3.4 利用物品的内容信息
3.5 发挥专家的作用
第4章 利用用户标签数据
4.1 UGC标签系统的代表应用
4.1.1 Delicious
4.1.2 CiteULike
4.1.3 Last.fm
4.1.4 豆瓣
4.1.5 Hulu
4.2 标签系统中的推荐问题
4.2.1 用户为什么进行标注
4.2.2 用户如何打标签
4.2.3 用户打什么样的标签
4.3 基于标签的推荐系统
4.3.1 实验设置
4.3.2 一个最简单的算法
4.3.3 算法的改进
4.3.4 基于图的推荐算法
4.3.5 基于标签的推荐解释
4.4 给用户推荐标签
4.4.1 为什么要给用户推荐标签
4.4.2 如何给用户推荐标签
4.4.3 实验设置
4.4.4 基于图的标签推荐算法
4.5 扩展阅读
第5章 利用上下文信息
5.1 时间上下文信息
5.1.1 时间效应简介
5.1.2 时间效应举例
5.1.3 系统时间特性的分析
5.1.4 推荐系统的实时性
5.1.5 推荐算法的时间多样性
5.1.6 时间上下文推荐算法
5.1.7 时间段图模型
5.1.8 离线实验
5.2 地点上下文信息
5.3 扩展阅读
第6章 利用社交网络数据
6.1 获取社交网络数据的途径
6.1.1 电子邮件
6.1.2 用户注册信息
6.1.3 用户的位置数据
6.1.4 论坛和讨论组
6.1.5 即时聊天工具
6.1.6 社交网站
6.2 社交网络数据简介
6.3 基于社交网络的推荐
6.3.1 基于邻域的社会化推荐算法
6.3.2 基于图的社会化推荐算法
6.3.3 实际系统中的社会化推荐算法
6.3.4 社会化推荐系统和协同过滤推荐系统
6.3.5 信息流推荐
6.4 给用户推荐好友
6.4.1 基于内容的匹配
6.4.2 基于共同兴趣的好友推荐
6.4.3 基于社交网络图的好友推荐
6.4.4 基于用户调查的好友推荐算法对比
6.5 扩展阅读
第7章 推荐系统实例
7.1 外围架构
7.2 推荐系统架构
7.3 推荐引擎的架构
7.3.1 生成用户特征向量
7.3.2 特征?物品相关推荐
7.3.3 过滤模块
7.3.4 排名模块
7.4 扩展阅读
第8章 评分预测问题
8.1 离线实验方法
8.2 评分预测算法
8.2.1 平均值
8.2.2 基于邻域的方法
8.2.3 隐语义模型与矩阵分解模型
8.2.4 加入时间信息
8.2.5 模型融合
8.2.6 Netflix Prize的相关实验结果
后记
前言/序言
说起本书,还要追溯到2010年3月份的ResysChina推荐系统大会。在那次会议上,我遇到了刘江老师。刘老师看过我之前写的一些推荐系统方面的博客,希望我能总结总结,写本简单的书。当时国内还没有推荐系统方面的书,而国外已经有这方面的专业书了,因此图灵公司很想出版一本介绍推荐系统的书。所以,去年7月博士毕业时,我感觉有时间可以总结一下这方面的工作了,于是准备开始写这本书。
写这本书的目的有下面几个。首先,从个人角度讲,虽然写博士论文时已经总结了读博期间在推荐系统方面的工作,但并没有全部涉及整个推荐系统的各个方面,因此我很希望通过写作这本书全面地阅读一下相关的文献,并在此基础上总结一下推荐系统各个方面的发展现状,供大家参考。其次,最近几年从事推荐系统研究的人越来越多,这些人中有些原来是工程师,对机器学习和数据挖掘不太了解,有些是在校学生,虽然对数据挖掘和机器学习有所了解,却对业界如何实现推荐系统不太清楚。因此,我希望能够通过本书让工程师了解推荐系统的相关算法,让学生了解如何将自己了解的算法实现到一个真实的工业系统中去。
一般认为,推荐系统这个研究领域源于协同过滤算法的提出。这么说来,推荐系统诞生快20年了。这期间,很多学者和公司对推荐系统的发展起到了重要的推动作用,各种各样的推荐算法也层出不穷。本书希望将这20年间诞生的典型方法进行总结。但由于方法太多,这些方法的归类有很多不同的方式。比如,可以按照数据分成协同过滤、内容过滤、社会化过滤,也可以按照算法分成基于邻域的算法、基于图的算法、基于矩阵分解或者概率模型的算法。为了方便读者入门,本书基本采用数据分类的方法,每一章都介绍了一种可以用于推荐系统设计的、新类型的用户数据,然后介绍如何通过各种方法利用该数据,最后在公开数据集上评测这些方法。当然,不是所有数据都有公开的数据集,并且不是所有算法都可以进行离线评测。因此,在遇到没有数据集或无法进行离线评测的问题时,本书引用了一些著名学者的实验结果来说明各种方法的效果。
为了使本书同时适合工程师和在校学生阅读,本书在写作中同时使用了两种介绍方法。一种是利用公式,这样方便有一些理论基础的同学很快明白算法的含义。另一种是利用代码,这样可以方便工程师迅速了解算法的含义。不过因为本人是学生出身,工程经验还不是特别足,所以有些代码写得不是那么完美,还请工程师们海涵。
本书一开始写的时候有3位作者,除了我之外还有豆瓣的陈义和腾讯的王益。他们两位都是这方面的前辈,在写作过程中提出了很多宝贵的意见。但因为二位工作实在太繁忙,所以本书主要由我操刀。但书中的很多论述融合了大家的思想和经验,是我们很多次讨论的结果。因此在这里感谢王益和陈义二位合作者,虽然二位没有动笔,但对这本书做出了很大的贡献。
其次,还要感谢吴军老师和谷文栋为本书作序。感谢谷文栋、稳国柱、张夏天各自审阅了书中部分内容,提出了很多宝贵的意见。感谢我在Hulu的同事郑华和李航,郑华给了我充分的时间完成这本书,对这本书能够按时出版功不可没,而李航审阅了书中的部分内容,提出了很多有价值的修改意见。
最后感谢我的父母和妻子,他们在我写作过程中给予了很大照顾,感谢他们的辛勤付出。
推荐系统实践 epub pdf mobi txt 电子书 下载 2024
推荐系统实践 下载 epub mobi pdf txt 电子书 2024
评分
☆☆☆☆☆
好吃不贵,值得下次再来买哈哈哈
评分
☆☆☆☆☆
给老婆买的
评分
☆☆☆☆☆
内容涉及到的面和点还不错,只是作者的表达不够清晰,有的地方有还没把问题说清说透就跳走了,思维有点不太连续的感觉。
评分
☆☆☆☆☆
推荐系统必备教程,写的不错
评分
☆☆☆☆☆
物流满分,但是书籍纸张不太满意,感觉比较劣质,不过还能将就。
评分
☆☆☆☆☆
还好吧, 没有基础的人是看不懂, 没有任何实践性的东西。不会手把手教你操作, 也没有下载数据的来源,也没有实际操作各步骤的截图。叫实践,名字不好。
评分
☆☆☆☆☆
内容涉及到的面和点还不错,只是作者的表达不够清晰,有的地方有还没把问题说清说透就跳走了,思维有点不太连续的感觉。
评分
☆☆☆☆☆
东西很满意,非常值得购买,下次还来
评分
☆☆☆☆☆
专业书都超级贵,烧钱。但确实用的上,不得不买。