内容简介:
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(information overload)的时代 。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。
目 录
第1章 好的推荐系统 1
1.1 什么是推荐系统 1
1.2 个性化推荐系统的应用 4
1.2.1 电子商务 4
1.2.2 电影和视频网站 8
1.2.3 个性化音乐网络电台 10
1.2.4 社交网络 12
1.2.5 个性化阅读 15
1.2.6 基于位置的服务 16
1.2.7 个性化邮件 17
1.2.8 个性化广告 18
1.3 推荐系统评测 19
1.3.1 推荐系统实验方法 20
1.3.2 评测指标 23
1.3.3 评测维度 34
第2章 利用用户行为数据 35
2.1 用户行为数据简介 36
2.2 用户行为分析 39
2.2.1 用户活跃度和物品流行度的分布 39
2.2.2 用户活跃度和物品流行度的关系 41
2.3 实验设计和算法评测 41
2.3.1 数据集 42
2.3.2 实验设计 42
2.3.3 评测指标 42
2.4 基于邻域的算法 44
2.4.1 基于用户的协同过滤算法 44
2.4.2 基于物品的协同过滤算法 51
2.4.3 UserCF和ItemCF的综合比较 59
2.5 隐语义模型 64
2.5.1 基础算法 64
2.5.2 基于LFM的实际系统的例子 70
2.5.3 LFM和基于邻域的方法的比较 72
2.6 基于图的模型 73
2.6.1 用户行为数据的二分图表示 73
2.6.2 基于图的推荐算法 73
第3章 推荐系统冷启动问题 78
3.1 冷启动问题简介 78
3.2 利用用户注册信息 79
3.3 选择合适的物品启动用户的兴趣 85
3.4 利用物品的内容信息 89
3.5 发挥专家的作用 94
第4章 利用用户标签数据 96
4.1 UGC标签系统的代表应用 97
4.1.1 Delicious 97
4.1.2 CiteULike 98
4.1.3 Last.fm 98
4.1.4 豆瓣 99
4.1.5 Hulu 99
4.2 标签系统中的推荐问题 100
4.2.1 用户为什么进行标注 100
4.2.2 用户如何打标签 101
4.2.3 用户打什么样的标签 102
4.3 基于标签的推荐系统 103
4.3.1 实验设置 104
4.3.2 一个最简单的算法 105
4.3.3 算法的改进 107
4.3.4 基于图的推荐算法 110
4.3.5 基于标签的推荐解释 112
4.4 给用户推荐标签 115
4.4.1 为什么要给用户推荐标签 115
4.4.2 如何给用户推荐标签 115
4.4.3 实验设置 116
4.4.4 基于图的标签推荐算法 119
4.5 扩展阅读 119
第5章 利用上下文信息 121
5.1 时间上下文信息 122
5.1.1 时间效应简介 122
5.1.2 时间效应举例 123
5.1.3 系统时间特性的分析 125
5.1.4 推荐系统的实时性 127
5.1.5 推荐算法的时间多样性 128
5.1.6 时间上下文推荐算法 130
5.1.7 时间段图模型 134
5.1.8 离线实验 136
5.2 地点上下文信息 139
5.3 扩展阅读 143
第6章 利用社交网络数据 144
6.1 获取社交网络数据的途径 144
6.1.1 电子邮件 145
6.1.2 用户注册信息 146
6.1.3 用户的位置数据 146
6.1.4 论坛和讨论组 146
6.1.5 即时聊天工具 147
6.1.6 社交网站 147
6.2 社交网络数据简介 148社交网络数据中的长尾分布 149
6.3 基于社交网络的推荐 150
6.3.1 基于邻域的社会化推荐算法 151
6.3.2 基于图的社会化推荐算法 152
6.3.3 实际系统中的社会化推荐算法 153
6.3.4 社会化推荐系统和协同过滤推荐系统 155
6.3.5 信息流推荐 156
6.4 给用户推荐好友 159
6.4.1 基于内容的匹配 161
6.4.2 基于共同兴趣的好友推荐 161
6.4.3 基于社交网络图的好友推荐 161
6.4.4 基于用户调查的好友推荐算法对比 164
6.5 扩展阅读 165
第7章 推荐系统实例 166
7.1 外围架构 166
7.2 推荐系统架构 167
7.3 推荐引擎的架构 171
7.3.1 生成用户特征向量 172
7.3.2 特征?物品相关推荐 173
7.3.3 过滤模块 174
7.3.4 排名模块 174
7.4 扩展阅读 178
第8章 评分预测问题 179
8.1 离线实验方法 180
8.2 评分预测算法 180
8.2.1 平均值 180
8.2.2 基于邻域的方法 184
8.2.3 隐语义模型与矩阵分解模型 186
8.2.4 加入时间信息 192
8.2.5 模型融合 193
8.2.6 Netflix Prize的相关实验结果 195
后记 196
《曹操传》内容简介:曹操是个历史评价非常复杂的人物,他战黄巾,讨董卓,剿灭吕布、袁术、公孙瓒,击败袁绍,收降刘琮、张绣等,
BookDescriptionWiththenumberofsecurityflawsandexploitsdiscoveredandreleasedevery...
《Kafka Streams实战》内容简介:Kafka Streams是Kafka提供的一个用于构建流式处理程序的Java库,它与Storm、Spark等流式处...
不要懷疑,所有的問題都可以用圖畫來釐清。你不用具備什麼繪畫技巧,只要會畫圓圈、方塊、箭頭,然後按照作者的指示,一步一步,
如同某种势不可挡的新型病毒,地下黑客圈子流言四起:某个聪明绝顶、胆大妄为的家伙发动了对线上犯罪网络的恶意接管,这个犯罪网
《郭敬明,不为所动》内容简介:郭敬明说,“我身上的时间是凝固的状态,我面前的年轻人永远都是17岁”。从身高外貌到抄袭拜金,十
《晏殊词选》内容简介:晏殊,字同叔,因他死后谥为元献,所以后人又称之为晏元献。抚州临川(今江西抚州)人。为北宋前期词坛领袖
《微店+营销,你该这样玩》内容简介:微商,诞生于2009年,2014年开始被大家所熟知。微店的各种操作、功能都属于基础知识,是每个微
《请赴音乐的盛宴》内容简介:古典音乐应该怎么听?有哪些曲子不可错过?面对璀璨如群星的大师,浩渺如烟海的名曲,每一个初涉“乐
本书是原创Java技术图书领域继《深入理解Java虚拟机》后的又一实力之作,也是全球首本基于最新OSGiR5.0规范的著作。理论方面,既
《工程和设计中的人因学(第7版)》的核心是论述人因学的问题,即研究“为人所用而设计”(DesigningforHumanUse)的问题。它把系统
本书是根据国家教育委员会1995年颁布的高等工业学校《信号与系统课程教学基本要求》,在《信号与线性系统分析》(1986年高教版)一
无R语言数据分析与可视化从入门到精通 本书特色 1. 理论为辅、实践为主。本书涉及一些必要的理论知识,特别是在数据分析部分,但总体以实践为主,因此几乎每节都有大...
Thisgroundbreakingbookdefinestheemergingfieldofinformationvisualizationandoffers...
《锦衣卫》内容简介:还原历史上真正的锦衣卫 从锦衣卫角度讲述明朝政治机构的原貌 谈到明代,区别于其他朝代的最显著特征大概就是
Howdidthepopularityofunderwearinthetwelfthcenturyleadtotheinventionoftheprinting...
《HarmonyOS应用开发与实践》内容简介:本书以物联网智慧农业移动端应用系统的开发为例,讲解了在HarmonyOS中进行移动开发的方法,
《纳税筹划实战精选百例(第6版)》内容简介:全书根据2016年3月23日后颁布的“营改增”政策修订,集实例与纳税筹划方案于一体,包
Tmall商家成长部(peixun.tmall.com)诞生于天猫旗下,肩负整个天猫电商成长与发展的重任,担负着中国电子商务转型与升级的使命。
《现代编译器的Java实现》(第2版)可作为高等院校编译技术课程的教材、教师参考书以及编译技术研究人员的参考资料。目录 第一部分