如何能牢牢地黏住老用户、吸引新用户、读懂用户的偏好兴趣和喜怒哀乐,这都是对企业发展至关重要甚至关乎生死存亡的问题,解决这个问题的方法就是推荐系统。本书分为上中下三篇,共13章,上篇为用户画像知识工程基础,包括表征建模、画像计算、存储及各种更新维护等管理操作;中篇为推荐系统与用户画像,包括传统协同过滤等经典推荐算法的介绍,以及涉及用户画像的推荐方法;下篇为应用案例分析,包括Netflix、阿里等数据竞赛的经典数据案例,以及在具体工程开发过程的具体案例,分别从系统需求、总体结构、算法设计、运行流程及测试结果等五个方面提供详细案例指导。
上 篇
第1章 用户画像概述 3
1.1 用户画像数据来源 3
1.1.1 用户属性 5
1.1.2 用户观影行为 5
1.2 用户画像特性 5
1.2.1 动态性 5
1.2.2 时空局部性 6
1.3 用户画像应用领域 6
1.3.1 搜索引擎 6
1.3.2 推荐系统 7
1.3.3 其他业务定制与优化 7
1.4 大数据给用户画像带来的机遇与挑战 8
第2章 用户画像建模 9
2.1 用户定量画像 9
2.2 用户定性画像 10
2.2.1 标签与用户定性画像 10
2.2.2 基于知识的用户定性画像分析 12
2.2.3 用户定性画像的构建 16
2.2.4 定性画像知识的存储 22
2.2.5 定性画像知识的推理 26
2.3 本章参考文献 29
第3章 群体用户画像分析 31
3.1 用户画像相似度 32
3.1.1 定量相似度计算 32
3.1.2 定性相似度计算 34
3.1.3 综合相似度计算 35
3.2 用户画像聚类 36
第4章 用户画像管理 41
4.1 存储机制 41
4.1.1 关系型数据库 42
4.1.2 NoSQL数据库 43
4.1.3 数据仓库 45
4.2 查询机制 46
4.3 定时更新机制 47
4.3.1 获取实时用户信息 47
4.3.2 更新触发条件 48
4.3.3 更新机制 49
中 篇
第5章 视频推荐概述 55
5.1 主流推荐方法的分类 56
5.1.1 协同过滤的推荐方法 56
5.1.2 基于内容的推荐方法 57
5.1.3 基于知识的推荐方法 59
5.1.4 混合推荐方法 60
5.2 推荐系统的评测方法 61
5.3 视频推荐与用户画像的逻辑关系 61
第6章 协同过滤推荐方法 65
6.1 概述 65
6.2 关系矩阵及矩阵计算 67
6.2.1 U-U矩阵 67
6.2.2 V-V矩阵 70
6.2.3 U-V矩阵 72
6.3 基于记忆的协同过滤算法 74
6.3.1 基于用户的协同过滤算法 75
6.3.2 基于物品的协同过滤算法 78
6.4 基于模型的协同过滤算法 81
6.4.1 基于隐因子模型的推荐算法 82
6.4.2 基于朴素贝叶斯分类的推荐算法 85
6.5 小结 88
6.6 本章参考文献 88
第7章 基于内容的推荐方法 91
7.1 概述 91
7.2 CB推荐中的特征向量 94
7.2.1 视频推荐中的物品画像 94
7.2.2 视频推荐中的用户画像 96
7.3 基础CB推荐算法 97
7.4 基于TF-IDF的CB推荐算法 99
7.5 基于KNN的CB推荐算法 102
7.6 基于Rocchio的CB推荐算法 104
7.7 基于决策树的CB推荐算法 106
7.8 基于线性分类的CB推荐算法 107
7.9 基于朴素贝叶斯的CB推荐算法 109
7.10 小结 111
7.11 本章参考文献 111
第8章 基于知识的推荐方法 113
8.1 概述 113
8.2 约束知识与约束推荐算法 114
8.2.1 约束知识示例 114
8.2.2 约束满足问题 115
8.2.3 约束推荐算法流程 117
8.3 关联知识与关联推荐算法 118
8.3.1 关联规则描述 118
8.3.2 关联规则挖掘 121
8.3.3 关联推荐算法流程 123
8.4 小结 124
8.5 本章参考文献 124
第9章 混合推荐方法 125
9.1 概述 125
9.2 算法设计层面的混合方法 126
9.2.1 并行式混合 126
9.2.2 整体式混合 129
9.2.3 流水线式混合 131
9.2.4 典型混合应用系统 133
9.3 混合式视频推荐实例 136
9.3.1 MoRe系统概览 136
9.3.2 MoRe算法介绍 137
9.3.3 MoRe算法混合 139
9.3.4 MoRe实验分析 140
9.4 小结 142
9.5 本章参考文献 142
第10章 视频推荐评测 145
10.1 概述 145
10.2 视频推荐试验方法 146
10.2.1 在线评测 147
10.2.2 离线评测 149
10.2.3 用户调查 150
10.3 视频离线推荐评测指标 151
10.3.1 准确度指标 151
10.3.2 多样性指标 159
10.4 小结 161
10.5 本章参考文献 162
下 篇
第11章 系统层面的快速推荐构建 165
11.1 概述 165
11.2 本章主要内容 166
11.3 系统部署 166
11.3.1 Hadoop2.2.0系统部署 166
11.3.2 Hadoop运行时环境设置 169
11.3.3 Spark与Mahout部署 175
11.4 Mahout推荐引擎介绍 181
11.4.1 Item-based算法 181
11.4.2 矩阵分解 185
11.4.3 ALS算法 187
11.4.4 Mahout的Spark实现 190
11.5 快速实战 193
11.5.1 概述 193
11.5.2 日志数据 194
11.5.3 运行环境 196
11.5.4 基于Mahout Item-based算法实践 201
11.5.5 基于Mahout ALS算法实践 205
11.6 小结 208
11.7 本章参考文献 208
第12章 数据层面的分析与推荐案例 211
12.1 概述 211
12.2 本章主要内容 212
12.3 竞赛内容和意义 212
12.3.1 竞赛简介 212
12.3.2 竞赛任务和意义 213
12.4 客户-商户数据 215
12.4.1 数据描述 215
12.4.2 数据理解与分析 217
12.5 算法流程设计 219
12.5.1 特征提取 219
12.5.2 分类器设计 220
12.5.3 算法流程总结 222
12.6 小结 222
12.7 本章参考文献 223
本书是一位计算机专家与一位人类学家思想碰撞的结晶,针对那些无法通过传统方法解决的系统问题,为我们介绍了分析与理解这类问题
《爆红》内容简介:本书是实战派营销人、10亿销量爆品操盘手、“合伙人式营销服务机构”源石传媒创始人廖恒,结合自己12年的行业全
本书共分为10章,系统全面地介绍了HTML5规范的核心内容,以及这些内容在当前浏览器中的支持情况,并告知开发者如何在当前的环境下
《马克思主义中国化进程中经典著作编译与传播研究(1949—1978)》内容简介:新中国成立70年以来,马克思主义经典著作在中国的编译
《天工开物》是世界上第一部关于农业和手工业生产的综合性著作,是中国古代一部综合性的科学技术著作。本书由我国著名的自然科学
《可是,我开的是书店》内容简介:一间书店的生存守则:防火防盗,防电商降价,防网红打卡,防幼儿托管,防只看不买 多重视角切换下
本书描述的是在逆向与反逆向之间展开的一场旷日持久的拉锯战。作者EldadEilam以一个解说人的身份为我们详尽地评述了双方使用的每
GooglebuilttheGolanguagefromthegrounduptosimplifythechallengesofmodernapplicatio...
科学计算自由软件SCILAB基础教程 内容简介 本书是关于科学计算自由软件SCILAB的入门教材。本书前三章分别介绍了SCILAB环境,SCILAB数据类型、运...
本书是一部内容广泛、见解深刻的极有分量的论文集,其作者一批活跃在当代西方文坛上的文化名人、著名设计学家和科学家,有些还曾
《找对人:企业人才招聘与选拔方法精要》内容简介:本书聚焦企业“选人”之道。书中对人才标准的制定、人才的来源、人才招聘和选拔
人工智能 本书特色 本书是“OHM大学理工系列”之一。书中简明扼要地介绍了基于搜索的问题求解、知识表示和推理、机器学习、模糊理论-精神网络-遗传算法、模糊识别,...
《新思想 新境界》内容简介:该书稿以马克思主义理论为指导,紧扣贯彻落实习近平新时代中国特色社会主义思想和十九大报告精神,分专
“即便我已经使用Erlang多年,在编程的时候仍然需要参考《Erlang编程指南》。不同层次的Erlang程序员都会发现本书是有价值的学习
Itsallinthename:LearnYouaHaskellforGreatGood!isahilarious,illustratedguidetothis...
Spring框架是主要的开源应用程序开发框架,它使得Java/J2EE开发更容易、效率更高。本书不仅向读者展示了Spring能做什么?而且揭示
《移动互联网时代文化产业商业模式》内容简介:这是一本面向大众,将国家社科基金重大项目"我国文化产业发展战略研究”之子课题"中
《旅行者的梦》内容简介:本书是作者以《旅行者的梦》一诗有感而发创作的乐队作品。在我国这部作品是首次出版。作品于2016年进行世
实用数据库教程 本书特色 《实用数据库教程》是数据库的*新教程,它包括数据库原理、数据库设计模式和数据库应用,共计3篇16章。其中第2篇的第6、7、8三章为数据...
《微视,这么玩才赚钱!》内容简介:这是一本介绍个人如何利用微视创业(赚钱)、企业如何通过微视迅速提升经营业绩(赚更多钱)的