内容简介
赵致辰
本硕毕业于清华大学电子工程系。主要研究方向包括动作识别、人脸识别、广告和推荐中的排序模型及冷启动问题等,发表相关学术领域论文7篇。曾从事移动端人脸识别工作,开发的红外人脸识别算法应用于国内多款手机;在推荐领域,提出的“POSO”模型在用户冷启动问题上取得突破性收益,已经在业界广泛应用,国内外多家公司与产品如TikTok、快手、Meta等都在以POSO为原型探索冷启动模型
作品目录
总览篇
第 1 章 推荐系统概述 ............................................................................................. 2
1.1 推荐系统是什么 .......................................................................................... 2
1.2 推荐系统发展的天时、地利、人和 .......................................................... 4
1.2.1 天时 .................................................................................................. 6
1.2.2 地利 .................................................................................................. 6
1.2.3 人和 .................................................................................................. 7
第 2 章 现代推荐链路 ............................................................................................. 9
2.1 召回、粗排、精排——各有所长 .............................................................. 9
2.2 召回、粗排、精排——级联漏斗 ............................................................ 13
2.3 打压、保送、重排——拍不完的脑袋 .................................................... 20
模型篇
第 3 章 精排之锋 ................................................................................................... 25
3.1 简单“复读机”——逻辑回归模型 ........................................................ 25
3.2 工业逻辑回归模型的稀疏性要求 ............................................................ 29
3.3 FM 的一小步,泛化的一大步 ................................................................. 34
3.4 多彩的 FNN/PNN/ONN/NFM 世界 ......................................................... 37
3.5 高阶交叉 ................................................................................................... 41
3.6 工具人 GBDT ............................................................................................ 45
3.7 嵌入表示亦福亦祸,树模型的新机遇 .................................................... 49
3.8 DNN 与两大门派,“一念神魔”与功不唐捐 ........................................ 53
3.9 再论特征与嵌入生成 ................................................................................ 58
3.10 机器学习唯一指定王牌技术——注意力机制 ...................................... 62
3.11 注意力机制的几种写法 .......................................................................... 65
3.12 Transformer 的升维打击 ......................................................................... 69
第 4 章 粗排之柔 ................................................................................................... 72
4.1 粗排存在与否的必要性 ............................................................................ 73
4.2 粗排复杂化的方法 .................................................................................... 73
4.3 Pair-wise 与 List-wise ................................................................................ 74
第 5 章 召回之厚 ................................................................................................... 76
5.1 u2i 之双塔进击史 ..................................................................................... 76
5.2 i2i 及 u2u2i 方案 ....................................................................................... 81
5.3 近似搜索概览 ............................................................................................ 85
5.3.1 向量量化类方法 ............................................................................ 86
5.3.2 基于图的搜索 ................................................................................ 87
5.4 树模型与类树模型的冲击 ........................................................................ 89
第 6 章 模型迭代的术与道 .................................................................................... 93
6.1 什么是“老汤模型” ................................................................................ 93
6.2 模型迭代的“术” .................................................................................... 96
6.3 模型迭代的“道” .................................................................................... 98
前沿篇
第 7 章 用户兴趣建模 ......................................................................................... 101
7.1 从百到万的用户长期兴趣建模 .............................................................. 101
7.1.1 从百到千 ...................................................................................... 102
7.1.2 从千到万 ...................................................................................... 102
7.2 用户多峰兴趣建模 .................................................................................. 104
第 8 章 多任务学习 ............................................................................................. 107
8.1 多任务学习的实践意义 .......................................................................... 107
8.2 多任务学习的基本框架 .......................................................................... 110
8.3 平行关系建模——MMoE 类方法 ......................................................... 113
8.4 非平行关系建模,任务间的因果 .......................................................... 117
第 9 章 非梯度场景 ............................................................................................. 121
9.1 线上与线下的鸿沟 .................................................................................. 121
9.2 弱个性化 CEM,强个性化强化学习 .................................................... 124
9.3 探微参数与性能的关系,把点连成面 .................................................. 128
第 10 章 探索与利用 ........................................................................................... 133
10.1 为什么要探索与利用 ............................................................................ 133
10.2 探索的本质是巧妙“贪心” ................................................................ 136
第 11 章 后精排环节 ........................................................................................... 139
11.1 定义多样性问题,简单的形式与复杂的标准 .................................... 139
11.2 DPP 算法与多样性 ............................................................................... 142
11.3 考虑上下文的重排序 ............................................................................ 144
第 12 章 推荐中的偏差与消除............................................................................. 147
12.1 各种各样的偏差 .................................................................................... 147
12.2 流行度偏差的消除 ................................................................................ 148
12.3 位置偏差的消除 .................................................................................... 151
第 13 章 自动机器学习技术 ................................................................................ 155
13.1 网络结构搜索与网络微操的探索 ........................................................ 155
13.2 特征的搜索 ............................................................................................ 159
13.3 模型压缩 ............................................................................................... 161
第 14 章 图计算 .................................................................................................. 165
14.1 数据结构的终极 .................................................................................... 165
14.2 GNN 的极简发展史 .............................................................................. 168
14.3 物料非原子化,建模转向图 ................................................................ 171
难点篇
第 15 章 延迟转化 ............................................................................................... 175
15.1 转化与广告机制 .................................................................................... 175
15.2 转化的分解 ............................................................................................ 177
15.3 其他角度 ............................................................................................... 178
第 16 章 物料冷启动 ........................................................................................... 181
16.1 “多模态之石,可以攻玉” ................................................................ 181
16.2 预排序向左,个性化向右 .................................................................... 184
16.3 流量分配,“普度众生”还是“造神” .............................................. 188
第 17 章 用户冷启动 ........................................................................................... 191
17.1 元学习,对模型拔高的要求 ................................................................ 191
17.2 初始化的基底分解与生成 .................................................................... 195
17.3 POSO,首个从结构角度改善用户冷启动的模型 .............................. 197
17.4 精品池:抓住人性需求 ........................................................................ 201
第 18 章 因果推断 ............................................................................................... 204
18.1 当分布不够用时 .................................................................................... 204
18.2 寻找“工具人”,将因果推断直接应用于推荐 ................................ 209
第 19 章 长尾优化 ............................................................................................... 212
决策篇
第 20 章 流量 ...................................................................................................... 218
20.1 重新认识流量 ........................................................................................ 218
20.1.1 流量区分快慢 ............................................................................ 219
20.1.2 流量区分成本高低 .................................................................... 220
20.1.3 流量是盲目的 ............................................................................ 220
20.1.4 流量是有“圈子”的 ................................................................ 221
20.2 时间的研究 ............................................................................................ 222
第 21 章 分层 ...................................................................................................... 224
21.1 你必须理解的物料生命周期 ................................................................ 224
21.2 你必须理解的用户分层 ........................................................................ 228
21.3 三阶段让用户为我“死心塌地” ........................................................ 231
第 22 章 实验现象与回收 .................................................................................... 234
22.1 决策上线的黄金法则 ............................................................................ 234
22.2 “临门一脚”,结果真的置信了吗 ...................................................... 237
22.3 不万能的 A/B 实验和难以归因的反转 ............................................... 239
22.4 线上和线下的对齐——无穷逼近 ........................................................ 241
后记 ....................................................................................................................... 243
参考文献 ............................................................................................................... 244
· · · · · ·
作者简介
赵致辰
本硕毕业于清华大学电子工程系。主要研究方向包括动作识别、人脸识别、广告和推荐中的排序模型及冷启动问题等,发表相关学术领域论文7篇。曾从事移动端人脸识别工作,开发的红外人脸识别算法应用于国内多款手机;在推荐领域,提出的“POSO”模型在用户冷启动问题上取得突破性收益,已经在业界广泛应用,国内外多家公司与产品如TikTok、快手、Meta等都在以POSO为原型探索冷启动模型