本文来自微信公众号 ”策略产品Arthur“,作者:策略产品Arthur,纷传经授权发布。
在推荐系统里,如果想解决有关“新用户冷启动”的问题,策略产品可以如何搭建策略解法?首要的,策略产品需要明确新用户的定义,接着,产品才可以更恰当地搭建召回和排序策略。本篇文章里,作者便针对新用户冷启动策略做了解读,一起来看。
今天顺着介绍冷启动另一个话题即——「用户冷启动」问题。
用户User冷启动与物品item在推荐系统中面临其实问题根源其实相同,都是因为物品item/用户user因为积累的样本数据量过少,模型无法准确学习进行准确的人货匹配,用户冷启动更直接的表现就是我不知道如何准确给对应的用户进行准确的推荐,用户访问推荐位就更加活跃,更有利于形成用户访问的留存。
在问题解决思路上,两种冷启动还是存在解决问题的思路差异,因此我们先来快速入门介绍一下关于用户冷启动背后的问题根源,以及目前对于新用户冷启动的解法。
01
用户USER冷启动问题背景
1. 新用户冷启动定义
用户冷启动主要解决如何给「新用户」推荐给他可能感兴趣的物料item的问题;但是电商场景的新用户不仅指纯激活的新客,而是指少行为、低活跃度的用户群体,这类用户在站内的行为少,因而深度模型在学习用户兴趣表达时,由于行为序特征稀疏,很难获得较好的效果。
2. 新用户所谓“新”的分类
根据定义的说明,新用户根据行为模式会划分成为以下两种类型,都属于用户行为样本在一定的时间戳范围内远远少于APP内用户的均值样本量,所以会在承接的策略上略微有差异;
纯新的激活、注册类型的用户;
长时间未登录APP的低活跃用户,包括对于老客促活、活动拉动回归的用户。
02
推荐系统如何解决新品冷启动问题的策略
策略解法核心思想:所有冷启动的核心思想都是为了试探性的让User用户产生更多的「行为样本」(点击、加购以及成交等兴趣行为)、「标签数据」(用户给自己打上运动户外、),核心目的就是让用户的画像、样本逐渐的完整。
1. 新用户注册信息输入方案
1)兴趣标签填写
为了帮助APP做快速用户冷启(非强制),会在用户刚注册时候提供填写「兴趣偏好」、「年龄」、「性别」等粗颗粒度用户注册的冷启动信息,这种偏向用户冷启动的手段而非策略。
这种方式对于用户User冷启动前期属于事半功倍的一种手段,对于微博、小红书以及豆瓣等图文推荐流媒体,以及网易云音乐这种主打歌单推荐平台有着非常大的必要性与帮助。
2)账户共享登陆
同公司画像、样本共享,或者是利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品Item,利用社交网络关系进行推荐的原因是自在于,在计算用户余弦相似度默认社交关系网朋友会相似度较高(类似你可能会喜欢)。
2. 规则化召回&相似老客个性化召回策略
规则化召回的方式更多的就是通过特定的召回规则方等等规则来实现,简单规则配置是默认这是绝大多数User用户都感兴趣的内容(例如最新的iPhone 14pro max,年初的冬奥会谷爱凌新闻,没有人不会对这个不感兴趣对吧),绝大多数的用户都会愿意去点击、收藏等行为。
1)热门规则物料召回
比方说「销量Top Sale近30天倒序排序」、「近30天点击率 Top CTR最高」,这种简单统计规则来进行商品的召回,个性化程度不足,但是前期对于用户产生行为行之有效。
2)基于bias特征的物料召回(前提是可以通过客户输入获取到可信特征)
通过用户特征将用户分群,比如地区、性别、年龄、渠道等bias特征,通过分析不同特征下的用户群体物料偏好差异来做细分的物料召回策略。实验数据来看,区分省份的热门物料召回策略收益较高。
3)个性化召回
这里大家看到不要奇怪,虽然新用户样本少,但是在完成对于新用户和老用户相似特诊KNN聚类之后,会把Jaccard距离相近的老用户个性化推荐内容给到冷启新用户进行推荐,因此这里再用DSSM或者attention特征时序的召回方式就和前面文章一样了。
但是需要核心注意的点就在于模型容易被老用户带偏,需要人为剔除一些强bias的样本特征(特征工程的一些核心工作,虽然琐碎但是对于结果又明显提升),可以考虑通过关注实验的效果来进行剔除。
3. 非个性化排序与个性化排序
用户冷启动如果光在召回方面有策略而不在排序增加策略,最终也是白搭,排序是最终前端展示的号码牌,因此会有很多排序的模块也要为新用户准备相应的策略:
1)热门排序
例如按照商品销量、点击率商品特征进行排序,这一类排序对于新用户还是比较行之有效的方法,原理如同上述热门物料召回类似。
2)Bandit模型排序
EE(探索与开发兴趣)下的经典冷启动模型,平衡准确性和多样性。多臂老虎机问题,我们用用户对不同item的兴趣来分别计算兴趣值,并且假设item的兴趣是符合Beta分布。
每个item都会对应一套(a,b)参数,通过上述公式来生成beta随机数;
将产生的随机数最大的臂作为结果,并且根据用户反馈,点击就a+1,否则就b+1,当所有的(a,b)都很大的时候,这个时候每一个beta分布都会接近中心的位置,选择所有臂中产生随机数最大的去摇。
3)行为序Attention特征强化
用户在APP的行为最直接的表达了用户的兴趣偏好。在行为序稀疏的情况下,尽可能地人工构造更丰富的行为序Session。例如用户对商品/类目/主播的点击、收藏、分享、加购、成交等一手行为序;此外也可以通过经验构造,例如用户观看时长达到一定阈值的商品、类目;还可以将行为序特征与用户的bias特征交叉等等方式获得的二手行为序。
03
总结与思考
新客冷启动策略整体的思考路径其实和新品item冷启动有点类似,让系统帮助用户快速积累行为样本,达到稳定性、多样性的投放状态;但是在解法策略上还是有比较多的差异,最核心的步骤需要先定义清楚你的新用户user的定义,再针对不同的user来做相应的召回、排序策略。