构建企业级推荐系统:算法、工程实现与案例分析
上QQ阅读APP看书,第一时间看更新

8.4.2 标的物冷启动

针对新上线的标的物,基于上述7大冷启动解决思路,可行的解决标的物冷启动的方案与策略有如下几类。

1.利用标的物的metadata信息做推荐

标的物的metadata信息是我们了解标的物的最好媒介,基于metadata信息可以方便地解决标的物冷启动问题,具体方法如下。

(1)利用标的物跟用户行为的相似性

可以通过提取新入库的标的物的特征(如标签、采用TF-IDF算法提取的文本特征、基于深度学习提取的图像特征等),通过计算标的物特征跟用户行为特征(通过他看过的标的物特征的叠加,如加权平均等)的相似性,从而将标的物推荐给与它最相似的用户。

(2)利用标的物跟标的物的相似性

可以基于标的物的属性信息来做推荐,一般新上线的标的物或多或少都是有一些属性的,根据这些属性找到与该标的物最相似(利用余弦相似度等相似算法)的标的物,这些相似的标的物被哪些用户“消费”过,可以将该标的物推荐给这些消费过与之相似的标的物的用户。

2.采用快速试探策略

另外一种思路是借用强化学习中的EE(Exploration-Exploitation)思想,将新标的物曝光给一批随机用户,观察用户对标的物的反馈,找到对该标的物有正向反馈(观看、购买、收藏、分享等)的用户,后续将该标的物推荐给有正向反馈的用户或者与该用户相似的用户。

该方法特别适合像淘宝这种提供平台的电商公司以及像今日头条、快手、阅文等UGC平台公司,它们需要维护第三方生态的繁荣,所以需要将第三方新生产的标的物尽可能地推荐出去,让第三方有利可图。同时通过该方式也可以快速知道哪些新的标的物是大受用户欢迎的,找到这些标的物,也可以提升自己平台的营收。

这种思路其实就是一种流量池的思路。在不知道标的物是不是受欢迎时,先试探性地将标的物曝光给一批种子用户,看种子用户对标的物的反馈,如果反馈良好,再推荐给更多的用户,否则减少推荐量。这种方式可以很好地对新标的物进行精细控制,也有利于用户体验的提升(不受欢迎的标的物后面就可以不给流量支持了)。这对于平台上提供内容输出的第三方也是有好处的,如果你的内容足够好,采用流量池的思路是可以短期引爆内容的,从而可以为自己带来极大的用户关注,最终成就更多的商业价值。

3.采用基于关系传递的策略

当产品处在拓展标的物品类的阶段时,比如视频类应用,前期只做长视频,后来拓展到短视频,那么对某些没有短视频观看行为的用户,怎么给他做短视频推荐呢?可行的方式是借用数学中关系的传递性思路,利用长视频观看历史,计算出长视频与用户的相似度。对新入库的短视频,我们可以先计算与该短视频相似的长视频,再将该短视频推荐给喜欢与它相似的长视频的用户。

该相似关系的传递性可描述为:短视频与长视频有相似关系,长视频与喜欢它的用户有相似关系,最终得到短视频与用户有相似关系。