推荐系统:产品与算法解析
上QQ阅读APP看书,第一时间看更新

1.1 媒介创新比内容更重要

正如传播学权威Marshall Mcluhan在《理解媒介:论人的延伸》(Understanding Media: The Extensions of Man)一书中所述,人们常常过于关注内容本身,而忽略了媒介在传播内容中的重要性。事实上,媒介即讯息,在媒介约定的范式下对内容进行理解和创作,其根本特性不在于内容,而在于媒介。回顾推荐产品的发展历程,其诸多变革也是在产品经理洞察到这一点后从媒介层面发起的,例如从图文到短视频、从短视频到微视频等。因此,本节将基于我对媒介变迁趋势的几点理解,来推演推荐系统未来的发展方向,并讨论从业者在这一趋势中应承担的社会责任。

1.1.1 媒介变迁的趋势展望

与自然界中的物种演化相似,如果将各种媒介视为彼此竞争的生命体,那么媒介的变迁历程可以看作高竞争力媒介逐步取代低竞争力媒介的过程。按照我的理解,鉴于创作者的诉求,大部分媒介希望通过更少的创作投入来赢得更多的社会注意力。换言之,媒介竞争力可以表述为公式(1.1):

媒介竞争力=社会注意力/创作成本 (1.1)

其中,社会注意力是媒介所吸引的用户关注度,可以通过时长、互动次数等指标来衡量;创作成本是创作和传播该媒介内容所需的成本,可以通过时间、金钱等资源来衡量。这就意味着,为了提升竞争力,媒介会在增加内容信息密度、提高传播效率和降低创作成本这3个维度上进行持续创新。本节将从这3个维度出发梳理媒介变迁的脉络。

1.创作成本的不断降低

科技发展使内容创作变得非常便捷曾经只是一种预测,然而,随着GPT等大模型技术的出现,未来其实已经悄然到来。接下来,我们就通过回顾几次经典的媒介变迁,来印证内容创作成本不断降低的趋势。

从手写到GPT。虽然印刷术的发明使文字得以被大规模地记录,但只有少数知识分子能够著书立说。如今有了GPT这样的大语言模型之后,人人都可以快速生成一段高质量的文本。

从密纹唱片到磁带。密纹唱片在录制过程中不能对原始录音做修改,所以对演奏家提出了较高的要求。为了降低创作成本,唱片公司陆续转向使用容易编辑的磁带来作为唱片的母带。

从大型照相机到手机。从1839年Louis Daguerre发明的第一台可携式木箱照相机,到便携式的单反相机,再到如今的手机,摄影的创作门槛和成本在持续降低。此外,2022年Midjourney这样的图像生成产品不断涌现,用户甚至可以摒弃手机直接创作出照片。

回顾上述内容创作历程的变迁,不禁让人感慨。在机械时代,摄影等复制技术的出现造就了“世物皆同”的感觉,虽然这引领了现代艺术的诞生,但同时也让古典艺术随之消亡。如今,我们已步入更为真假难辨的AI时代,未来艺术和创作的精神内核是什么?又会以怎样的形式呈现呢?

2.内容信息密度的不断提高

内容越变越短,这并不难理解,但是如果反过来问,为什么之前的媒介内容会这么长,可能很多人就不清楚了。因此,我们就先从这个角度出发来讨论几种典型的长时长媒介,以帮助理解媒介即讯息的关键所在。

粗纹唱片与流行音乐时长。早期唱片的原料是易碎而脆弱的粗纹虫胶,一张12英寸的粗纹唱片单面只能录制5分钟,这就迫使创作者将20分钟以上的古典音乐压缩到5分钟以内。出乎意料地,因为这种信息密度更高的音乐形式更易于传唱,所以催生出了如今人们所熟悉的流行音乐,即使后来虫胶唱片被单面录音时长可达25分钟的密纹唱片所取代,音乐时长的黄金标准也无法再回到20分钟以上了。

城市化和电影时长。电影起源于20世纪初城市化发展的高速期,那个年代的露天电影院大多比较偏远,所以若是想吸引用户,电影就必须是一种高信息密度且时长较长的内容形式。只有这样,才能让花费了开车时间成本和电影票成本的用户感到物有所值。

不难看出,早先媒介的内容之所以较长,和当时的社会背景、技术条件息息相关,并随着人们习惯的固化逐渐演变成了金科玉律。因此,回到媒介希望赢得用户注意力的本质上来说,媒介不仅可以被创新,而且创新媒介的效果往往比创新内容更为根本。这里抛砖引玉,列举几种常见的媒介创新思路。

做加法的媒介融合。从远古时期起,视觉就是人们接收信息的主要方式之一,因此相对于需要复杂编解码的文字来说,视频的理解成本更低。但是,这并不代表视频媒介具有最高的信息密度,例如抖音的内核不是视频,而是更能表达情绪的音乐。只不过抖音将音乐和视频进行了巧妙的结合,这才获得了“1+1>2”的神奇效果。

做减法的快节奏内容。移动互联网时代内容的载体是手机,而手又难以闲下来,因此就有了激发用户在碎片时间使用产品的可能性。要在这种场景下抢夺用户的注意力,需要做的是减法,以找到一种既不太消耗精力和时间又能保证高信息密度的媒介。于是,微视频和短文章等更快节奏的媒介应运而生,并让抖音等抓住机遇的产品成为如今非常流行的推荐产品。

全新的媒介载体。Apple Vision Pro是一种将数字内容和物理空间无缝融合、更加身临其境的具备强交互能力的全新载体。在这种超越传统二维屏幕界面的载体中,未来有可能涌现出很多更能吸引人们注意力的全新媒介。

3.传播效率的不断提升

早在机械复制时代,内容就已经可以被制成信号向公众传播,如今,随着社交网络、推荐产品等新内容分发渠道的出现,内容传播的效率被进一步提高,像火箭发射失败这样远在天边的事件,可以瞬间传播至全球各地。接下来再举几个经典的媒介变迁案例,以印证传播效率不断提升的趋势。

从报纸到广播。20世纪初,报纸是主要的信息来源。然而,随着广播的出现,人们发现其不仅可以更快地传播信息,传输成本也相对较低,于是使得广播逐渐取代报纸,成为当时主要的信息传播媒介。

从磁带到CD机。虽然磁带解决了内容创作时的编辑问题,但内容在传播过程中依赖比较复杂的磁带复制机,传播成本较高。因此,1984年索尼推出的便携式CD播放器D-50,因采用数字信号录音且不易磨损而得到了更广泛的应用。

对CD到数字音乐。利用人耳对高频信号不敏感的特性,基于频域最优编码的MP3格式于1995年出现,将音乐文件的大小压缩到原来的十分之一左右。之后,类似门户网站解构报纸的历程,基于P2P的盗版音乐和音乐流媒体产品崛起,很快瓦解了由唱片公司所把控的、基于音像店的传统发行渠道。

1.1.2 推荐产品的演化方向

尽管在日常工作中,人们更强调数据驱动所带来的匹配效率提升,但放到更长远的时间尺度看,历史上每一次推荐产品的里程碑事件都与媒介变迁带来的供给侧变革紧密相关。因此,本节将以媒介变迁为线索来回顾推荐产品的发展历程,并给出对推荐系统未来演变趋势的几点看法。

1.大的变革总是会从媒介侧发起

回顾历史,每当有新内容媒介出现时,谁能更早洞察到媒介变迁的趋势,谁就更有可能成为推荐产品的新巨头。以下3个例子说明了从媒介侧创新的力量。

抖音。当其他产品还在资讯和短视频领域激战正酣时,字节跳动先看到了将音乐与微视频融合的巨大潜力(注:本书中将类似抖音的超短视频称为微视频,以区别于传统类似YouTube的短视频,但在不同产品中的名称可能不同),并在竞争对手还未理解这一新媒介时,通过抖音迅速赢得了市场。

YouTube。在2005年YouTube创立以前,电视是人们获取视频内容的主流媒介。随着YouTube创新出在线短视频这一新媒介,结合更能抢夺用户时长的视频推荐算法,从传统电视媒体手中赢得了不少用户及相应的电视广告份额。

雅虎。雅虎开始流行的原因并非是它提供了对各网站进行索引的页面,而是它创新地将报纸迁移到了门户网站上,这使雅虎成为人们网上冲浪的必经之地,并从大量报纸媒介中赢得了用户和广告份额。

虽然从媒介侧发起变革的能量巨大,但大多数人身处其中,往往会对这种宏观趋势反应迟缓,不能在第一时间想象并预判出媒介变革后的产品发展趋势。在这种情况下,后知后觉的跟随性产品在应对媒介的变革趋势时往往会走入如下两种常见误区。

认为不会波及自己。在媒介更迭的关键时刻,总会有产品经理认为新媒介并不会对他们形成威胁,因此宁愿在原有媒介下守住已有优势,也不愿意在新媒介上有过度投入。然而媒介即讯息,由于新媒介的出现通常会重新定义内容,因此旧媒介下沉淀的内容优势会消失。例如,尽管许多人认为新闻会一直以文字的形式呈现,但当抖音等产品用微视频将新闻重做一遍后,很多用户也开始习惯通过视频的方式来获取新闻。

押宝于供需匹配算法。有很多以推荐算法见长的产品,希望在逐步补上新媒介下的生态短板后,通过算法来实现翻盘。这一思路没有问题,但是如果竞品生态已经形成了强者愈强的马太效应,那么在产品很难吸引优质创作者的情况下,仅凭借推荐算法的高匹配效率通常无法形成决定性的突破。同时,在缺乏产品优势的情况下,产品自认有算法优势可能只是一种错觉,因为算法并非无源之水,在看不到新的业务需求时,很难孵化出真正有洞察力的算法。

综上所述,如果能够预见新媒介有望成为主流,更明智的策略应是立即在新媒介的探索中投入一定的资源,以抓住可能出现的新机遇。需要注意的是,从媒介视角出发来创新产品,通常需要从零开始,需要产品经理能对本书第一部分所讨论的供需增长有全面、深入的理解,而不仅仅是熟悉供需匹配的推荐算法的优化。

2.新媒介下会演化出新的推荐范式

当一种新媒介出现时,鉴于它可能会带来全新的用户行为模式和需求,现有的对旧媒介优化良好的算法通常并不适用。因此,对抓住了新媒介机会的新产品来说,没必要过于担心自己在现有推荐算法上暂时落后,而是应设计新的推荐算法来适应新的媒介环境。这里列举几个从新媒介中孵化出新推荐策略的例子。

邮件媒介下的协同过滤。推荐系统起源于1992年Xerox PARC中心的研究人员对邮件做个性化过滤的需求。不难想象,基于邮件的办公场景相对于其他推荐场景更需要协同,所以在这个场景下,人们提出了基于用户的协同过滤(user-based collaborative filtering,UserCF)算法。

电商媒介下的时序推荐。随着1997年亚马逊上市,推荐系统开始在电商场景普及。鉴于货架电商场景中,用户在购物决策时通常有较强的短期意图,因此1998年亚马逊提出了基于物品的协同过滤(item-based collaborative filtering,ItemCF)算法,以强化对用户近期行为的利用。

电影媒介下的评分预测。早年选择电影需要邮寄DVD,是一种非常重决策的行为,所以奈飞(Netflix)采用了评分预测来推荐电影。在2006年奈飞举办的一场百万美元的Netflix Prize竞赛中,基于矩阵分解(matrix factorization,MF)的评分预测算法被首次提出,并影响了未来诸多排序模型的设计。

资讯媒介下的点击率(click-through rate,CTR)预估。随着移动互联网时代的到来,内容推荐开始独立地产品化。当主要依赖于用户点击反馈的资讯推荐产品开始兴起后,起源于广告的基于深度学习的点击率预估技术被应用到其中,并取代了早期的排序模型技术。

短视频媒介下的时长预估。YouTube早期的用户群体中有很大一部分来自传统电视媒介,因此,如何从电视媒介市场中更有效地抢夺用户消费时长,就成了YouTube策略优化的重心,例如建模单篇内容的期望观看时长和基于强化学习(reinforcement learning,RL)来优化长期时长等方法,就是在这一背景下应运而生的。

微视频媒介下的多目标排序。在信息密度更高的微视频兴起后,由于沉浸式场景中不需要点击,且对于很多内容用户能完整看完,因此传统点击率和时长预估不再像之前那样奏效,基于互动的多目标排序逐渐兴起,成为新一代排序的主流实现。

虽然上述案例过于简化而有所片面,但从中可以看出,每种媒介下的推荐算法和其产品特性是息息相关的。因此,从业者们在紧跟业界前沿的新技术外,还要更加理解产品和业务,这样才有可能给推荐算法真正带来务实有效的变革。

3.推荐产品演化方向的探讨

结合1.1.1节对媒介变迁趋势的分析和本节以媒介变迁为主线对推荐算法演化方向的探讨,可以看出,为了更好地满足用户在新媒介环境中的需求,推荐产品在未来将会越来越重要。那么,推荐产品将会向哪些方向发展呢?

(1)向刺激用户感官的方向不断升级。虽然这看起来有些悲观,但许多推荐产品为了持续抢占用户在闲暇时的注意力,可能会推荐更能强烈刺激用户感官的内容。具体拆解来看,形成这种趋势的原因主要包括以下两点。

不可逆的刺激强化过程。从生物进化的角度看,因为新陈代谢的负担对生物体的复杂性起到了制约作用,所以在人们寻求愉悦奖励的过程中会倾向于更低的能量消耗,简称“懒”。同时,由上瘾的生理学机制所决定,对刺激的强化通常是一个不可逆的过程,即当用户适应了当前的刺激强度并产生耐受性后,为了维持多巴胺分泌的水平,会去寻求更易获得且更高强度的刺激。因此,取代一个令人上瘾产品的,有可能是一个即时奖励频率和程度更高的产品。

内容创作工具的话语权掌握。与过去推荐产品只能顺应媒介变迁的趋势不同,随着如今内容创作工具的话语权越来越大,以及大模型等内容生成技术的加持,推荐产品实际上已经获得了主动创造媒介的能力。因此,尽管当前许多产品已经具备足够强的成瘾机制,但未来具有更高信息密度的媒介还是会随时出现,并进一步催生出更能刺激用户的内容。例如,Apple Vision Pro这种能实时跟踪用户眼动和注意力的载体,使推荐算法更容易吸引人们的注意力,而科幻电影中所描述的脑机接口,说不定也已经在实现的路上了。

(2)向帮助用户创造更大社会价值的方向发展。当对用户的感官刺激强化达到极限时,从马斯洛的需求层次理论看,尚存在一种乐观的可能,即当人们对轻浮的“奶头乐”内容感到厌倦时,会期待产品可以满足他们更高阶的需求。具体到推荐产品,主要体现在以下两点趋势上。

从消费内容的角度看,用户希望能获得在认知和审美需求上的满足,并在社区中拥有一定的归属感。

从创作内容的角度看,用户希望所创作的内容能在推荐产品中得到人们的认同,以满足自我实现的需求。目前看,一些社区性产品如bilibili和小红书等已经逐渐显现出了这种趋势。

因此,推荐系统将走向何方,是娱乐至极,还是帮助用户创造更大的社会价值,很大程度上取决于推荐行业从业者的社会责任感。虽然从产品角度来看,不断刺激用户的感官可以在短期扩大产品规模,但从社会角度来看,能获得用户长久青睐的,必然不是那些滥用吸引用户注意力方式去发展自身的产品。因此,本书希望每一位推荐行业的从业者都能以打造一款让用户安心使用的产品为初心,做出真正优秀的产品。