新闻算法推荐中的技术、伦理和科学之争
李嘉音 新疆财经大学
【摘要】算法推荐的运用为传播领域带来了巨大而深刻的变革,从最初的搜索引擎到算法推荐系统,信息选择权在“用户主动选择”和“算法主动推送”之间左右摇摆,带来了技术派、道德派和科学派对于算法推荐的不同观点。本文认为算法推荐实质上是通过构建用户个人模型来猜测用户信息喜好,从而增加用户黏度的服务形式,它一方面帮助用户发现对自己有价值的信息,另一方面让信息展现在对它感兴趣的用户面前,是应对数据浪潮的必然选择。针对算法可能出现的诸如“信息茧房”“群体极化”等的影响,需要提倡实验精神,采用科学的研究方法进行长期科学的实证检验。对于目前已有研究中出现的缺乏控制干扰变量、偏向活跃用户、观察时间短等问题,提出了改进评估方法。最后,计算社会科学的诞生为研究算法推荐可能产生的影响研究提供了新的学科范式,本文在结尾处进行了展望。
【关键词】算法推荐;技术原理;信息茧房;群体极化
在算法广受关注的当下,2017年9月,人民网的“三评”算法推荐更将其推向了舆论的风口浪尖。对于算法推荐,大致可以分为“积极乐观”“质疑批判”“需要检验”三种观点,笔者将其归纳为技术派、道德派和科学派。着重于探讨算法背后伦理问题的道德派认为:失去了传统把关人的算法推荐在黑箱中完成信息分发,算法技术以工具理性取代了人的价值理性,造成新闻专业主义的让位与受众信息端的日益窄化,形成“信息茧房”“群体极化”等负面效果。对此,今日头条总编辑张辅评回应,“公众对新技术不了解,以讹传讹”,提出“信息茧房从一开始,质疑的就不是算法推荐,而是此前门户时代兴起的订阅模式”,那么,算法推荐和订阅模式之间的区别在哪里?算法推荐必然会引起“信息茧房”“群体极化”现象吗?针对算法推荐带来的社会效果,目前的实证研究有何发现?又存在哪些问题?本文将从算法推荐的技术原理入手,对以上亟待回答的问题展开分析。
一、新闻算法推荐技术原理
算法本身是一个用系统方法描述解决问题的策略机制,在信息系统与人的匹配中无疑是高效、先进的工具。算法机制要解决的根本问题是:从庞大的信息系统中挑选符合用户兴趣习惯和社会特征的内容,呈现在他的个人信息系统中,以满足他的内容需求。[1]
算法推荐需考虑多种指标来对接用户需求,常见指标包括总体流行度、协同过滤、用户偏好等。总体流行度(Global Popularity),也叫热门推荐,是公众对于最新的话题、事件、人物关注度的排行榜,在各种搜索引擎、门户网站、新闻APP上都有这样的热度排行榜;协同过滤(Collaborative Filtering),即通常所讲的“好友推荐”。它并非指用户的好友主动为用户推荐什么内容,协同过滤是先分析用户的兴趣,在用户群中找到和指定与用户兴趣相似的其他用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测;用户偏好(User Preferences),即个性化推荐,针对每一位用户过去曾经主要接触过的内容,为用户设置个人模型,这个模型随着用户浏览习惯的变化而不断完善。
概括地说,算法推荐最核心的内容就是一个或者一堆数学模型,新闻算法推荐设计的第一步是确定应当纳入算法的指标,随后赋予这些指标不同的权重,因此真正的区别在于为每个指标赋予的权重大小。然而问题的关键在于,算法推荐机制所用到的指标及其比重大小,以及用户的个人画像作为互联网公司的商业机密并不对外公开,推送决定的制定过程在黑箱中进行,用户看似只能被动接受算法提供的任何内容,在与信息的偶遇中干扰了用户注意力并挑战个人信息选择的主体性,由此也带来了技术派、道德派、科学派对于算法推荐中信息选择权的争议。
二、推荐争议中的三种声音
(一)技术派:信息选择权掌握在用户手中
这一派别以算法工程师和一部分学者为代表,包括今日头条CEO张一鸣、总编辑张辅评等。张一鸣曾表示:“传统媒体是把观点告诉别人,今日头条是提供实用信息,比如给养猪专业户提供更好的养猪信息,告诉强直性脊柱炎病人如何治疗。传统媒体是传递价值观,我们只是让有益的信息到达个体。”[2]结合今日头条在更新之前打出的“你关心的,才是头条”标语,可以发现技术派认为算法是以用户为中心,用户的任意一个选择,哪怕是无所事事的随手一点,都会被作为完善用户个人画像的依据。因此,技术派认为将信息选择权让渡给算法,实质上是让渡给了信息受众,算法本身是中立的,并非想为用户主动推送某种商品、意见或观点,而是根据用户的个人喜好提炼参数,使用户形成对于推送的依赖心理。
针对人们普遍质疑的个性化信息推送造成的“信息茧房”,今日头条总编辑张辅评解释道:“信息茧房从一开始,质疑的就不是‘算法推荐’,而是此前门户时代兴起的订阅模式。信息茧房是指,用户过分地只通过自己的订阅查看信息,导致信息窄化,而这个问题是所有的媒体形态都会造成的现象。” [3]
其实,订阅模式就是指生产商为用户推荐内容,也叫Push(推);与之相对的则是用户自己寻找内容,也叫Pull(拉)。二者的区别就在于,订阅模式是将信息选择权掌握在生产商手中,而算法推荐是让信息选择权掌握在用户的手中。从前文的介绍可知,算法推荐新闻是以对用户偏好的了解为基础的,推荐的内容以用户目标为依据。而订阅模式是用户选择了某几类信息之后,生产商不断地给用户推送同类的信息,这些信息是由信息调度中心统一调度的,而非用户具体的喜好目标。
因此,张辅评认为由生产商帮助用户选择信息的“推”才是造成人们质疑其可能产生“信息茧房”效果的原因,同时,传统媒体时代的报纸订阅、电视节目收看等行为,都是用户依据个人喜好进行信息选择,信息窄化也有可能是个人的选择性接触造成的,因此这个问题不关乎技术形态。
但是,算法推荐并非完全是将选择权交给用户,它也是在推送它认为用户可能喜欢的内容,只不过随着算法技术的迭代更新,可以更准确地预测用户喜好。而且,从用户的角度来说,用户在对算法推送的信息产生不满意时缺乏必要的反馈渠道,对某些推送内容的被动认知会积累成对于推送平台的反感情绪。综上,技术派倾向于从技术逻辑出发,通过赋予用户信息选择权、推送个性化信息、算法自身的迭代完善来构筑和完善自身的合理性。
(二)道德派:推送内容由算法决定
对于新闻算法推荐的争议不仅停留在“信息茧房”。2017年9月,人民网连续三天发表署名为“羽生”的系列文章:《不能让算法决定内容》《别被算法困在“信息茧房”》《警惕算法走向创新的反面》,这一系列文章表明对算法持批判态度的道德派对于技术派的强势态度。
文章认为算法在满足受众个性化阅读需求、顺应阅读分众化时代潮流的同时,也存在许多真假难辨、对错不分、缺乏深度的劣质信息。造成这种现象的原因就在于“技术、代码、算法替代了传统内容分发过程中专门把关内容的编辑。内容能否推送、推送给谁,都是机器说了算,依据的标准就一条:能不能抓眼球、能不能吸引用户”。[4]因此,相较于技术派认为的“信息选择权在用户手中”,道德派倾向于认为“推送内容完全由算法来决定”。同时,算法在满足个性化需求的前提下,也有带来个人“自我封闭”的危险,算法依据用户行为过滤掉用户不熟悉、不感兴趣的内容,一味地投其所好,最终在不断重复和自我证成中强化用户的固有偏见和喜好。最后,困在信息孤岛中的人们失去了探索未知和创造不同可能性的机会。[5]
人民网对于算法推荐的评论文章也引发了学术界对于算法推荐背后伦理问题的探讨。许多文章的观点大致相同,认为算法依靠夸张标题吸引用户点击,实际上大量推送垃圾信息,造成了电子媒介的“黄色新闻潮”。而且,算法在单个的用户画像和兴趣群体之间来回推荐,在潜移默化之中会对用户个人视野造成很大限制,用户在一次又一次阅读自己喜欢领域的信息之后,不断地在自己与整个世界之间筑起了一道高墙,造成了“信息茧房”和娱乐至死的问题。[6]
由于“信息茧房”的存在,人们只会选择和接触与自己意见相同或近似的人群,采纳符合自己预期的观点,于是逐渐形成“回音室效应”(Echo Chambers),个人所认同的意见和观点,以及所感兴趣的事物,都会在这种传播场域中得到“正反馈”式的激励和放大,“回音室效应”会导致人们成为认知上的“井底之蛙”,误把“私域”(某圈层)的事物和观点等同于“公域”(全社会),进而形成刻板成见并在圈层以外的意见与观点对冲时或感到迷茫,或走向认知上的极端和表达上的极化,成为群体化事件的温床。[7]这其中,算法推荐的信息过滤机制成了个人与公众走向极化的关键杠杆。
然而,如果从受众的整个信息接触行为来看,用户并非算法推荐什么就一定看什么,霍夫兰所提出的“个人差异论”其实早已阐述了受众的“选择性接触”和“选择性理解”。而且选择性接触只是整个信息处理过程中的步骤之一,选择性信息处理特别是反向抗辩(Counter-argue)对重塑态度方向的影响也同样重要。[8]换句话说,受众的自我选择性机制作用强烈,且不一定完全排斥与自己观点相对立的内容。同时,针对人民网所批判的算法推荐“缺乏把关人,信息质量鱼龙混杂,低级趣味迎合受众”等问题,资讯类算法平台已经做了很大改善。一点资讯让人工编辑筛选稿件,通过对上万个稿源进行质量分类,划分出一般到优质六级稿源,“80%的流量永远来自20%的最优质的稿子”,“八卦只能带来短期流量,但不能换来长期口碑”,[9]说明目前仍然是一个优质内容为王的时代,将专业人工编辑与算法工程师相结合,可以有效改善新闻质量。
根据算法背后的技术机制也可得知:算法并非完全依据热度进行内容推送,用户标签以及协同过滤、相关性、环境、热度等模型特征都是决定推送内容的指标。因此道德派对于算法推荐的批判也需要辩证看待。算法技术总是在迭代过程中逐步完善的,对于算法推荐可能引发的“信息茧房”“群体极化”等效应,不能仅仅从技术本身的原理出发直接讨论后果。科学派的实证研究可为这些影响带来相应的说明。
(三)科学派:算法的社会效果需要长期检验
科学派即以实证研究来验证算法推荐可能产生的社会效果。笔者经过检索,总结出了三类关于推荐效果实证研究的论文,研究发现算法推荐既有负面效果,也有正面效果,以及正负效果并存。
在负面效果方面,Garret在2009年对于互联网用户政治性信息的选择性接触行为研究中发现“个人接触在线政治信息时更愿意强化原有观点……观点强化的信息促进了人们对于新闻报道的接触”;[10]以及Dylko 等人在2017年关于可定制技术对在线政治信息选择性接触影响的实证研究:“各种形式的可定制性技术(尤其是系统驱动的可定制性)增加了在线政治新闻消费背景下的选择性曝光。此外,可定制性技术在尽量减少对反态度信息的接触方面比在增加对亲态度信息的接触方面有更大的影响。”[11]也就是说,算法推荐技术会有意迎合用户的立场、观点,并减少与用户立场不一致的信息推送,推荐系统导致用户兴趣窄化。
在正面效果方面,弗利彻和尼尔森在一项对跨国平台新闻受众分化与整合的研究中,发现“虽然向高选择性媒体环境的转变引发了人们对受众分化的担忧,但我们发现在线受众比离线受众更分散的观点没有得到支持,这与受众分割和过滤泡沫相关的担忧是矛盾的”。[12]他们的研究发现算法推荐增加用户接触议题的多元性,促进了用户意见的整合而非分裂。
与此同时,有更多的研究发现,算法推荐既没有正面的效果,也没有负面的效果。原因在于用户大部分是在按照非常强烈的心理机制做自我选择。正如上文提到的选择性接触理论发现,“受众并不是不加区别地对待任何传播内容,更倾向于‘选择’那些与自己的既有立场、态度一致或接近的内容加以接触;这种选择性接触行为更容易在强化他们的原有态度的方向上起作用,而不是导致它的改变”。 [13]
从科学派的实证研究中可以得知:时至今日,选择性接触仍然是主导用户的使用结果的最重要机制,算法推荐无法改变自我防御、自我调整、自我选择的机制。因此,“信息茧房”甚至“群体极化”的社会效果,有可能是由于用户的选择性接触、理解、记忆等原因造成的,就算是在传统的纸媒时代,很多用户也只选择报纸的某一个版面、专栏浏览。以上这些初步的研究,并没有解决新闻推荐到底是好还是坏的问题,但是至少告诉我们算法推荐造成的社会影响多种多样,既不是十全十美,也不是糟糕透顶。
综合技术派和道德派的观点,笔者认为新闻算法推荐作为一种服务的形式,目的是通过猜测用户的喜好以培养用户对它的依赖性。让长尾信息满足不同受众越来越多元的需要,这对于当下信息过载的时代环境来说不失为一种提升信息传播效率的有效技术手段。算法并非想为用户提供某一类的信息,只是想真正满足用户的信息需要,因此在这一层面上,笔者倾向于认可技术派的观点。但同时,以今日头条、UC头条、天天快报等为代表的使用算法推荐的资讯类APP中层出不穷的标题党和琐碎、低俗的新闻确实让人厌恶,用户随手点开其中一条信息,算法就可能以为这是用户的兴趣,而加大推送力度,同时用户缺乏主动的调整权,在对算法不满意的时候缺乏必要的反馈渠道,对某些内容推送的被动认知会积累成对于推送平台的反感情绪。因此道德派的观点虽偶尔会有缺乏证据、言辞过激之嫌,却又具有一定合理之处。
因此,算法推荐这一全新的现象,为科学研究提供了前所未有的机会,对以往的研究方法和研究经验都提出了一系列挑战。互联网公司基于算法推荐为用户建立的个人画像作为商业机密不会对外界公开;用户在使用新闻APP时浏览新闻的时间、地点、时长、点赞、分享等,都是算法推送的判断依据,但是用户的使用行为虽然产生了,使用数据本身并没有被保存,互联网公司所拥有的是用户画像,而不是用户所看过的所有内容。以上问题严重限制了实证研究数据资料的获取,也冲击了以往的研究方法。随着层出不穷的新现象和新问题,对于算法推荐的实证研究又该何去何从?笔者认为,科学派的实验精神在算法推荐这一全新的技术形态中显得十分重要。
三、算法推荐实证研究中的问题与对策
新闻算法推荐带来的社会影响是一个漫长的过程,实验精神要求研究者本着科学的态度,不要在一个新事物还未发展成熟之际便匆忙下结论。在这一方面,药品的试验流程可以提供一些参考:新药上市一般需要经历动物实验、病人试验、健康人试验三个阶段,通常花费九年的时间,且试验的每个阶段都要给药监局提供相应数据,经过一系列审核后药品才能最终投放市场。新闻作为思想产品,不一定要像自然科学那样一步步经受检验,但是每一个学术概念的提出都需要有充分的时间来验证。
实验精神允许犯错,目前关于算法推荐所产生影响的实证分析也存在问题。笔者将其归纳为四个方面:第一,缺乏严格的干扰变量控制。针对“信息茧房”等问题,个人的预存兴趣对于信息的选择有很大影响,如果没有推荐系统,用户可能该看什么内容还看什么内容,而目前的实证研究对于个人的选择性偏好的干扰变量控制不够,于是把“信息茧房”的账算到了算法推荐头上;第二,观察时间偏短,新闻推荐系统如果可能造成用户的新闻消费行为的改变,那么这种改变可能经过几个月甚至几年的时间才会发生,然而一项实证研究并没有这么充足的时间,因此得出的结果可能仅仅是研究对象一时的反应;第三,研究样本偏向于积极活跃的用户,如果在前台抓取留言、评论等数据,研究结果很有可能被这些积极活跃的用户所主导,比如在研究“群体极化”时,大部分是把极化的言论抓取后进行比对,但得出的结果并不能代表所有人;第四,大多研究关注的内容是政治领域,然而很多人并不消费政治新闻,娱乐八卦、健康新闻、消费、民生、体育等都是值得研究的内容领域。
对应以上问题的解决方式,基于实验精神的科学评估方法应是:①控制内外干扰,“信息茧房”“群体极化”不一定是由算法推荐造成的,个人的选择性接触是一个重要变量,应该将其控制住;②观察长期趋势,不局限于眼下的反应;③基于无偏样本,大量浏览但并不发言的用户也有自己的态度倾向,这一部分用户也应当在考虑范围内;④测试不同领域,研究的测试领域应该从政治扩散到更多领域。
总结与展望
本文从新闻算法推荐的技术原理出发,由算法机制的不透明引出技术派、道德派和科学派对于算法推荐的不同争议。以算法工程师为代表的技术派带着技术乐观主义的姿态,认为算法在当前的信息浪潮中提升了新闻分发效率,满足了用户的个人化需求;但道德派则批判算法的不透明会破坏信息系统的平衡,造成“信息茧房”乃至“群体极化”,最终加剧社会分化。针对“信息茧房”“群体极化”等社会现象,科学派认为应该基于长期的、科学的实证检验。目前对于算法推荐的实证研究显示:算法推荐正负效果皆有,但更多的研究显示算法推荐并没有产生任何效果,很多结果是由于用户的选择性接触造成的,并基于目前实证研究所存在的问题提出了基于实验精神的评估方法。
科学派的观点使我们可以更加冷静地看待算法的社会影响,并且以更加严谨的态度对待随着新现象而出现的概念、定义,正如互联网诞生之初人们对于网瘾问题的探讨那样。随着算法迭代更新的速度不断加快,很多问题随着算法自身的不断完善可以解决。当然,算法的加速发展也会使新的社会现象和社会效应层出不穷,算法的技术特征对于原有的社会科学研究方法提出新的挑战。对此,计算社会科学的出现,作为一种新的学科范式,为传统研究方法的更新提供了新的方法。计算社会科学作为一场涉及科学、技术、医学、社会、人文等各个领域的学科“群众运动”,是一种采用互联网、大数据、机器学习等计算技术来研究社会问题的新思潮和新方法。[14]随着我国加速培养跨学科人才,懂计算、懂算法的传播学者将会不断增多,新方法的普及和新人才的形成,对于新闻算法推荐的社会影响将会建立在科学研究的基础上进行更加深入的研究和探讨。
参考文献
[1][7]德外5号.喻国明:“信息茧房”的锅,算法推荐不能全背|德外荐读[EB/OL].(2019-09-06).https://3g.163.com/dy/article/EODV1EOU 0521AN71.html?referFrom=.
[2]张一鸣,谢鹏.文科生爱自由,理科生爱效率[N].南方周末,2015-08-11.
[3]观察者网.今日头条总编辑张辅评回应算法质疑:公众对新技术不了解,以讹传讹[EB/OL].(2018-01-03).http://www.sohu.com/a/2144 70089_115479.
[4]羽生.人民网一评算法推荐:不能让算法决定内容[EB/OL].(2017-09-18).http://opinion.people.com.cn/n1/2017/0918/c1003-29540709.html.
[5]羽生.人民网二评算法推荐:别被算法困在“信息茧房”[EB/OL].(2017-09-19).http://opinion.people.com.cn/n1/2017/0919/c1003-29544724.html.
[6]匡文波,陈小龙.新闻推荐算法:问题及优化策略[J].新闻与写作,2018(4):66-70.
[8]夏倩芳,原永涛.从群体极化到公众极化——极化研究的进路与转向[J].新闻与传播研究,2017(6):5-32.
[9]程征.新闻人如何与“算法”共事——对话“一点资讯”副总裁兼总编辑吴晨光[J].中国记者,2016(2):29-31.
[10]GARRETT R K.Echo chambers online?:Politically motivated selective exposure among Internet news users[J]. Journal of Computer-Mediated Communication,2009(01):265-285.
[11]DYLKO I,DOLGOV I,HOFFMAN W,et al. The Dark Side of Technology: An Experimental Investigation of the Influence of Customizability Technology on Online Political Selective Exposure[J].Computers in Human Behavior,2017(08):181-190.
[12]FLETCHER R ,NIELSEN R K.Are News Audiences Increasingly Fragmented? A Cross‐National Comparative Analysis of Cross‐Platform News Audience Fragmentation and Duplication[J].Journal of Communication,2017,(08):476-498.
[13]郭庆光.传播学教程[M].2版.北京:中国人民大学出版社,2011:178.
[14]祝建华,彭泰权等.计算社会科学在新闻传播研究中的应用[J].科研信息化技术与应用.2014(2):3-13.
[1]德外5 号. 喻国明:“信息茧房”的锅,算法推荐不能全背| 德外荐读[EB/OL].(2019-09-06). https://3g.163.com/dy/article/EODV1EOU0521AN71.html?referFrom=.
[2]张一鸣,谢鹏. 文科生爱自由,理科生爱效率[N]. 南方周末,2015-08-11.
[3]观察者网. 今日头条总编辑张辅评回应算法质疑:公众对新技术不了解,以讹传讹[EB/OL].(2018-01-03).http://www.sohu.com/a/214470089_115479.
[4]羽生. 人民网一评算法推荐:不能让算法决定内容[EB/OL].(2017-09-18).http://opinion.people.com.cn/n1/2017/0918/c1003-29540709.html.
[5]羽生. 人民网二评算法推荐:别被算法困在“信息茧房”[EB/OL].(2017-09-19).http://opinion.people.com.cn/n1/2017/0919/c1003-29544724.html.
[6]匡文波,陈小龙. 新闻推荐算法:问题及优化策略[J]. 新闻与写作,2018(4):66-70.
[7]德外5 号. 喻国明:“信息茧房”的锅,算法推荐不能全背| 德外荐读[EB/OL].(2019-09-06).https://3g.163.com/dy/article/EODV1EOU0521AN71.html?referFrom=.
[8]夏倩芳,原永涛. 从群体极化到公众极化——极化研究的进路与转向[J]. 新闻与传播研究,2017(6):5-32.
[9]程征. 新闻人如何与“算法”共事——对话“一点资讯”副总裁兼总编辑吴晨光[J]. 中国记者,2016( 2):29-31.
[10]GARRETT R K.Echo chambers online?: Politically motivated selective exposure among Internet news users[J]. Journal of Computer-Mediated Communication,2009(01):265-285.
[11]DYLKO I,DOLGOV I,HOFFMAN W,et al. The Dark Side of Technology:An Experimental Investigation of the Influence of Customizability Technology on Online Political Selective Exposure[J].Computers in Human Behavior,2017(08):181-190.
[12]FLETCHER R,NIELSEN R K.Are News Audiences Increasingly Fragmented?A Cross ‐ National Comparative Analysis of Cross ‐ Platform News Audience Fragmentation and Duplication[J].Journal of Communication,2017,(08):476-498.
[13]郭庆光. 传播学教程[M].2 版. 北京:中国人民大学出版社,2011:178.
[14]祝建华,彭泰权等. 计算社会科学在新闻传播研究中的应用[J]. 科研信息化技术与应用.2014(2):3-13.