文化产业发展态势研究
上QQ阅读APP看书,第一时间看更新

第一部分 新闻与出版产业篇

人工智能带来的新闻生产方式之变

摘要:如果说三四年前最受追捧的词是“大数据”,近一两年来“人工智能”已然成为互联网巨头们的口头禅,将其取而代之,赶下历史舞台。人工智能借助算法构建新闻写作机器人低调介入新闻生产过程,实现了从数据到新闻文章的跨越。借助拉斯韦尔经典理论“5W”模式,对于人工智能在新闻生产各环节所扮演的角色及其所引起的种种变化进行分析,并尝试讨论人工智能如何突破传统线性传播模式及未来将如何强化受众对于机器新闻的反馈机制。

关键词:人工智能;机器新闻;新闻生产

伴随着互联网时代的终结,人工智能时代已经在多个领域宣告到来。人工智能即Artificial Intelligence,业界惯称为“AI”,人工智能借助算法构建专门用于新闻写作的机器人就被称之为“机器新闻”“自动化新闻”或“算法新闻”。从互联网时代的“连接一切”,到人工智能时代的“唤醒万物”,或许人工智能并不是最早在新闻传播领域苏醒的,但却已是目前最直接作用到大众的日常生活中,在大众传播的舞台上,潜移默化地改变着新闻的出场方式。在互联网驱动下,今日头条、手机百度信息流等新闻聚合平台逐渐崛起,基于个人兴趣爱好的新闻推荐以及实时更新的算法机制使得新闻生产的压力越来越大。用机器人写作一些较为简单的诸如快讯之类的新闻消息与记者经过调研分析写出的调查性报道、新闻评论等一同注入媒介平台信息池,在一定程度上弥补了新闻市场中供需不足的问题。

一、机器人新闻的崛起

据不完全统计,国内至少有10家新闻媒体推出了13个智能新闻机器人产品或应用,进行线上线下融合创新报道。[1]其中较为引人瞩目的有新华社于2015年推出的“快笔小新”,通过输入一个股票代码就可以在3秒钟的时间里生成一篇配有标题、图表等信息的完整财经新闻稿件。“快笔小新”代表了目前国内大多数的新闻写作机器人的新闻写作能力,主要写作体育、财经等具有时效性且无需进行大跨度信息聚合的新闻消息。同年百度上线智能写作机器人Writing-bots,除了具备前者的写作能力之外,还可以完成知识类和资讯聚合类的文章写作。知识类基于百度自家产品诸如百度百科、百度知道等对于知识的定义性说明及相关内容介绍从而形成科普类文章,而资讯聚合类新闻则满足了用户对于热点话题信息的高效获取需求。通过捕捉热点话题获取基础内容,进而挖掘该话题下所涵盖、辐射的子话题聚类,通过最后的梳理调整形成一篇可呈现热点话题依照时间脉络梳理并能进行相关话题整合的综合性新闻。[2]另外还有专职于某一领域的新闻写作机器人如腾讯财经研发的“Dreamwriter”可撰写发布“数据发布+百家之言”结构模式的财经类新闻消息;地震信息播报机器人在突发性自然灾害事件“四川九寨沟地震”的报道中仅仅耗时25秒自动编发出包括“速报参数、震中地形、震中简介、波及人口、当地天气等十余项内容”的新闻速报并在地震后第一时间经由中国地震台网的微信公众平台发出。

二、用“5W”分析新闻生产方式之变

机器新闻的出现基于及时更新、互联共通、云端共享的大数据时代所夯实的基础,零散的碎片化信息借助于新型算法得以去芜存菁、精准获取,并能根据某种相关性生成集合。人工智能在新闻生产各环节究竟扮演了何种角色及其引起了哪些变化,借助于拉斯韦尔经典理论“5W”模式我们可以从中窥测一二。

从传播者的角色来看,主流媒体仍然是传播过程中的信息发出者,而人工智能在其中所扮演的只是一个打工者的角色。在新闻编辑部门中,人工智能所孵化出的新闻写作机器人所能完成的是输入确定指令的工作,基于一定的算法产出新闻文章,而且这类新闻大都是新闻记者所不愿意写的数据叠加类的体育快讯、企业财报等机械性劳动成果。掌握传播话语权的主流媒体给新闻写作机器人划定新闻来源信息池,使其能够读取大量结构化、标准化数据并生成新闻写作模板即可算作其最终完成了“机器学习”,可以应用于新闻内容生产。机器新闻产出后,负责该条新闻线的记者与编辑将依次担任“把关人”,对于新闻写作机器人所完成的作品进行审查后方能最终发出。“把关人”需要审查的不仅仅是语句的通顺与否,还需要依靠自身所掌握的知识与经验对于人工智能抓取的信息进行再次把关,人工智能并不具备思考分析能力,也无法摆脱人的控制(输入指令等)独立完成新闻生产过程,其所实现的自动化目前尚在于新闻内容写作这一环节,而并不是真正意义上的“完全自动化”。

从传播内容的层面,现阶段机器新闻绝大部分为事实性的客观报道,无法产出具有分析评论性的深度报道。对于规格化的新闻资讯(例如灾害、体育、财报等动态信息),人工智能技术可以使机器新闻做到精确、迅捷的生成和发布。[3]机器新闻写作可以划分为写什么、怎么写、最终呈现三个步骤。在写什么这一环节,新闻写作机器人被人工智能算法圈定信息获取领域,算法依照层级筛选获得精准信息,在此过程中无需人每次都重复输入指令,确定新闻素材后,人工智能将进行初步的文档规划,确定新闻文章的大致框架结构。到新闻文章怎么写的环节,人工智能将对于这篇文章进行微观层面的剖析,从遣词造句到段落生成,最后依照逻辑顺序进行段落组合。新闻文章的最终呈现还需要进行自我校对、润色改写、图表适配等步骤,是否存在基础写作的错误,新闻话语如何更加准确流畅,以及是否可以从信息池中抓取适宜的配图、表格等进行表达优化。在此环节,人工智能虽不具备思考能力但依靠算法上的设定进入“机器自省”层面。一篇机器新闻报道形成后,进入到前文所述的记者、编辑把关环节,对于文章进行再次审查,最终成为一篇进入分发渠道的新闻报道。

从分发渠道上来看,人工智能帮助机器新闻快捷、准确地抵达受众群体。在媒介融合的形势驱动下,主流媒体与媒介平台合二为一,最终呈现全媒体平台化。传统媒体的议题设置,主要取决于当时的新闻热点、宣传管理部门的指令、媒体同行的选择和编辑记者的经验。但是,人工智能技术出现后,媒体议题设置和编排分发的旧有规则被打破了。算法推荐新闻,以及受众之间的相互推荐,逐渐开始争夺内容分发的主导权。[4]面对内容分发的新型玩法,传统媒体要想跻身其中继续保持自己的玩家身份就不得不迫使自己也开始做出改变。以人民日报为例,历经web 时代到移动互联网时代的洗礼,掌握新闻传播话语权不再依赖于发行纸质报刊,而是积极实现线上线下、跨平台联动。除了在微信、微博、今日头条、百家号等平台中开通官方主体账号外,还推出了人民日报客户端,独立形成内容分发渠道。类似的独立分发渠道由于自身的研发技术薄弱,依然遵照“时效性第一”的分发原则,通过设置频道,形成不同的内容区间。而今日头条、手机百度等分发端口的优势在于,它们依靠其公司强大的技术基因,以人工智能技术为支撑,形成了基于用户兴趣的个性化新闻推荐。人工智能利用个性化推荐为机器新闻铺路,将其送到了关注该类新闻的用户眼前。

从受众的角度看,人工智能在一定程度上满足了受众的阅读需求与参与新闻生产的能力。机器新闻作为人工智能在新闻传播领域的重要产物,具有海量生产能力和“一触即发”式的新闻生产速度。一方面,经过机器学习与长期训练后,新闻写作机器人形成了特定的新闻写作模式,因此可以利用极少的时间快速形成文章,如国外知名科技公司Automated Insights 公司介绍,该公司旗下研发生产的新闻写作机器人Wordsmith在2013年一年生产了3亿篇各类形式的新闻报道,平均每秒钟就可生产出约9.5篇。另一方面,先进传播技术的发展推动了公民新闻运动的兴起。国外学者谢恩•包曼与克里斯•威里斯将其定义为“公民积极参与手机、报道、分析、传播新闻和信息过程中的单个或群体行为”。[5]普通大众可以借助于手机等工具在社交平台发布即时信息,而正在向专业媒体演化的自媒体借助于各类全媒体平台所提供的广阔空间可以生产发布较为专业的文章,满足了一定条件的信息即可作为客观事实型讯息或者新闻内容相关分析收录整合进入机器新闻写作中,成为丰富的新闻素材。因此,除了PGC 权威的信息来源,更具灵活性、丰富性的UGC内容也进入到机器新闻的信息池中,从这一点来说,人工智能也推动了公民新闻运动的发展。

最后从传播效果上分析,人工智能虽然为新闻生产带来诸多便捷,创造了更好的效益,但同时也引入了新的麻烦与思考。受众不再依靠报纸、广播电视报道获得自己关注的信息,移动端媒体平台中人工智能的实时监测和多媒体信息的快速整合使得受众能够在第一时间快速掌握关注领域相关信息的全部内容。在2016年里约奥运会期间,各平台新闻写作机器人纷纷亮相,在自己擅长的体育领域屡屡大显身手,比赛中的比分情况在各端口中几乎实现了近乎无延迟的实时更新。当然机器新闻并非都是有益的,正如主流媒体中为了保证新闻的质量而坚守的把关人角色,一旦机器新闻缺少把关人,那么信息的真实性就无法保证,机器新闻在这种情况下就会被别有用心的人操控,从而达到某种不可告人的目的。例如国外总统竞选期间,大量的通过网络爬虫和语言识别“制造”出来的假新闻曾大行其道,干扰了正常的竞选秩序。机器新闻由于只是较为简单的、纯理性的知识性信息,而不存在深度的、感性分析与评价,因此对于受众来说,人工智能带来的新闻只是给予了知识补充但直接作用于受众思想的部分极小,套用“魔弹理论”来讲,受众只是“中弹”,而不会“倒下”。

三、隐式反馈突破线性传播模式

在互联网出现之前,新闻报道发出后如何知道受众对其的喜恶,这个问题对于传播者来说是一个难题,传统的线性传播模式使得信息只能自发出端向接收端流动,而无法形成有效的动态回溯。传统的做法是通过长期以来行业经验总结的规律来按部就班做新闻,对于传播效果无法得出量化的结果,也就无法及时、精确地改进新闻生产过程中的不足。互联网的出现和人工智能的发展不仅使得新闻的传播渠道发生改变,更令传播者感到欣喜的是,技术让受众在网络中的行为得以保留,这些不直接表现出用户倾向的隐式反馈线索,使得单向传播模式被彻底打破,为传播者进行效果分析提供了完整的资源素材。

通过数据挖掘可以在服务器日志中得出互联网用户行为序列,即在某一时间段内,按照时间先后顺序记录的用户从事某种活动的每一步行为。用户行为序列收集的信息包括个人在网站填写的注册资料、用户浏览过的网页和浏览时间、浏览习惯等。也就是说,一篇新闻发布在网络媒介平台中,受众从点击开始浏览到关闭页面其中的所有信息均可以利用其来完整复原,这对于传播者来说,其作用等同于受众站在面前告诉你这篇新闻是否满足他的需求。举例来说,假设以正常速度阅读完一篇2000字的新闻稿件的时间约为5分钟,那么某用户点击打开页面到关闭的事件我们视为他的阅读时间,如果该时间长度在5分钟上下浮动,则可以推断此篇新闻信息达到传播效果、被正常接收。但当这个用户时长普遍过短则可以尝试推断新闻内容对于该名用户来说可能不具备吸引力,甚至是无效传播。在阅读新闻时,用户通过拖动鼠标或者滑动屏幕进行浏览,那么拖动或者滑动的长度也可以作为一项传播者调整新闻内容写作框架的重要依据。如果一篇新闻普遍只被阅读至三分之一处就被关闭,那么传播者则可以考虑将希望被用户阅读的重要信息放在整篇文章的前三分之一部分。

人眼识别是人工智能的又一重要应用功能。随着智能设备的进步,可以大胆推测未来通过人眼识别也可以帮助获取受众阅读新闻的精细化浏览信息。通过人眼检测,精确获取眼球位置,就可以得出受众具体浏览过哪些文字,这对于新闻内容生产来说更具备直接指导意义,这也是一种有效的隐式反馈。传播者提取字段并进行归纳总结,经过反复训练就可以得出更适应于受众阅读方式的新闻文章。

人工智能的发展必然将新闻传播引入一个全新的“AI 媒体时代”,记者作为某种劳动力的“解放”虽然也引发不少人对于人工智能谈虎色变,但推动人类从低级生产迈入高级生产是技术发展的必然,AI媒体时代也必将产生诸如“训机师”之类的职位,如同平台的角色不再是普通媒介一样,未来记者不会失业,只会发生身份的转变。

(作者简介:孔双,上海大学新闻传播学院2017级学术硕士研究生)

参考文献

[1]人民网.厉害了,我的“神器”2017两会报道中的智能新闻机器[EB/OL].http://media.people.com.cn/n1/2017/0315/c14677-29146493.html.2017-3-15.

[2]搜狐网.百度NLP:不抢人类饭碗,我们只想人机协作[EB/OL].https://www.sohu.com/a/133249185_465975,2017-4-11.

[3]喻国明.机器新闻写作时代传媒发展的新变局[J].中国报业,2015(23).

[4]梁智勇,郑俊婷.人工智能技术对于新闻生产的影响与再造[J].中国记者,2016(11).

[5]吴丹丹.论公民新闻运动与专业新闻人的责任[J].新闻传播,2017(2).