二、数据新闻的崛起
数据新闻,又称资料新闻,是大数据与新闻学相结合的产物。其包含几个重要的概念:运用电脑程式分析大数据、数据视觉化、数据个人化,以及数据开放与分享等。
当代数据新闻不仅是新闻与报道形式,更是数位时代的重要趋势。记者利用电脑程式分析大量的数据,并且将数据进一步以视觉化或个人化叙事方式呈现。数据新闻包含了开放数据的概念:一方面开放政府数据,监督政府提升资料透明度,另一方面开放媒体数据,与受众共享。数据新闻的理念是从复杂又庞大的资料来源中寻找可用的故事,通过电脑分析资讯,并且着重于如何把故事讲得最好。
数据新闻就是用资料处理,把传统的新闻敏感性和具有说服力的叙事能力,与海量的数位资讯相结合,能够为协助新闻工作者通过资讯图表来报道一个复杂的故事创造了可能性。
(一)数据新闻的产制流程
数据新闻的形式虽多样,但仍有概略的产制流程:议题选定—数据收集—人力分配(进行数据筛选、分析、新闻编/采、视觉设计)—开会讨论、修改—成品。
1.议题选定
议题选定以时事、兴趣、团队讨论为中心。数据新闻其实与一般传统新闻一样讲求灵感,一方面,当有热门事件发生时,数据新闻产制的可能性就会提高;另一方面,产制者个人平时兴趣的积累,也是数据新闻初步议题选定的关键。无论是独立产制者,还是隶属于新闻组织的团队工作者,议题的选定多会受时事或平时兴趣的积累影响;独立产制者的制作弹性较大,相对需要负荷的工作内容也较多;隶属团队的新闻工作者,虽可根据自身兴趣提出议题方向,但议题选定仍需经过开会讨论,制作弹性较小,但不过作分工后的压力也相对较小。
数据新闻受限数据来源与话题性。当议题选定之后,进入收集数据与资料的阶段才会遇到问题,也许是数据不足、数据太旧、资料太庞杂、不具有话题性等问题。一方面,尽管网络资源拥有庞大的数据,但仍有数据不足的可能;需要的数据没有提供开放下载;筛选庞大的数据,实际能用的很少;想尝试的议题在网络上没有足够的分享资源。另一方面,即使数据充足,也会面临问题,筛选与分析必须依赖热门议题或擅长统计的专家;筛选完成发现新闻点与大众认知相符合,不足以进一步产制完成数据新闻。
2.人力分配
数据新闻的产制方式多以团队为主,人力设置大概为新闻人(记者、编辑或者编采二合一)、工程师、设计师。与国外不同的是,国外的记者多是一人同时担当写程式与视觉设计角色,称为“数据记者”。但是国内仍以跨领域合作的团队为主,倘若为个人产制的独立记者,通常主题不会太大或者太深入。当独立产制者所待的组织只有其一人负责产制数据新闻时,相对的压力就也较大,且没有经过团队合作,难以讨论出不同的维度。
3.程式与视觉化操作
数据新闻报道和其他新闻报道领域的不同之处在于,数据新闻结合了三项元素——传统“新闻鼻”(察觉事件的新闻性)、将故事说得动听的叙事能力,以及大尺度和大规模的数字化资料。数据新闻的意义至少涉及两点:如何从大量资料里挖掘新闻、如何呈现资料。程式与视觉化的操作是数据新闻中最关键的步骤,即前述的挖掘大尺度和大规模数字化资料,以及如何呈现资料。
(二)数据新闻的应用
近些年来资讯图表(Infographics)在国内外越来越热门,从传统的柱形图、折线图和饼图,发展成为近期的社群关系图、热力图、互动地图、影片等,呈现方式愈发精致与丰富。图表早期多扮演辅助文字新闻的角色,现今则跃升为数据新闻主要的叙事方式之一。特别是高密度资料的专题,资讯图表的叙事能力比文字强大。与此同时,绘制资讯图表的视觉化记者也变成实务界越来越重视的人才。但是不管数据新闻的叙事手段如何变化,都仍须遵从新闻道德规范,并且以制作读者更易理解的内容的数据新闻为重,不偏离事实与原始数据,不追求华而不实的视觉技巧与点击率。
数据新闻包含两个阶段:第一个阶段是收集资料、分析资料、从资料中找到新闻故事;第二个阶段因为资料数据庞大,于是要试着以视觉化方式呈现,才能说明新闻故事的全貌。
(三)大数据应用于新闻领域的优势
1.资料分析较过去容易、快速
因大数据的诞生,各式各样的分析工具、程式软件随之被发明,以期能帮助我们更有效地挖掘想要的资讯并快速地从中获利。随着大数据的蓬勃发展和科技日新月异,解析庞大复杂的数据所耗费的时间越来越短,甚至可以完全交付电脑“跑数据”,不需要耗费过多人力与时间。
2.促进新闻业与其他领域的结合
虽说新闻领域本来就是综合性的产业领域,结合了各类专业,如体育、财经、娱乐、文艺……但大数据的出现,更加提供了不同领域间新型的合作形态。其中最大的是新闻产业与社群网站、入口搜寻网站之间的密不可分的互利关系。
3.为新闻提供新的叙事方式
大数据为新闻提供了新的叙事方式,国内亦有新闻媒体积极尝试,将开发各种可能的新的新闻叙事方式作为主要任务。
4.为读者提供不一样的解读方式
大数据促进了数据新闻的发展,使复杂的数据在新闻中的可读性变强,让本来使人们望而生畏的原始资料变得更好“消化”,使得隐藏在数据里的故事能触动更多人。
(四)大数据应用于新闻领域的风险
1.提高新闻工作者的准入门槛
任何产业皆是如此,当一项新事物、新概念发展得如火如荼,促使原本的产业不得不做出变化时,首当其冲的则是对从业人员要求的提高。
2.不同于传统新闻的生产时限压力
根据新闻工作者的经验,数据新闻生产的时间普遍为1个月。当议题较大、数据较多的时候,一个月的时限可能还显得太短。从一般传统的新闻生产的流程来看,1个月的时间又太长,由此不难看出数据新闻生产的过程较为繁复。
3.数据来源的可信度存疑
网络资料来源复杂,若使用的数据来源经过转载或截取,难保不会失真。又或者个别相关从业者为获利,提供假数据。因此,就如上文中提到的,在大数据的4V特性中,真实性(可信度)是最具争议的特性。
(五)新闻工作者职能转换
1.新闻工作者从被动变主动,积极获取新闻源
传统新闻生产模式主要依靠新闻记者的人脉,或者从生活中寻找可供报道的新闻源。但网络与大数据兴起后,记者可以主动出击,在新闻议题选定之后,积极主动地寻找与之相关的数据资料,而后进一步分析数据背后是否有相关的新闻事实存在,并判断是否具有新闻价值。
数据新闻需要记者具备整合新媒体、深度开发数据新闻的能力,使记者可以突破传统思维模式,通过网络链接并整合社群媒体,深度开发数据新闻内容,使受众不仅可以从新闻报道中获取有用的信息,还能对新闻内容进行个性化使用,有效提升其新闻价值和社会效益。
2.新闻工作者的资料素养有待提高
数据新闻为把传统的新闻敏感性和有说服力的叙事能力与大数据结合创造了新的可能。但是大数据价值密度很低,且数据之间的关系难以轻易看出,这是新闻记者最先面临的挑战。如何挖掘与统计资料、发现资料与线索的相关性,以此形成视觉化数据新闻而被受众接受,这一系列新闻生产流程是对新闻记者对数据资料的敏锐度的考验。
具有数据意识的记者在数据新闻报道中需要反复思考以下问题:一是数据来源是否可靠,其时效性如何,是出于何种目的、采用怎样的方法收集而来;二是数据中间究竟包含了怎样的主题和线索,应该选择哪些数据进行报道,所选样本是否符合统计显著性的要求;三是自身对于因果关系的理解是否正确,结论是否合理,以及能否推而广之等。
3.新闻工作者要成为数据解读者
记者必须知道如何利用资料寻找、分析和视觉化新闻故事。首先,在表达形式上,视觉化技术成为数据新闻的呈现特征,新闻报道以信息图表的形式发布,不仅使新闻形象化、直观化与趣味化,还能够化繁为简。对处于视觉传播时代的使用者而言,信息图表更符合他们的阅读习惯。其次,它以呈现问题为主,对问题的解释较少,以这种方式呈现的新闻具有更利于提示要点、分析事件过程、表现各要素的关系等优点。最后,在新闻的生产流程上,资料新闻在借助大量资料的同时,更多的是对新闻从业人员的数据加工和处理能力的考验。
除此之外,对于从事数据新闻报道的新闻记者来说,团队合作精神与能力尤其重要。从业界实践来看,数据新闻的生产少有单兵作战的模式,多是团队合作的成果。传统新闻工作者与数据新闻工作者职能转换对比见表2。
表2 新闻工作者职能转换