国外数据新闻研究综述
郑广嘉
摘要 互联网技术的崛起、信息自由理念和法令的兴起,都推动了数据新闻的快速发展。国外的数据新闻更偏向对数据库的应用,注重通过数据交互分析,进而找到新闻故事,或是为新闻撰写提供资料。本文主要对国外数据新闻的相关研究进行了梳理,发现研究主要集中于数据新闻来源与概念、数据新闻中的数据要素、数据新闻人才培养、数据新闻的问题及争论四个研究议题。数据新闻研究受到计算机辅助新闻报道研究思维方式的影响,注重“怎么做”而非“为什么”。数据新闻的“数据”要素成为研究热点,在数据搜集方面,国外重视主动向机构索要数据,研究者鼓励数据搜集的持续性和过程的明晰化;在数据库建设方面,数据库的交互性有待进一步提升。数据新闻人才培养多通过训练营、项目实践等“教学医院”模式进行,对于数据新闻人才素养的强调分为“数据技术偏向型”“传统叙事偏向型”“综合型”三类。数据新闻存在内部人员数据素养欠缺的局限,外部受到时间、数据来源合法性、数据分析工具等限制,因此当前的数据新闻实践虽然丰富,但是并没有找寻到适合的应用领域和呈现方式。数据新闻毫无疑问将成为重要的新闻样态,但是如何使用、发展数据新闻,还需要研究者在数据新闻的实践过程中进一步探讨。
关键词 数据新闻,概念,数据库,人才培养,问题及争论
The Literature Review of Foreign Data Journalism Researches
Zheng Guangjia
Abstract The development of internet technology,and the rise of concept and act of freedom of information have contributed to the rapid development of data journalism. The data journalism abroad is more interested in database application,analyzing the data interactively,and then find news stories,or provide information to the news. This paper focuses on foreign researches of data journalism,and found that researches have focused on four topics,including the origin and concept of data journalism,data elements of news,education of data journalism,and problems and controversy in data journalism. Researches of data journalism have been affected by researches of computer-assisted report,focus on “how to do” rather than “why do so”. “Data” becomes a hot topic in data journalism,in the respect of data collection,researchers encourage clarity and continuity of data collection processes. In the respect of database construction,interactive databases need to be enhanced. “Teaching hospital” model is the main method of talents training,such as training camp and projects. There is three trends of data journalism education,“technology-biased” “traditional narrative-biased” “integrated”. Lacking of data literacy,time and data analysis tools,all of these are limitations of data journalism. Undoubtedly,data journalism has become an important news practice,but how to use and develop it need further exploration.
Key Words Data journalism,Concept,Database,Education,Problems and controversy
“今天我们拥有比以往任何时候都丰富的数据,拥有更多的途径分析数据,拥有更多的方式讲述数据故事,所有这些领域都在发展。”[1]这个时代由数据引领,数据新闻也成为备受瞩目的新闻样态。它虽不是在网络时代才出现,但是网络技术的发展客观推动了数据的迅猛增长。[2]同时,信息自由法令日益凸显的力量,让更多数据流入新闻机构,数据更易获得;数据开放运动降低了软件的使用成本,改进了数据新闻生产方法和工具,令数据新闻的制作更加便利。所有这些因素都推动了数据新闻的快速发展。国外的数据新闻实践较丰富,尽管没有形成完整的研究体系,但是研究的领域较为全面。本文依托“EBSCO”数据平台,以“Data Journalism”为关键词进行搜索,选取其中与该关键词最为相关的22篇文献进行分析,以此观察国外数据新闻研究的最新进展。
一 数据新闻的来源和概念
数据新闻,亦称数据驱动新闻,这种新闻样态表明了新闻元素的不断丰富,同时也将新闻生产和传播引领至“数据时代”。
(一)数据新闻溯源——信息图和计算机辅助新闻报道是其实践来源
数据新闻主要来源于两种传统新闻实践样态:信息图和计算机辅助新闻报道。[3]新闻信息图,包括图形、图表、地图和其他插图的使用可追溯至19世纪末期甚至可能更早。英国《卫报》、美国《今日美国》等报纸,都大量使用了图形、表格等元素,前英国《卫报》网站的数据新闻编辑西蒙·罗杰斯(Simon Rogers)宣称《卫报》在1821年成立时就开始生产数据新闻。[4]新闻信息图的应用增加了新闻的呈现方式,丰富了报纸的视觉呈现,“以图说话”更为直观,也更利于受众对信息的理解。
研究者对于另一种新闻实践样态——计算机辅助新闻报道(Computer-Assisted Reporting,CAR)的研究成果较丰富,它也是数据新闻的重要实践溯源。这种新闻形式鼓励了记者在报道中利用计算机处理数据,这种方式将社会科学、统计分析技术融合进了新闻传播行业。个人电脑数量的增加、网络的普及和计算的专业化都促使了计算机辅助新闻报道的普及,1989年,美国成立了全国计算机辅助报道联合会。[5]在计算机辅助新闻报道的思维模式中,学者认为通过公开公众议题数据可帮助记者设置政治议程。[6]计算机辅助报道时期,就开始重视通过数据搜集确认报道议题,它成为一种新闻的标签,通过指出社会问题的存在和出现原因,进而指出社会的不公,寻找解决问题的办法。[7]这是一种从数据推导问题的方法,记者并不事先预设,而根据数据寻找议题,因此有学者认为计算机辅助新闻报道对社会民主发展起到了推动的力量。20世纪60年代晚期,计算机数据库开始偶尔用于调查性报道,但是直到20世纪90年代,这一应用才开始在美国报纸中变得普遍起来。计算机辅助新闻记者不仅用数据库搜集、储存、组织和检索信息,有时候也用印刷副刊或在线的方式将它们呈现出来,有一些数据库还吸引了公众对其进行反馈以改善报道。[8]这时的记者已经注重数据库的应用,发展到如今的数据新闻,数据库的建设更被提升到新的层次。而且在数据库建设过程中,媒体逐渐将公众纳入进来,公众也可提供数据完善数据库建设,提升新闻报道的准确性。
计算机辅助新闻报道是数据新闻的重要起源,它的很多实践成为数据新闻发展的基础,而在此新闻样态中形成的思维方式也在很大程度上影响着数据新闻。其一,在关于计算机辅助报道的研究中,多数研究者聚焦怎么做计算机辅助报道,而没有告知为什么做这一样态的报道,即没有考虑什么样的新闻更适合计算机辅助报道形式。这一问题在当前的数据新闻中同样存在,我们为什么需要数据新闻?哪些新闻需要通过数据新闻形态传播?[9]研究者和实践者很少对这类问题进行思考。其二,传统意义上的计算机辅助新闻报道将“数据作为来源”,这种思维路径在当前数据视觉化和互动网页发展的强劲势头下得到延伸。[10]通过数据寻找公众的关注点和兴趣点,进而寻找新闻故事,形成新闻产品进行报道。在这一过程中,数据主导新闻传播,虽然数据一定程度上能够反映社会现实,但是这种反映并非对现实的真实写照,过于依赖数据寻找新闻,可能造成传播的源头偏差。尽管计算机辅助报道带给公众新鲜感,但是关于计算机辅助报道的效果评估却不尽如人意,在一项关于被试者对计算机辅助报道的信任、新闻价值、喜欢程度、质量和理解程度的调查中,调查人员用三种方式叙述同一故事:计算机辅助报道形式、坊间叙事、使用权威证据,结果显示,被试者对这种新闻样态的喜欢程度、可读性、质量的评价都较低。[11]这一调查的样本局限可能导致结果偏差,但是总体来看,计算机辅助报道处于将数据应用于新闻的初级阶段,无论在数据的呈现方式还是对新闻叙事的适用性方面,都欠缺思考。
(二)数据新闻概念
有关数据新闻的定义,尽管目前并没有统一的说法,但是诸多学者的定义体现了相对统一的数据新闻的特征。关于数据新闻的定义主要分为三种倾向:第一种倾向于强调数据新闻的数据呈现形式和新闻故事的结合。西蒙·罗杰斯(Simon Rogers)和米尔科·洛伦兹(Mirko Lorenz)都持此种观点。西蒙·罗杰斯认为数据新闻是将图表、图形数据分析和显著的新闻故事结合在一起的领域,强调数据新闻的多种来源。[12]这一定义倾向于数据新闻的呈现形式,突出了数据和故事的结合特征。米尔科·洛伦兹将数据新闻定义为一个过程,这个过程将分析、过滤、视觉化的数据以一种与叙述相链接的形式传递给公众。[13]他的定义和西蒙·罗杰斯的定义颇为相像,只是将数据的使用过程阐述得更为具体。二者都是将数据新闻限定于数据分析的框架下,强调故事的数据呈现及呈现方式。第二种倾向强调数据新闻中新闻议题的数据来源和新闻的数据表现形式。梅根·奈特(Megan Knight)持此倾向,他从广义上定义了数据新闻,认为数据新闻或是一个以数字为主要来源的故事,或是一个包含了数据或视觉化元素的故事。[14]这一定义强调了数据新闻的故事来源和数据新闻的构成元素。总体而言,数据分析和视觉化是数据新闻的两大支撑。第三种倾向认为数据新闻重视数据呈现,而不重视新闻叙事。一些学者认为数据新闻并不是传统意义上的新闻,它只是利用视觉工具做一些看上去不错的图表、地图,但并不重视讲故事。[15]这一观点同样具有一定的代表性,并且被当前的某些数据新闻实践证实,如一些新闻只是将数据分析的结果放到内容中,但是这一结果的呈现并非在阐述新闻事件,而只是反映社会现象。但是此种观点遭到了部分研究者的批判,认为这种样态并非数据新闻,只能说是数据报告。数据新闻不是数据的堆砌,也不是调查性报道。综上所述,数据新闻必须具备三要素:数据、视觉化、故事。其中,数据是依托,可作为新闻背景,也可作为呈现故事内容的方式;视觉化是形式,数据通过图表、图形、地图等多种形式呈现,用这些形式表述故事更具视觉吸引力,也更易为受众理解;而故事才是数据新闻的灵魂,故事是数据新闻的议题,讲好故事才意味着数据新闻报道的成功,数据和视觉化应为故事的讲述服务。
二 数据新闻的“数据”研究偏向
在数据新闻中,数据是必不可少的一部分。查德·史可顿(Chad Skelton)制作了数据新闻的生产流程图,尤其对于数据处理部分进行了清晰的说明,主要分为七个步骤:“考虑清楚对于我要解决的问题,我需要哪些数据—获取数据—清理数据—分析数据—展示数据—与公众交谈—讲述包含数据的故事”。[16]对于数据新闻的要素研究,研究者更为注重“数据”,对于数据搜集、数据库建设、数据分析与应用的研究成果较多。
(一)数据搜集
数据搜集是数据新闻的生产基础,大数据时代,数量庞杂的数据给搜集工作带来一定困难。圣安东尼奥一家名为Conexión的新闻出版公司的记者马克·威尔森(Mark Wilson)认为寻找数据很重要,因为这些数据可以描绘一些公关团队和政府机构即便知道也不愿意分享的趋势。[17]目前数据新闻的数据主要来源于政府、公司、营利/非营利调查机构、媒体机构等。
1.数据搜集网站和数据申请
在关于数据搜集的研究中,目前的研究成果主要介绍了用于数据搜集的工具和方法。瑞驰·凯恩(Rich Kane)介绍了“Swarmize”网站。由英国《卫报》发布的“Swarmize”网站是一个为用户收集数据的平台,并且在此平台中可以将数据转化成读者易理解的信息。在这个平台中,编辑可以创建Swarm,设立一些简单的调查,并且将它们嵌入网页,然后交给开发人员(developer),开发人员可以建立互动,比如直播电视的实时反馈移动应用,还可以收集其他数据库的数据如用标签收集相关的大量微博,然后进行分析。[18]另一个“Open Missouri”网站的创建目的比较新颖,这个网站的创办人戴维·赫尔佐格(David Herzog)创办网站的主要目的就是让大家知道哪些数据库是政府机构线下已有的,告知记者哪些数据是州机构已经有了但是不愿意放在网上的,并且提供给记者工具,向政府机构索要特殊的数据库。[19]这些网站的创办令数据搜集的渠道更加多元化,不仅仅可以从政府方面获得,还可以通过公众调查得到数据反馈,方便记者寻找、查询、分析数据。并且这些网站也向公众开放,公众可以在网站上搜索想要查询的信息,进一步实现了公众的信息接近权。
在国外人们十分重视向机构索要数据,即根据自己要研究的议题向相关机构提交数据申请。2004年,三个《达拉斯晨报》记者在得克萨斯信息自由基金会的支持下,发起了名为“Light of Day”的项目,这一项目鼓励学生参与调查性工作。在这个项目中,学生可以就涉及全州范围的议题向学校和当地政府机构提交申请,要求提供相关数据和信息,当他们获得需要的信息后,就开始处理他们自己的数据集,之后将它们输入更大的数据库,这些数据集可以应用于州、地方和学校一级的调查新闻中。[20]如何提交申请、向哪些机构提交申请这些基本问题,部分培训机构或老师会教授相关知识。通过对索要的数据进行分析后,可能会得到与官方信息发布相反的结果,这也在一定程度上颠覆了权威机构垄断信息的现象,可以形成对权威数据分析的监督。
2.数据搜集的持续性和过程的明晰化
在数据搜集过程中,有两个问题值得注意:一是数据搜集的持续性,二是数据搜集过程的明晰化。数据搜集工作中,多数数据新闻记者喜欢一次性工程,不愿意在原有故事中更新数据。这种数据搜集的工作会产生大量数据冗余,而且增加记者工作量。“Swarmize”网站的设计解决了这一问题,它可用来持续搜集数据。《卫报》的数字化新业务总经理马特·阿里斯特(Matt McAlister)认为,目前收据搜集的一个问题是最初的新闻报道结束后数据搜集任务就停止了,如果再要重新寻找数据变得十分麻烦,而Swarmize在设计时的一个目标就是让数据可寻找、可利用、可重复利用。[21]
数据搜集过程的明晰化有利于判断数据的真实性、可靠性。数据本身是客观的,但是搜索数据的过程是主观的,数据搜索者基于一定的目的将数据集合在一起,在搜索过程中涉及搜索对象、搜索方法、数据保留的选择,不可能完全客观地表现数据,因此数据搜索者必须将数据搜索过程进行明确说明。Mother Jones的记者A.J.文森斯(A.J.Vicens)认为,在数据应用时要知道数据从何而来、由谁搜集、为什么要搜集这些数据、这些数据说了什么、没有说什么。[22]丹·马隆(Dan Malone)重点针对政府搜集的数据进行说明,同样认为在数据应用过程中要看政府搜集的是什么样的数据,他们怎样搜集数据,这些数据如何被储存,他鼓励学生寻找漏洞和不能解答的问题,然后提交他们的申请去完善数据。这样有助于我们知道要探寻什么。[23]因此在数据搜集过程中,首先应该清楚搜集什么样的数据,同时应对数据的来源、数据搜集的标准、搜集方法等进行标明,方便日后使用。
(二)数据库建设
国外学界对于数据新闻生产的认知更加偏向数据统计分析,而不仅仅是数据的呈现,数据的统计分析需要建立在数据丰富性和多元性基础之上,因此数据库建设是数据新闻生产的重要环节。一个完善的数据库一方面可以帮助记者在数据集里查明异常值,在最新消息中保持领先;另一方面可以帮助记者在新闻发生时快速周转,写一篇有深度的文章。[24]
1.数据库的开放性
国外很多媒体和机构都开发了自己的数据库,供记者或公众自行开发使用,记者可以从中寻找报道议题,而公众则可从中得到自己想要的信息。如《得克萨斯论坛报》(Texas Tribune)提供资源让读者做他们自己的探索。在创办的第一年,它提供了三十个交互的数据库,这些数据库内容丰富,让读者可以了解他们周边学校的级别,寻找州监狱系统里的一个被收容者,或者窥探他们办公室同事的薪水。Tribune是日益增长的互动新闻编辑室的一部分,这种新闻编辑室创建互动平台,让读者用与他们关系最为密切的方式应用这个平台,让读者自己开发数据。[25]而这些数据库对于记者进行新闻报道、发现新闻线索具有更为重要的作用。记者可以利用数据库撰写新闻背景,在新闻事件发生时可以通过数据库搜索相关信息进行比较或验证。再如,芝加哥犯罪地图(Chicagocrime.org),这个网站联合谷歌地图,后者有从芝加哥警局部门获取的数据,创建了互动的逐区犯罪地图,这个网站让芝加哥居民能够很容易地追踪社区的犯罪情况,不论这些事件是否被电视新闻或是都市报报道。[26]国外的数据库建设已不仅仅为寻找数据新闻题材或为数据新闻提供表现方式而设置,而且成为一个公开的平台,任何人都可以进入这个平台搜索自己希望知晓的信息。
2.数据库建设的交互性
数据库的多元性和丰富性为数据新闻提供了多元新闻题材,也为新闻的深入提供了视角,数据新闻的线索可来源于数据之间的比较和交叉分析,在对比中找到新闻点成为数据新闻生产的新的模式。如有记者运用“Swarmize”进行数据对比,将从当地政府获取的资金使用数据与通过Swarm搜集的用户对当地政府服务的评价进行对比。[27]通过这种对比就可以看到政府资金使用、公众对政府资金使用满意等方面的问题。
数据库的多元性为数据新闻的生产奠定了基础,但是数据库之间的融合还存在一定问题。比如Mother Jones杂志的记者在做调查时采用了三个数据库,但是数据的录入需靠人工完成。[28]这不仅仅是数据分析软件的问题,也是数据库融合的问题。不同类型数据库之间的交互链接能够帮助记者和公众迅速找到需要的数据,交互链接为数据的深入挖掘提供前提,同时数据库中不同的信息数据如何按照统一标准储存也将成为未来数据库建设的研究方向,统一的数据标准为数据分析减少时间成本。
(三)数据分析与应用——增强新闻的客观性,监督权威数据结果
获得数据后,数据新闻记者最重要的工作是对数据进行分析。一些学者认为数据新闻有利于改进新闻推动民主的方式,尤其是在当前很多数据来源于政府的环境下,这种改进主要通过数据分析的三种影响:第一,加强新闻客观性,通过数据分析向公众揭示国家的现状;第二,向新闻机构提供新的工具维持政府问责,这些新的工具可以帮助新闻机构深入调查;第三,通过新闻机构自己的数据生产和分析,增加公众政治参与的机会。[29]在国外的数据新闻中,程序员式记者是一个重要的角色,他们的加入使数据新闻有了新的意义。上述论断基于数据新闻的三个命题:第一,新闻本身就可以被看作计算机处理的数据,而不仅仅是隐藏于数据背后的故事。这不仅意味着在线数据库也将成为新闻的合理维度,并且,更深入地来讲,记者经常在生产新闻时做的工作,也可以有效地被计算机处理。第二,程序设计员记者认为将数据开放给公众是一个重要议题,这可以帮助公众做决定,公众不仅应该有机会检查数据,也要将它们结合起来,为自己的目标服务。将数据开放给公众,可以依据数据做单独的研究,如一个事件如何影响他们自己的处境。第三,减少对政府议程的依赖,对此持续数据及和数据库技术的接近,使记者较少依赖政府数据,尽管这些数据中大多数由公共权威生产。随着数据库的常规和自动更新,在线应用允许记者和公众检查政府做的决定并且进行监督。但是上述论断也被学者质疑,首先,数据本身没有意义,需要记者去分析;很多记者认为公众没有具备必要的技能能够依靠自己搜集、分析数据。[30]
对于数据的分析还可能产生对原有结论的质疑,比如在“Light of Day”项目中,一名学生记者Jordan Gass-Pooré发现学校网站上有关宿舍新旧与盗窃案发生概率之间的关系,与她得到的数据的分析结果不同。[31]因此这就需要在数据分析过程中保持质疑能力,“Light of Day”的总监丹·马隆(Dan Malone)认为,尽管人们一直认为记者具备质疑和挑战权威的能力,但是他认为有的时候记者的质疑能力还不够,尽管数据时代令精确报道可能,但是有可能过于依赖数据。[32]
对于数据的可视化呈现研究相对较少,多数学者只是通过内容分析的方式,了解数据新闻的视觉化现状。如梅根·奈特对英国全国报纸中的数据新闻进行内容分析后发现,数据主要由以下几种形式呈现:文本分析,在文本中数字被讨论;时间线,根据日期展示事件;静态图,展示事件发生的位置;动态图,同时展示事件和位置;曲线图,展示数字之间的关系;信息图,联合了图片和数字信息;数据表格。[33]这种分析只是对于数据呈现方式的描述,并没有对这些视觉化方式的效果进行评测,对于不同类型的数据新闻应使用怎样的视觉化方式的研究仍处于空白。
三 数据新闻人才培养
目前国外部分院校、媒体机构已开设数据新闻教育。从教育方式来看,多以建立项目、开展训练营的方式进行。如由哥伦比亚大学新闻学院和计算机课学习联合创办的“Lede”项目,给新闻专业学生提供数据、编码等课程[34],专注于计算、数据分析;“Light of Day”项目,对于学生进行数据搜集、数据分析的学习都有较好的实践教学模式;在美国,计算机辅助新闻报道协会(NICAR)也在做一些全国性和地区性的训练营;在加拿大的国王大学学院,已经连续七年每年提供一个星期的训练营。[35]在训练营中,有专门的数据新闻记者教授相关课程。尽管数据新闻的教学模式多以“教学医院”的方式进行,让学生在实践中学习和提升数据新闻生产和传播能力,但是目前对于数据新闻人才培养尚没有形成一套较为完整的理念和体系,对于数据新闻人才到底需要哪些技能、培训单位能够开设哪些课程等问题,学界和业界的研究都处于较为零散的状态。西肯塔基大学的新闻与广播学院副教授Mac McKerral认为,在进行数据新闻教育之前需要回答五个问题:数据新闻适合的领域是什么?在学生开始学习数据新闻课程之前,他们需要具备哪些技能?学生在多大程度上真正了解数据的有效性?如果要在数据的课程中硬加进去一些课程,那么哪些可能可以被放弃?谁来教数据新闻课程?[36]按照这五个问题对当今的数据新闻教育进行评估,只有技能和课程两个方面得到了部分解答。
(一)数据新闻人才技能争论
在数据新闻人才需具备的能力方面,学者观点主要分为三类。
第一类,“数据技术偏向型”,注重学生的数据处理方面的能力培养。作为第一批将计算机应用于调查性新闻的记者,菲利普·迈耶(Philip Meyer)认为,一个好的数据新闻记者应该是一个数据库管理者,一个数据处理员,一个数据分析员。这三个身份分别说明了数据新闻记者的数据搜集、数据整理、数据分析能力,更加侧重的是数据处理的能力。
第二类,“传统叙事偏向型”,注重学生讲故事的能力。有些学者认为数据新闻记者不需要都去学习数据处理的相关技能,如尼尔·莱塞(Neil Reisner)教授就认为,并不是所有的学生都要学习编码,记者应该知道倒金字塔结构下的新闻写作模式,导语,如何报道火灾、会议等议题等,归根结底,就是新闻报道的基本技能才是记者最应该具备的。尽管数据新闻很重要,但是并不是所有人都要学习编码、数据分析和视觉化。[37]Mac McKerral教授认为,尽管数据对我们很重要,但是必须认识到,数据时故事的补充,不能喧宾夺主,本末倒置,在数据新闻生产过程中,要把故事讲好。[38]这部分学者更加强调传统新闻中讲故事的技能,认为学生应该知道数据处理方面的相关知识,但不应将这些技能作为核心能力。
第三类,综合了前两类学者的观点,更偏向学生思辨能力和数据呈现方式能力的培养。这部分学者认为数据新闻人才必备的两项技能是解释和可视化。Bradshaw和Rogers都认为解释数据是数据新闻记者的必备技能之一,但是他们也强调呈现原始数据。综观上述学者的观点,数据新闻人才需要具备的能力主要包括:讲故事、新闻思辨、数据处理、可视化。尽管有些学者在数据新闻方面比较重视数据处理技能的培养,但是依照目前数据新闻的定义,传统的新闻技能不可取代,数据仅为讲故事服务,可以作为故事的补充,而不能本末倒置。
(二)数据新闻课程体系不完善
关于数据新闻的课程设置,目前很多训练营、实践项目等,更加偏向数据技术技能的培养。如“Lede”项目,给新闻专业学生提供数据、编码等课程;戴夫·斯坦顿(Dave Stanton)创办的Kickstarter网站,开设了数据新闻的相关课程,包括数据视觉化、信息管理、响应式设计、绘图、信息安全、网络隐私等。[39]由此看出,对于数据处理相关技能的培养占据了课程的主体。其中网络隐私课程的设立表明了数据时代对于数据安全的重视。对于隐私的理解决定了记者如何呈现新闻,在学者一项对于数据新闻记者的调查中,23名受访者中,只有一个记者能够保证他们新闻机构的数据可供公众使用。而对于是否需要公开数据,记者总是根据公众兴趣决定是否公开敏感数据。[40]因此在数据新闻教育中,数据安全和隐私问题的教育必须放在基础课程部分,引起数据新闻人才的重视。
四 数据新闻现存问题及争论
数据新闻尚属新兴事物,目前的新闻实践多数还停留在计算机辅助新闻报道阶段,在人员、技术等方面仍存在很多不足。
(一)团队人员设置不合理,数据处理技能人才缺乏
数据新闻的生产制作应由一个团队完成,在这个团队中既应具备技术人才,又应具备叙事人才。但是目前的数据新闻生产单位中,人员分散在不同团队,没有办法合作。比如有的记者在制作数据新闻时虽添加了互动元素,但是却没有办法用信息图呈现,因为制作信息图的人属于图形部门。[41]这种分隔的人员配置现状,会导致对同一新闻资源的浪费。即便部门之间有合作,但是相互之间对于新闻呈现理解的差异,也会导致无法配合。同时,目前新闻机构中普遍缺乏具备数据处理、可视化操作能力的人才,大型新闻机构的人员配置较齐全,有计算机辅助记者、图形设计员、统计分析员、程序员,但是小型新闻机构中很少有齐备的人员配置。[42]因此在制作数据新闻时,需要征求多方专家意见。《邮报》经济政策通讯员Tankersley认为,在搜集和分析、运用数据时要请教相关专家。[43]
(二)数据新闻制作的外部局限因素
数据新闻受到很多外部因素的局限,比如时间缺乏,技术工具欠缺,合法的途径稀缺等。在时间层面,记者都愿意利用容易获得数据、容易获得公众信任的数据,他们在清理数据中用到的时间多于分析数据。在技术工具层面,尽管目前用于数据处理的软件工具较多,但是有些媒体机构由于受到资金限制,无法使用先进工具,只能使用一些无成本的工具或数据库,因此没有办法获取足够的数据或者进行深入的挖掘分析。这些因素在不同规模的新闻机构中影响的差异很大,如在大规模新闻机构中,如果遇到政府不愿透露数据的情况,这些记者可预知争辩,而小型新闻机构则没有办法与之抗衡。[44]
(三)数据偏见
数据新闻批判者认为,记者和机构可以通过忽略某些数据来展示他们想展示的内容。但是亚利桑那州立大学新闻学讲座教授史蒂夫·多伊格(Steve Doig)认为,数据和其他记者掌握的来源一样,他们可以是准确的或错误的,可以被正确运用或被滥用,因此记者需要重复验证数据搜集和处理的方法。[45]Eva Jefferson Paterson强调曲解的数据可能隐藏在调查性工作中的危险,记者在收集、解释和呈现数据的任何一步中都可能存有缺点。最初的数据可能就存在偏见,实验心理学家发现,内隐偏见可能存在于收集和解释看上去简单的数据过程中,我们的眼睛会欺骗我们,特别是当我们在处理可能触发我们对社会群体的无意态度的数据时,如客观的数据可能因为我们对种族的内在偏见而被曲解。[46]
五 小结
国外的数据新闻实践较丰富,但是对数据新闻的研究尚未形成完整的体系,目前研究主要集中于四个方面:数据新闻来源与概念、数据新闻要素、数据新闻人才培养、数据新闻的问题及争论。
在数据新闻来源研究中,学者对于计算机辅助新闻报道研究对数据新闻研究思维模式的影响研究较为深刻,认为前者在两个方面影响了数据新闻:一是多数研究者聚焦数据新闻制作的技术层面,而忽略了对其本质的追溯。哪些领域、哪些事件适合使用数据新闻样态,哪些内容经由可视化传播会产生良好的传播效果,对于这一方面的研究几乎处于空白状态。研究者更注重“怎么做”,而没有探讨“为什么”。二是,数据新闻中数据和叙事的相互关系。数据新闻的本质仍是新闻,叙事应占有主要地位,数据可以作为新闻线索的来源、可作为新闻内容的补充或者呈现方式,但是不能代替叙事。
数据新闻由叙事、数据、可视化三要素构成,目前学界主要集中探讨数据。从数据搜集、数据库建设、数据分析与应用三方面进行研究。在这些研究中,几乎都分为两个阵营:数据支持和数据批判。必须承认,数据是未来新闻发展的重要趋势,数据新闻也将成为重要的新闻分支,但是不论在数据搜集、数据分析和应用时,除了掌握必要的技术,还需要对数据来源进行清晰的认知,只有在明确数据来源、数据搜集目的的基础上,才能正确运用数据进行叙事,否则本来就不具备完全客观性的数据将被更大程度地歪曲。
数据新闻人才培养理念和方式研究都有所欠缺,目前对于数据新闻人才的培养主要通过训练营、实践项目等“教学医院”模式,系统的教学模式还未形成,技术课程成为主体。对于数据新闻人才素养的研究关乎未来数据新闻业态的发展,如何更好地融合技术课程与传统新闻专业课程、培养数据新闻人才的哪些技能、谁来教学等问题都亟待解决。
由于数据新闻发展时间还较短,学界、业界对于这一新闻样态的理解还将在实践过程中逐渐丰富和完善,目前的数据新闻不论是生产还是应用都存在缺陷,比如数据新闻生产过程中团队人员配置不齐全、数据偏差问题的存在、数据来源开放性欠缺等,这些问题都影响数据新闻的生产和传播。
关于数据新闻的未来发展趋势,对于记者来说,理解并找到隐藏在数据背后的故事不再是新闻界一小部分人应该拥有的技能,而将成为记者这一职业的基本要求。对于其他领域的学生,学习展示统计数据来解释发展趋势、告知决策者、帮助更大部分的公众了解复杂的议题是一个急迫的事件。[47]但是我们必须认识到,数据可以作为辅佐,但是不能超越思辨的本质,天普大学的新闻学教授梅瑞迪斯·布罗赛德(Meredith Broussard)认为没有一个技术可以代替记者的思维方式,记者拥有做好一个故事的直觉,而计算机缺乏创造力。[48]
(作者单位:华东师范大学传播学院)
[1] K Hackett. Data Journalism for a Database Age[J]. Quill,2013(10):34,36,37.
[2] Fred Vallance-Jons. Data Journalism Continues to Gain Popularity[J]. Media,2014:19,20.
[3] Megan Knight. Data Journalism in the UK:A Preliminary Analysis of Form and Content[J]. Journal of Media Practice,2015(1):56,59,61.
[4] Megan Knight. Data Journalism in the UK:A Preliminary Analysis of Form and Content[J]. Journal of Media Practice,2015(1):56,59,61.
[5] Megan Knight. Data Journalism in the UK:A Preliminary Analysis of Form and Content[J]. Journal of Media Practice,2015(1):56,59,61.
[6] Sylvain Parasie,Eric Dagiral. Data-driven Journalism and the Public Good:“Computer-assisted-reporters” and “Programmer-journalists” in Chicago[J]. New Media and Society,2014(4):853,854,856
[7] Sylvain Parasie,Eric Dagiral. Data-driven Journalism and the Public Good:“Computer-assisted-reporters” and “Programmer-journalists” in Chicago[J]. New Media and Society,2014(4):853,854,856
[8] Sylvain Parasie,Eric Dagiral. Data-driven Journalism and the Public Good:“Computer-assisted-reporters” and “Programmer-journalists” in Chicago[J]. New Media and Society,2014(4):853,854,856
[9] Fred Vallance-Jons. Data Journalism Continues to Gain Popularity[J]. Media,2014:19,20.
[10] Fred Vallance-Jons. Data Journalism Continues to Gain Popularity[J]. Media,2014:19,20.
[11] Mayo,J & Leshner. Assessing the Credibility of Computer-assisted Reporting[J]. Newspaper Research Journal,2000(4):81.
[12] Simon Rogers. Facts Are Sacred:The Power of Data[M]. London:Guardian Books,2011:para,110.转引自Megan Knight. Data Journalism in the UK:A Preliminary Analysis of Form and Content[J]. Journal of Media Practice,2015(1):55-72.
[13] M.Lorenz. Data Driver Journalism:What Is There to Learn?Paper presented at then IJ-7 Innovation Journalism Conference,Stanford,CA,2010(7).转引自Megan Knight. Data Journalism in the UK:A Preliminary Analysis of Form and Content[J]. Journal of Media Practice,2015(1):55-72.
[14] Megan Knight. Data Journalism in the UK:A Preliminary Analysis of Form and Content[J]. Journal of Media Practice,2015(1):56,59,61.
[15] Fred Vallance-Jons. Data Journalism Continues to Gain Popularity[J]. Media,2014:19,20.
[16] Chad Skelton. How to Crowd Source a Data Journalism Course[J]. Media,2014:21.
[17] K Hackett. Data Journalism for a Database Age[J]. Quill,2013(10):34,36,37.
[18] Rich Kane. Building Better Data Journalism[J]. Editor & Publisher,2015(2):8.
[19] K Hackett. Data Journalism for a Database Age[J]. Quill,2013(10):34,36,37.
[20] K Hackett. Data Journalism for a Database Age[J]. Quill,2013(10):34,36,37.
[21] Rich Kane. Building Better Data Journalism[J]. Editor & Publisher,2015(2):8.
[22] Mindy Charski. Data Journalism:How to Create Compelling Content From Data[J]. EContent,2015(7):14,13.
[23] K Hackett. Data Journalism for a Database Age[J]. Quill,2013(10):34,36,37.
[24] K Hackett. Data Journalism for a Database Age[J]. Quill,2013(10):34,36,37.
[25] Jake Batsell. Data is News[J]. Nieman Reports,2015:48,.
[26] Jake Batsell. Data is News[J]. Nieman Reports,2015:48,.
[27] Rich Kane. Building Better Data Journalism[J]. Editor & Publisher,2015(2):8.
[28] Mindy Charski. Data Journalism:How to Create Compelling Content From Data[J]. EContent,2015(7):14,13.
[29] Sylvain Parasie,Eric Dagiral. Data-driven Journalism and the Public Good:“Computer-assisted-reporters” and “Programmer-journalists” in Chicago[J]. New Media and Society,2014(4):853,854,856
[30] K Hackett. Data Journalism for a Database Age[J]. Quill,2013(10):34,36,37.
[31] K Hackett. Data Journalism for a Database Age[J]. Quill,2013(10):34,36,37.
[32] K Hackett. Data Journalism for a Database Age[J]. Quill,2013(10):34,36,37.
[33] Megan Knight. Data Journalism in the UK:A Preliminary Analysis of Form and Content[J]. Journal of Media Practice,2015(1):56,59,61.
[34] Keith Kirkpatrick. Putting the Data Science into Journalism[J]. Communication of the ACM,2015(5):17,16.
[35] Fred Vallance-Jons. Data Journalism Continues to Gain Popularity[J]. Media,2014:19,20.
[36] Mac McKerral. Steering Data Journalism into the Curriculum[J]. Quill,2013(8):24.
[37] Neil Reisner. Are Journalism Students up to Code?[J]. Quill,2014(4):9.
[38] Mac McKerral. Steering Data Journalism into the Curriculum[J]. Quill,2013(8):24.
[39] Data Journalism for All[J]. Editor & Publisher,2014(2):15.
[40] Katherin Fink & C.W.Anderson. Data Journalism in the United States[J]. Journalism Studies,2014(8):477.
[41] Katherin Fink & C.W.Anderson. Data Journalism in the United States[J]. Journalism Studies,2014(8):477.
[42] Katherin Fink & C.W.Anderson. Data Journalism in the United States[J]. Journalism Studies,2014(8):477.
[43] Mindy Charski. Data Journalism:How to Create Compelling Content From Data[J]. EContent,2015(7):14,13.
[44] Katherin Fink & C.W.Anderson. Data Journalism in the United States[J]. Journalism Studies,2014(8):477.
[45] K Hackett. Data Journalism for a Database Age[J]. Quill,2013(10):34,36,37.
[46] Sally Lehrman. Avoid a(biased)Data Dump[J]. Quill,2014(8):29.
[47] Mac McKerral. Steering Data Journalism into the Curriculum[J]. Quill,2013(8):24.
[48] Keith Kirkpatrick. Putting the Data Science into Journalism[J]. Communication of the ACM,2015(5):17,16.