第一节 新媒体数据新闻简介
一、新媒体数据新闻的概念与特征
1.新媒体数据新闻的概念
“新媒体”在今天是一个使用广泛的词,但同时新媒体的概念也具有一定的模糊性。早在20世纪50年代末,就有国外学者提出了“新媒体”(New Media)这一说法,20世纪80年代,伴随计算机技术的发展,“新媒体”一词开始广泛普及,并被引入我国。“新媒体”不同于“新出现的媒体”,不能仅仅从时间上加以界定,要想对这个概念做出明确的界定,就要对 “新媒体”的特征进行辨析。总的来说,相较于传统媒体而言,新媒体具有数字化、交互性、融合性、虚拟性的特征。
“新媒体”主要指基于数字技术、网络技术及其他现代信息技术或通信技术的,具有互动性、融合性的媒介形态和平台。在现阶段,新媒体主要包括网络媒体、手机媒体及其融合形成的移动互联网,以及其他具有互动性的数字媒体。同时,“新媒体”也常常指主要基于上述媒介从事新闻与其他信息服务的机构。
数据新闻,又称“数据驱动新闻”,是基于数据信息的采集、分析、呈现的新闻工作方式。从狭义上看,数据新闻是建立在数据抓取、数据挖掘、数据统计和分析基础上,最终以可视化的方式呈现出来的一种新型新闻报道方式。从广义上看,数据新闻代表新闻行业未来的发展方向,是新闻学在大数据时代的研究新领域。“数据新闻”这一概念最早是由Every Block网站的创始人阿德里安·霍洛瓦季(Adrian Holovaty)在2006年提出的。一些欧美主流媒体首先对“数据新闻”理念进行了积极的实践,并引发了全球范围内新闻报道方式的变革。
数据新闻与新媒体相生相伴,具有紧密联系。新媒体时代,社会处于信息高度发达的状态,时时刻刻都会产生海量的信息。约十年前就有数据显示:互联网一天产生的全部内容可以刻满1.68亿张DVD;每天博客上产生的200多万份帖子,相当于《时代》杂志770年的总量;每天有86.4万小时的视频上传到YouTube,相当于一个人98年不停歇地录制视频产生的总量。新媒体产生的海量数据为数据新闻的产生提供了时代背景。新媒体数字化、交互性、融合性和虚拟性的特征也使得制作集合文字、图片、视频等媒体形式为一体的交互性新闻成为可能。借助新媒体广泛的分发渠道和强大的传播效果,数据新闻具有显著的影响力优势。
2.新媒体数据新闻的特征
(1)以海量数据为核心驱动力
新媒体数据新闻是以数据为驱动力的报道,数据必然是数据新闻存在的前提,也是数据新闻报道流程中最重要的因素。收集数据并对其进行结构化、知识化的处理,探索出有意义的数据间的相关联系,能够实现从单独的“新闻事件”到“情境报道”的完美蜕变。数据新闻将曾经用文字讲故事的方式转变成用数据讲故事,对传统新闻内容的生产以及叙事模式进行了改变。
(2)以数据分析处理技术为基础
面对庞大的数据量,往往需要借助复杂的数据分析处理技术才能得到数据背后隐藏的事实真相。利用高效的数据处理方式挖掘出数据背后的新闻事实,未经处理的原始数据只能反映事实的局部,只有进行多维度数据的关联和比较才能得到更深层的数据意义,获取某类群体的普适性结论,发挥数据的真正效用,制作逻辑性强的可视化图表。在数据新闻制作中,通过数据分析处理技术对不同维度的数据进行综合处理,深入挖掘每个数据集背后隐藏的社会含义,使新闻内容论证更为详细。
(3)以数据可视化呈现为报道方式
数据可视化是以信息图、动态图、交互图及视频等方式配上少量的文字描述进行新闻报道,有助于将冗杂的数据信息以及错综的关系链以形象、生动、简单的方式呈现,提升专业新闻的阐释效果,增强用户交互式阅读体验。一篇完整的数据新闻,数据可视化的技术与展现形式可以形成一种区别于传统新闻叙事的独特手段,这也是数据新闻本身独特的特点。一般情况下,优秀的数据新闻报道会达到科学与艺术的和谐与统一,而不是以单纯的视觉刺激吸引读者注意力。
(4)以移动端为主要传播渠道
随着智能手机、移动互联网的普及以及HTML5(Hyper Text Markup Language 5,第五代超文本标记语言)技术的发展,移动端逐渐成为新媒体发展的主流阵地。自2014年下半年起,数据新闻在移动端的开发受到媒体重视,数据新闻实践平台逐渐由传统PC端向移动端转移。移动端阅读极大提高了用户的参与感,优化了阅读体验,同时也提高了新闻的传播效率。
(5)以服务公众利益为报道指向
大数据能客观真实地反映网民对某类事物的态度倾向和行为成因,为政府制定政策、企业推广产品、媒体引导舆论提供有效策略。对数据的处理和呈现归根结底是为了让公众理解大数据时代中数据变迁的内涵,了解宏观数据如何影响每个人。服务公众利益才是数据新闻的出发点,大部分主流媒体数据新闻逐渐重视用户数据,从公众态度、行为数据中窥探出社会变化,解释数据和社会、数据和个人之间的关联程度,体现了新闻报道中“以人为本”的价值内涵。
二、新媒体数据新闻的产生背景
1.大数据时代的到来
大数据是指数据规模在获取、存储、管理、分析方面远远超出了传统数据库软件工具能力范围的数据集合。大数据中的“大”并没有规定具体数量是多少,在不同领域、不同时代,大数据的“大”都是相对而言的,能够表达出大数据真正价值的是大数据的全面性。大数据的产生顺应了当今信息爆炸的时代,业界人士普遍将大数据的特点概括为4个“V”,即Volume——数据量巨大、Variety——数据类型繁多、Velocity——大数据处理速度极快、Veracity——数据精确性高。
大数据时代,数据成为重要的生产力,这要求媒体必须探索新的信息生产和传播方式,以适应大数据时代的挑战。传统媒体的新闻报道、评论强调深度,注重“内容为王”,致力提供高质量信息,这种生产方式在大数据时代很容易被低成本生产的海量数据淹没。而数据的冗杂使受众对有价值的信息要求更加迫切,媒体如何在海量的数据信息里收集、过滤,并将有价值、有意义的分析结果清晰地传递给受众是大数据时代不可回避的挑战。这就意味着提升数据分析能力成为大数据时代媒体适应新的生产方式的关键。
数据新闻产生于大数据时代,是大数据时代新闻界为不断适应媒体环境变化而产生的一种新型新闻生产模式。数据新闻以海量数据为基础,致力挖掘数据间的相关关系,这种以数据挖掘为本质的报道方式倍受青睐,也是传统媒体转型升级的策略之一。
2.相关技术的发展成熟
具体而言,新媒体数据新闻涉及大数据获取、数据处理、数据分析、数据可视化等多方面的技术。
大数据时代的到来为数据新闻的产生提供了时代背景,数字技术、云计算和云存储技术、人工智能技术等新技术的发展则为数据新闻的产生提供了技术性条件。数字技术有助于把视频、音频等转化为被计算机识别的二进制“1”或“0”,把数字技术运用于新闻生产中则实现了新闻的可视化、互动化。云计算技术能支持海量数据的处理,并得到有效的数据;云存储技术则为海量数据存储提供了条件,相比传统昂贵的存储成本,利用云存储只需花费较少的钱就能存储大量的数据,为数据新闻发展节省了财力。人工智能技术则使数据的处理更加高效,可以模拟人的需求及人对数据的处理方式,对复杂的数据实现多种视角的处理。
互联网开源软件市场的成熟也为数据新闻的发展提供了技术支持。其低成本性和代码的公开与透明为从事数据新闻报道的媒体和公众提供了高效快捷的工具,如:在数据获取时采用Scrapy软件快速从网络中提取结构化数据,运用Tabula软件获取PDF文件中的表格信息并将内容转化为CSV文件或者Excel电子表格;在数据整理时运用Open Re-fine实现数据排序、自动查找重复条目或完成数据记录;在数据统计分析领域运用R语言提供用于统计分析、绘图的语言和操作环境;而在可视化阶段盛行的开源软件更是种类繁多。这为数据新闻的产生和兴起打下了坚实的技术基础。正如记者大卫·麦坎德利斯(David McCandless)所言:“数据正变得越来越重要,这并不是因为数据的量大,而是我们拥有了工具和能力去分析数据,找出模式、结构并揭示趋势。”
3.全球“开放数据”运动的兴起
“开放数据”指政府对公共领域数据的公开,这些公开的数据不受著作权和专利权的限制,任何人都可以自由对之进行运用。向公众公开的政府数据为媒体制作数据新闻提供了重要的内容来源。
全球“开放数据”运动始于美国。2004年,美国普林斯顿大学的一位名为乔舒亚·陶伯拉(Joshua Tauberer)的本科生创办了首个民间公开数据的网站。2009年1月,时任美国总统奥巴马签署了《开放透明政府备忘录》,要求建立更加开放透明、参与合作的政府,同年,数据门户网站上线。2011年9月20日,多个国家和地区联合签署《开放数据声明》,成立开放政府合作伙伴组织,全球“开放数据”运动由此展开。近年来,我国政府同样在为开放数据努力。我国国家统计局建立了国家数据公开网站——国家数据,国家数据网站首页如图1-1所示。
由此可见,围绕民生需求逐步向公众开放政府的数据集,使公众更清晰地了解政府的执政政策并有效地行使自己的权利,鼓励社会和企业利用这些数据创造更多社会价值,已经成为全球趋势。
图1-1 国家数据网站首页
4.新媒体发展的需求
2020年9月中国互联网络信息中心(China Internet Network Information Center,CNNIC)发布的第46次《中国互联网络发展状况统计报告》显示,截至2020年6月,我国网民规模为9.40亿人,互联网普及率达67.0%。在互联网快速发展、移动终端广泛普及的背景下,新媒体与经济发展和人们日常生活的结合日趋紧密,其在新闻生产和传播中也发挥着举足轻重的作用。
新媒体时代信息爆炸、用户“浅阅读”等现象的出现对新闻提出了新的要求。数据新闻的出现符合媒体信息服务的本质,也顺应了新媒体时代的信息传播规律:不是将大规模的信息永无止境地提供给受众,而是注重对有价值的信息进行加工梳理。因而在信息泛滥的时代,提升对数据的“加工能力”,通过“加工”实现信息的“增值”,使得新闻内容兼具信息价值与吸引力,成为数据新闻的显著优势。
三、新媒体数据新闻的分类
1.大数据型与小数据型
根据数据新闻所处理的数据范畴,可将数据新闻分为大数据型新闻和小数据型新闻。大数据型新闻是指报道中采用大数据量级的数据作为分析对象或引用大数据研究结果的数据新闻。而小数据型新闻主要是指报道中采用小数据量级的数据作为分析对象或引用小数据研究结果的数据新闻。
大数据型新闻报道对象较为复杂,牵涉面较为广泛,需要庞大样本作为数据支撑。因为大数据型新闻处理的数据量级较大,需要投入的人员数量庞大,花费的时间较长,耗资较多,这类报道往往出现在具有较强社会影响力的选题中。目前新闻业的数据新闻实践多以数据来源小、数据量级有限的小数据型新闻为主,其投入的人力、财力较少,技术要求较低,有助于操作和推广。
2.自采数据型与非自采数据型
根据数据新闻中数据的来源分类,数据新闻可被分成自采数据型数据新闻和非自采数据型数据新闻。自采数据型数据新闻是报道者直接通过深度访谈、问卷调查、田野调查等社会科学研究方法获取第一手资料,并将这些资料量化为数据后进行处理,最后制作成新闻报道。自采数据型数据新闻具有较强的原创性和独家性,自我采集的数据纯度较高、数据处理难度也相对较小。非自采数据型数据新闻的数据来源是已被公开的数据,或是通过合作、购买等途径从第三方机构获取的经过分析处理的二手数据。此类数据新闻的采编成本较低,但需要面临因数据不可靠导致的报道失实的风险。由于自采数据型数据新闻的资金投入多、技术要求高、花费时间长,目前非自采数据型数据新闻占比较高。
3.事件选题型与话题选题型
根据选题性质的不同,数据新闻可被分为事件选题型数据新闻和话题选题型数据新闻。顾名思义,事件选题型数据新闻是把某一具体新闻事件作为报道的核心,并对有分析价值和现实意义的数据进行处理、解读和呈现的数据报道。会议、活动、庆典等重大新闻以及自然灾害、重大事故等突发性公共事件常采用事件选题型数据新闻报道。在此类新闻中,媒体不仅可以将事件主题信息制作成数据新闻,也可以将事件的背景信息、外延话题进行整合和可视化报道。而话题选题型数据新闻则是通过围绕某个话题采集、分析相关数据,并进行解读和呈现的数据报道。话题选题型数据新闻可以网罗多个与话题相关的新闻事件,能够广泛而深刻地采集和分析数据,在反映和思考社会现象和热点问题时更具优势,但在时效性方面与事件选题型数据新闻相比,则稍显逊色。
4.调查型与常规型
根据数据新闻采编方式的不同,可将其分为调查型数据新闻和常规型数据新闻。调查型数据新闻是一种运用较复杂的数据分析手段,深入、系统地分析社会事件、现象或热点问题的数据新闻,一般需使用编程等复杂的数据处理技术,耗时较长。常规型数据新闻的数据来源较为单一,处理和分析手段较为简易,多把数据集作为数据来源,并采用简单的可视化手段做最终呈现。
四、新媒体数据新闻的价值
1.增强新闻报道的深度性和宏观性
在对重大的社会事件进行报道时,以文字为主的新闻报道往往缺乏宏观性场景的展现,记者叙述的内容常常只能反映事件的局部信息。数据新闻弥补了这一不足,与传统新闻记者对事物以个案采访、随机调查为主的方式不同,数据新闻注重通过对海量数据进行收集、处理来获取相关信息,更能增加新闻报道的宏观性。同时,单一维度的信息只能反映事件的局部,数据新闻采用的不是单一维度的数据,而是多种维度的数据,通过对不同维度之间的数据进行对比分析,发掘事物更深层次的信息,揭示看似毫不相关的因素之间的联系性。
2.增强新闻读写的交互性能
数据新闻的交互性能体现在读、写两大方面。一是受众可以自主选择阅读顺序和内容,开拓非线性的阅读路径,基于Web 2.0交互性的传播平台以及智能化数据库管理,特别是一些有互动功能的信息图表使数据新闻的交互性得到充分彰显。二是调动受众的积极性,使其参与新闻内容生产,例如在重大灾难性报道中,受众可上传相关经历补充新闻内容。编辑根据受众对于内容的反馈,将受众相关经历转化为新闻内容,并为受众定制“个人化”的信息服务,形成开放式新闻和公民新闻。数据新闻打破了传统新闻“传者中心”的地位,实现了即时互动和双向传播。
3.促进传统媒体与新媒体的融合
在当下的媒介生态环境中,以互联网为代表的新媒体在媒体领域的竞争中具有一定优势。新媒体具有交互性与即时性、海量性与共享性、个性化与社群化的特征,相比传统媒体,新媒体更得受众青睐。以报纸为代表的传统媒体,其读者数量和发行量都在连续减少,报纸“消亡论”一度被广泛传播。这种说法虽然过于消极,但也在一定程度上反映了传统媒体发展的瓶颈。
面对新媒体带来的挑战,不少传统媒体选择走“融合”道路,数据新闻的出现是将数字技术和计算机等新技术应用于新闻报道中的结果,同时也推进了媒体之间的融合。传统媒体在内容生产方面具有一定优势,而新媒体则长于效果呈现、网络传播,数据新闻结合了两者的优势,有助于实现互补。融合过程不仅是传统媒体的创新突破、新媒体的成长沉淀,更是整个新闻业的转型升级。