E星体育)的概念,最早是在20世纪60、70年代由美国新闻学教授、记者Philip Meyer提出(他这本书可以
),即运用社会学、统计学的调查分析方法来报道新闻,遵循定量研究的规范,以达到新闻报道的客观、公证和中立性。可以说精确新闻学促成了记者由观察、采访走向更深入的调查和专业研究。
个人认为,由于信息技术的进步、数据概念的扩展E星体育,数据新闻是在使命上继承了精确新闻的衣钵,而在方法论(数据获取与展示)上有了极大的丰富,更加回归新闻Storytelling的本质。
数据新闻到目前为止并没有唯一的定义,国内外学者对这一概念有过多种阐释。由欧洲新闻学中心和开放知识基金会联合开发的全球第一本介绍数据新闻概念的《数据新闻手册》对它的定义为:用数据报道新闻。国内学者张超、钟欣在《新闻业应用大数据》(2015)一文中则认为数据新闻是运用可视化和互动化手段,对社会某一热点问题进行宏观和中观的呈现、解释或预测的新闻样式。尽管不同定义各有侧重数据新闻特征的不同方面,但学者主要认为数据新闻集中在运用大数据和视觉化方式这两个特点上。
基于上述对数据新闻的定义,我们需要区分“数据新闻”、“数字新闻”、“精确新闻”这三个概念。这三种新闻在实践中经常被人混淆,因为它们往往都包含了数字信息和视觉化呈现形式。“数字新闻”指以数字、公式、字母等静态形式来辅助文字的报道。“精确新闻”的特点是使用精准的数据分析新闻事件,以避免主观、人为的错误。它侧重于微观的具体调查、实验和内容分析。
在许多中西方关于数据新闻定义阐释的文献中,“数据新闻”与基于科学的量化研究的“精确新闻”、计算机辅助报道新闻等概念息息相关。学者认为“数据新闻是精确新闻的延伸”(郭晓科2013)。它具备了精确新闻和计算机辅助报道的客观、真实和高效的优势,是对这些传统报道样式的继承和发扬。数据新闻报道离不开社会科学的统计方法,只是在样本容量、呈现形式、传播手段方面更为先进(黄骏2015)。
在样本容量方面,学者获取的数据通常分为三类,第一类是实验数据,这类数据的数据量大小往往在10-50条记录左右,在实验的控制下属于高质量数据,此时只适用于方差分析、回归分析等十分成熟的模型。第二类数据时问卷调查数据,这类数据的数量大小在60-3000条记录左右,数据质量中等,此时适用于传统统计分析的很多模型,包括生存分析、回归分析等等,并且经常考虑异方差问题。“精确新闻”的数据主要以前两类数据为主,数据量小于3000。
第三类数据也就是现在我们如今在互联网时代常常遇到的数据库数据,适用于数据挖掘的模型,包括神经网络、聚类、决策树等等。“数据新闻”的数据来源主要是第三类数据,数据量较大。
“大数据”(bigdata)概念从20世纪80年代诞生开始,如今已渗透入各个领域。它源于虚拟网络的极速发展以及现实世界的网络化。云计算、物联网、社交网络、即时通讯和移动互联等技术的涌现,产生了数量巨大、类型多样的原始数据(RawData)(黃骏2015),使人們可以在数据海洋里,抓取有用的信息并对其进行解读,增加信息附加值E星体育。与传统数据相比,大数据具有四大特征。
第一、数量(Volume),即数据量巨大,从TB级别跃升到PB级别,数据量的个数在100万到正无穷。大数据的推动因素主要来自于大型IT公司,如谷歌、亚马逊、中国移动、阿里巴巴等。据市场研究公司IDC统计,到2020年全球数据使用量将达到大约35.2ZB(1ZB=10亿TB)。数据的大小决定了所筛选的信息的价值和潜在价值。
第二、多样性(Variety),即数据类型繁多,数据结构复杂。一方面数据来源不仅包括传统的格式化数据,还包括来自互联网的文章、视频、图片、地理位置信息等。另一方面,数据是复杂、非结构化的。胥琳佳(2013)在《大数据对于传播学研究内容和方法的影响——基于社交媒体和移动互联网的思考》中认为,并不是数据量达到无限大时就是大数据,数据还需要呈现出非结构化的特征。
第三、速度(Velocity),数据的处理速度快E星体育。英特尔中国研究院首席工程师吴干沙认为,速度快是大数据处理技术与传统数据挖掘技术最大的区别,处理实时数据,并以实时结果为导向。“快”亦指两方面,一是数据产生得快,例如欧洲核子研究中心的大型强子对撞机在工作状态下每秒产出PB级数据。二是数据处理的快。
第四、真实性(Veracity),即追求高质量、真实的数据。并不是大量的数据就能对决策产生影响,而是要在海量的数据中筛选其中真实并且高质量的数据,进行整合,从而得到有价值的信息。数据具有了现实意义。
数据新闻是大数据在新闻领域的应用及体现,它与计算机辅助报道时代所用到的单一数据库来源不同,除了数据体量巨大,应用到新闻中的大数据最重要的特点是大部分为公开分享的数据,任何人或组织都可以借助手上的工具来求证新闻报道事实,完善新闻报道内容。
数据新闻是精确新闻的发展,只是随着技术发展,数据新闻样本容量更为巨大,可视化形式更为丰富,传播手段更为多样。
个人认为数据新闻属于新闻学+计算机科学,而精确新闻属于新闻学+社会学。。。
1821年5月5日曼彻斯特卫报(现在的英国卫报The Guardian)在其头版新闻“曼彻斯特在校小学生人数及其年平均消费”中使用的数据表,这也是历史上第一份使用头版数据新闻的报纸。
“用数据处理的新闻,数据新闻能够帮助工作者通过信息图表来报道一个复杂的过程。数据可以是数据新闻的来源, 也可以是讲述新闻故事的工具,还可以两者兼顾。数据新闻把传统的新闻敏感性和说服力的叙事能力,与海量的数字信息相结合创造了可能”。 ——《数据新闻手册》
“数据新闻“是基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式”。 ——方洁《数据新闻概论》(第一版)
数据新闻是一种运用计算机程序对事实材料和统计材料进行采集、分析和呈现的量化报道方式,也指一种通过上述方式生产的新闻品类。 ——方洁《数据新闻概论》(第二版)
“数据新闻”是“基于数据科学的知识和技术,通过或结合数据分析,对事实进行的新闻报道”。——王琼《中国数据新闻发展报告》
华南理工大学吴小坤教授在其论文《数据新闻: 理论承递、概念适用与界定维度》中对数据新闻下了如下定义:
数据新闻是基于数据分析和计算机技术的可视化新闻样式,在新闻叙事中使用数据呈现原本仅靠文字所难以呈现的内容; 或者通过数据分析发现问题,并进而挖掘出新闻故事。
德国伯明翰城市大学教授、在线新闻博客(Online Journalism Blog )的保罗·布拉德肖(PaulBradshaw)指出数据新闻“简言之就是一切通过数据处理的新闻”。
它与其他新闻的不同之处在于当你将传统的新闻嗅觉、讲述扣人心弦的故事的能力与庞大的数据信息结合在一起时,新闻报道能呈现出许多新的可能。
荷兰数据记者范艾斯, 认为数据新闻使记者能够通过发现、制作、呈现大量数据这一套工作流程展现未曾报道过的新闻故事 , 找到新的报道角度。
一些数据新闻不一定符合传统意义上好新闻的标准, 因为它们着重于呈现问题在哪里 , 而不是解释问题为何出现 。一个好的数据新闻成果有多个层面 , 你既可以深入了解许多个性化的细节 , 也能看清整体状况。
《》的阿隆·菲尔霍夫(Aron Pilhofer)表示,“在我看来,数据新闻是一个概括性术语E星体育,它囊括了一套仍在不断增多的用于新闻叙事的工具、技巧与方法,涵盖了从传统的计算机辅助报道(使用数据作为‘信源’)到最前沿的数据可视化和新闻应用等一切叙事方式。其统一的目标是新闻业意义上的:提供信息和分析以帮助告知我们一天内所有最重要的事件”。
德国之声电视台的米尔科·劳伦兹(MirkoLorenz)认为,“数据新闻是一种工作流程,包括以下基本步骤:通过反复抓取、筛选和重组来深度挖掘数据,聚焦专门信息以过滤数据,可视化地呈现数据并合成新闻故事。数据新闻可被视为一个不断提炼信息的过程,在这一过程中,原始数据转换成有意义的信息。只有把复杂的事实组织成条理清晰、易于理解和记忆的故事,公众才能获取更多益处”。
结合上述阐释,我们认为“数据新闻”是“基于数据信息的采集、分析和呈现的新闻工作方式”。对数据的重视和围绕数据所做的采集、分析与呈现工作构成了数据新闻的本质。
这是数据新闻的出发点,所有数据的处理和呈现归根究底是为了让公众理解我们身处的大数据时代中数据变
这是数据新闻存在的前提,如果政府、社会其他组织不公开信息或者没有以开放数据的标准向公众开放大量
依靠特殊的软件程序对数据进行处理,发掘隐藏于宏观、抽象数据背后的意义,找寻数据背后的结构性联系,
并将之作为报道叙事逻辑的驱动因素。这是数据新闻和一般新闻相区别的核心特征。
这是数据新闻的主要展现形式。得益于科学可视化的发展,数据新闻可以将复杂、抽象、难懂的数据转化为
第一种是数据新闻的早期形态,它既在早期新闻报道中常见,也是目前国内很多媒体普遍采取的数据新闻形态。这种形态具体又有两类表现:一是纯文字叙事的报道,引用大量数据作为支撑报道的论据;二是以文字报道为主,同时采用配图表的图解方式辅助新闻报道,图表多展现数据。值得注意的是,在前种形态中,如果数据能成为支撑报道叙事的核心内容,则可视为数据新闻;而在后种形态中,报道中有关数据的部分和文字报道部分必须是不可拆分的,也就是说数据要成为驱动叙事的核心。如果即使摆脱了图表,文字报道也有很强的完整性,数据就成了报道的点缀,而不是报道的驱动因素,这样的报道就不能称其为严格意义上的数据新闻。如果以这个标准来看许多以“数据新闻”命名的报道,就会发现其中存在诸多问题,不少报道还停留在用数据点缀文字的层面上,数据内容只不
第二种是数据新闻的成熟形态,即通过数据分析或数据挖掘,找出人们没有发现的盲点来报道的
数据新闻。在这类新闻中,需要通过数据挖掘分析,才能对信息进行深度的解读和分析,并找到人们应知、欲知而未知的信息。举个最简单的例子,你把北京,比如说我们每一个人的坐标,都记录下来,那这个记录本身可能没有什么特别的含义,它只是告诉你每个人的具置。但是如果我把这个时间点的全北京所
有人的坐标都显示在一张地图上,那你就会发现地图上有的地方人多,有的地方人少。那么人多的地方显然就是商业价值更高的,所谓的热点地区。这个热点地区可能是西单、东单这样的地方,这就属于数据挖掘。就是说当我看每一个人的数据的时候,我不知道北京什么地方更有商业价值,它跟这事儿是没有关系的,把所有的数据放在一起并且把它们可视化的时候,我就能直接看出什么地方人更多。应该说,这就是一种数据挖掘。当然,这是最简单的数据挖掘方式,我们还有更复杂的数据挖掘方式。而且做数据挖掘,很多时候不是那么简单。
第三种形态也是数据新闻的成熟形态,但其把核心放在故事呈现的环节,即纯粹用数据和图标去讲一个新闻故事,而不是采用传统的叙事方式做新闻报道。在这类数据新闻中,文字不再成为叙事的主要手段,而需要用图形E星体育、数据和其他可视化元素来引导叙事,讲述故事。这就意味着记者编辑需要重新考量如何以可视化方式或其他网络应用的形式架构一个新闻故事,通过各种图形引导和互动设计让阅读进行下去,这对从业者的思维转换提出了较高的要求,如果没有多媒体叙事的能力,则无法胜任这样的报道设计。
2007年12月,包括乔舒亚·陶伯拉在内的30位开放政府数据的倡导者齐聚美国加州,商讨制定了开放政府数据的8项原则。2014年乔舒亚·陶伯拉在其所著的《开放政府数据》一书第二版中对此前的原则进行修改扩充,制定了开放政府数据的14项原则:(1)信息只有能在互联网上公开自由地获取才能被视为公共信息。(2)数据必须原始(primary)。数据应该在其来源处收集,尽可能收集最高粒度(granularity)的数据,而不是收集经过聚合或更改后的数据。(3)数据必须及时(timely)。数据应该在其具有保存价值的时段内尽可能快速地公开。如果发布时间太晚,数据将失去其对于公众的价值。……(14)政府应加强不同机构之间公开数据的跨域合作。政府应建立或采用一个可分享的数据标准,促进各机构之间发布数据的跨域合作,如针对同一事物的不同部门的数据应能互通,以便公众将这些相关数据合并考量。
数据新闻更接近实务,它的适用范围更广,数据量更大。而精确新闻主要侧重于方法,所涉及的新闻题材较为有限~~~
美国新闻学者梅耶首创“精确新闻”这一概念,他根据自己的新闻实践和新闻教学经验,于1973年出版了《精确新闻学》,开启了“精确新闻”这一新闻报道的新形式。(来源)
精确新闻学又可理解为“精确性报道”,是指采取当代社会科学研究方法来呈现与表达新闻事实,主要侧重对新闻事件与新闻事实进行宏观定量描述或者深度阐释分析的一种新的报道方式。(概述)
“精确新闻”依据新闻素材的来源,一般分为“反应性精确新闻”和“主动性精确新闻”。“反应性精确新闻”是指新闻记者、新闻媒体直接采用本媒体外的其他社会机构或社会组织的调查统计数据与结果所作的相关新闻报道;“主动性精确新闻”是指新闻媒体、新闻记者不依赖别的社会组织或调查机构,而是自己应用社会科学研究与调查方法进行新闻采访与写作所作的新闻报道。(分类)
在运用精确新闻学时也需要注意一些原则。首先,要理清新闻报道数据的来龙去脉。新闻记者在新闻报道中不仅要提供与呈现调查数据,形成调查与分析的结论,而且要提供与展示新闻报道所采用的研究方法和研究过程的必要信息,让受众明白调查数据的来龙去脉,这是精确新闻报道的核心规范。其次,要精心筛选具有新闻价值的数据。新闻报道不同于社会科学以及其他研究报告,并不是所有的相关数据都值得在新闻报道中呈现与展示。再次,善于挖掘数据背后深藏的含义。精确新闻报道的选题素材和报道题材往往是社会生活中的重要、乃至重大新闻事件,经过较大规模且有计划的实证调查,或许数据已经足够丰富而详实了。另外,运用多种技巧使数据更具可读性。定量研究中的统计数据既抽象又枯燥,可以使用一些写作技巧来改善数据的呈现与表达方式,表现客观数据背后的人性和人情。(原则)
不过,精确新闻学也存在一些局限性。其一,报道题材受限。并非所有题材都适合做精确新闻报道,尤其是并非任何题材都能够用数字语言来表述。其二,操作过程复杂。精确新闻要求根据科 学实证研究撰写新闻报道,专业素养要求较高,操作规范必须严谨,从调查选题、调查抽样、问卷设计,到调查访谈、问卷回收、统计分析等,这些步骤和环节都需要严谨的工作态度和严格的专业训练,并不是任何新闻记者都能轻松应用。其三,时效性不强。量化研究需要足够充分的时间搜集、加工、归类与分析数据,与“短平快” 式的新闻报道相比,精确新闻报道无法在时效性上赢得受众。其四,受众面较窄。精确新闻报道往往充满了数字、图表与图示,要深入阅读这样的新闻报道,需要有相应的知识储备,而且还需 要受众动脑筋思考,这让许多受众知难而退。(局限)