用数据讲故事:七种不同的数据展示方法
什么使一个故事真正成为数据驱动呢?在某种程度上,数字不再仅仅是出现在侧栏的表格,而是能够在真正意义上促进故事的发展。
数据可以帮助我们用不同视角叙述不同类型的故事。我在Tableau Public的同事Ben Jones鼓励我用七种不同的类型来构造数据故事((à la Christopher Booker的七个基本的故事情节)。Jones这个想法是根据大量数据故事的分析得出的,也可以帮助人们了解一些其他东西,使数据不再受限于侧栏表格。这些分类旨在让数据成为一个思想启动器而非我们看到的简单直白的结果,这样无疑提高了数据的用处。
我们通过由Freedom House(一个独立的监测机构)整理的数据来探讨一下每一种分类。这些数据将每个国家按照“自由”,“部分自由”以及“不自由”进行排名。使用这个简单的数据组,我们可以讲出七个不同的故事。角度则取决于你想通过这些数据表现什么以及你将如何展现这些数据。
叙述方式随着时间改变
对比2001年,有多少国家在2013年被划分为“自由”呢?事实证明随着时间变化,这个数字在急剧下降。我们可以通过数据将这种变化变得可视化,然后再解释导致变化的原因。
美国全国广播公司财经频道的John Schoen使用这种方法将Dow 30公司过去87年的历史可视化。使用者可以点击每十年看到数据是如何在每一次科技爆炸、70年代的通货膨胀、甚至是经济大萧条时发生变化的。美国全国广播公司财经频道的员工基于过去的趋势将这种可视化与未来的预测结合。
由大及小
数据可以引导读者具体深入到一个聚焦的点。用Freedom House的数据来说明,首先给读者一张标注得分的世界地图(整体画面),然后读者可以放大任意区域,比如亚洲,那么他会看到这个地区里一半以上的国家都被标注为“不自由”。甚至再放大一些,读者就会发现,朝鲜是所有国家里最不自由的。
我们通过在纸媒及互动媒体上给与提示来引导读者了解这种变化。
下面的这个例子展示了世界范围内疫苗预防疾病爆发的数据。这个概观展现了有多少例这种事例存在。读者可以通过选择国家、疾病或者年份深入阅读。读者可能会被引导看到一些其它相关的链接,比如,相比其他国家百日咳在美国更加盛行,并且文中会列出其原因。
疫苗可预防疾病的爆发 来源:未来研究中心
由小及大
我们也可以逆推,这种由小视角扩展到大视角。例如,首先关注的是世界上最自由的三个国家(这三个国家可能都位于欧洲)。从这里开始,由小及大来展示欧洲其他国家的排序,然后再次扩大到展示全球的对比,接着读者就可以看到全世界只有超过三分之一的国家是“自由的”。
来源:Ben Jones
这是一个展示移民对住宅价值的影响的例子。读者可以通过他或她的邮政编码进入其当地的视图。接着互动的筛选会提供一个全州的视图以及一个有着全国视图的地图。
移民与住宅 来源:Jacob Vigdor
突出对比
在数据集里突出不同可以引出一个有力的叙述。最自由的十个国家都在欧洲,并且恰好距离都非常近。而最不自由的是个国家,相反的,在五个不同的地区。
来源:Ben Jones
当然,地域只是“自由”和“不自由”众多不同之处中的一个。我们的故事可以继续探讨这两个团体主要的不同方面,从国家政策到文化再到历史。一个关于差异的研究是很吸引人的。
下面我们来说一个相似的故事。它基于人类发展的三维图(健康长寿的生活,知识和较高的生活水平)比较了世界上所有国家的性别差距。这个图表的一端的国家都差距较大,而另一端的却基本平等。
人类发展指数性别差距 来源:Ramon Martinez
探究交叉点
当相交的数据中有两条不同的线,并且一个超过另一个时,问题就产生了。这个有关自由的数据显示出“部分自由”国家的数量超过了“不自由”的国家,继而超过了“自由”的国家。是什么导致了这种变化?当排名发生变化时,人们就想知道原因。
来源:本•琼斯
自从破窗政策在1993年起作用之后,纽约时报的Sarah ryley将纽约发行传票的数量可视化。起初它的数量急剧上升,并且在开始缓慢下降之前一直保持平稳。然后盘查数量的飙升导致了它在2010年与传票数量的一个交叉点。就算这样,这两条线也没有进行比较。然而,这个交叉点和它的组成部分可以书写一个有关纽约执法策略的故事。
“破窗政策”之后的传票 来源:Sarah Ryley
剖析原因
有时候一些原因集中到一起就像是一个迷,形成了一个大局。它们可能是加法或乘法的关系。比如,每个国家的自由程度得分都是法律、经济和政治自由的总和。
来源:本•琼斯
这里有一个图表体现了太阳是怎样控制天气的。这个可视化绘制了从太阳黑子到全球天气的一些点,强调了它们之间的因果关系。
太阳黑子 来源于:马特·弗朗西斯
描绘出异常值
我们被那些不同于其他的事物所吸引。我们想要知道这些异常值背后隐藏的原因和原理。
发现这些异常值有时是需要一些数据研究的。将这些有关自由的数据可视化为分散点图,你可能会说这里边没有异常值。但是将它们根据区域分解成盒图,你就可以发现它们是分离的。
来源:本•琼斯
这个图体现了在2013年上半年各政府对facebook的需求数量。它清楚的显示了美国以8200多的需求数量优势成为了一个明显的异常值。一个伴随而来的故事可以点明美国政府在社会媒体监测上的立场,主要是用事例和可能的原因来解释美国联邦调查局不同寻常的高数量的需求。
Facebook的政府需求 来源于:Andy Kriebel
其他的故事类型?
我们仅仅是用一个简单的数据集来探究七种不同类型故事的开端。但是正如我所提到过的,这些类型都是被作为一个思考的开端来提出的。所以我们还应该在这个列表上添加哪些故事类型呢?我们还能如何使用数据来讲故事呢?在下面的评论区分享你的看法。
Martha Kang 是Tableau软件的总编辑,在这里她帮助记录当代的大的革命资料。她用尽一生来讲故事,现在专注于讲数据驱动方面的故事来帮助我们更好的了解这个世界,甚至我们自己。在加入Tableau之前,她是一名记者,她先是在电视新闻方面工作,然后是新媒体方面。她最近在担任KPLU的在线总编辑,一个隶属于西雅图的节目。在那里,她监测过一系列项目,包括Quirksee.org的开展,(Quirksee.org是一个垂直网站,这个网站在华盛顿国家特殊的税收制度下使她自己的两个成功故事和一个包含五部分的数据驱动系列故事独具特色。)Marth 也曾在KOMO nwes,美国西北有线新闻,和WLS-TV工作过。2013年,她被俄亥俄州立大学选为公共事物新闻中的吉卜林研究员。
作者:Martha Kang
翻译:赵丹、王宝丽
校对:田甜雨 本文来源于西外译新社。
😀