3个方面研究:图与表展示
图与表,是数据展示的两种形式,它们分别适用于不同的场景。文章从三个方面研究,图与表的展示,一起来文章中看看~
一、图与表的优劣势和适用场景
图的优势是直观、易读,往往读者只需要简单扫一眼,就可以对数据有一个基本的了解。图的劣势是数据承载能力差。由于图的空间限制,往往不能承载大量的数据。
表和图恰恰相反,表由于可以翻页的特性,能够承载大量的数据。但由于数据分布在不同的页,信息结构复杂,表的内容并不能够直观地一眼读完。
由于图与表各自的优劣势,以及不同的使用场景的具体需求,我们在数据展示中往往会灵活地使用不同的方案。
1. 只用图
在关注整体、趋势,不在意细节的数据展示场景下,一般只用图,如各种数据概览或BI。该页面内会放置多个图用来展示数据,用户在页面使用浏览、扫阅的方式来获取信息,关心整体胜过细节。
这种页面里,使用表格会造成页面空间的不必要占用,且表格的易读性差,用户不能快速获取信息。
2. 只用表
需要展示的数据项特别多时,使用图是不合适的。如广告后台的数据展示,往往会有数十个渠道的数据需要展示。如果使用图,这数十个渠道是无法完整展示的。这样的情况下,往往只使用表格来展示数据。
3. 图表结合
大多数数据展示的主流场景下,用户往往是先看图,快速获取信息后,再选择要不要继续通过表查看具体数据。这时,图表结合就是最合适的方式。
二、数据展示的本质
数据展示的数据,是从数据库来的,是通过sql语句从数据库提取出来的。数据库内的主要内容就是表。
下面是一个表的例子:
表的结构
表由行和列构成,每一行是一条数据记录,列是每条记录拥有的字段,表中的国家、省都是列字段。
我们将字段分为两类:计数型字段和计算型字段。
- 计数型字段只能计数,如表中的国家、省、市、性别;
- 计算型字段除计数外,还可以进行求和、求平均等运算,如表中的人和就业率。
数据提取时,往往会有这样的例子:按国家展示人口。即把国家相同的行的人口做一个汇总,得出的数据结果会是:
理解了这些基础知识后,我们提出这样一个观点。数据展示的本质是:按维度展示指标。
按什么展示,什么就是维度;展示什么,什么就是指标。如上文中的例子:按国家展示人口,国家就是维度,人口就是指标。有懂SQL的同学,对这部分会理解的更好一点。Sql语句里,select的就是指标,group by的就是维度。
然后,我们在引入一些概念:维度的数量、维度的实例数量、指标的数量。
维度的数量:我们按维度查看时,是几个维度?
如上文中按国家查看,维度的数量就是1,但按国家和性别查看,那么维度的数量就是2,如下图:
维度的实例数量:我们按维度查看时,一个维度有几个实例?
如上文中按国家查看,美国和中国就是国家的实例;按性别查看,男和女就是性别的实例。
指标的数量:我们查看的指标的数量。如上文中,我们只查看了人口这一个指标。
三、为数据展示选取合适的图表
折线图、柱状图、饼图…我们见过各种各样的图,不同的图适用于不同的目的和场景。
我们会发现,用图来展示数据,是有适不适合的分别的。让你用饼图来展示时间趋势的数据变化,你会发现基本不可能。同样,让你用折线图展示构成,也是不合适的。那么,这些合不合适,有没有什么内在的关联和根本的逻辑?
我们在上文的数据展示的本质中说过:数据展示的本质就是按维度查看指,维度的数量是1个或多个,维度的实例数量一般是多个,指标的数量是1个或多个。
按维度展示时,每个维度都需要在图中能够区分。单个维度的多个实例,也是需要能够区分的。同时展示多个指标时,指标之间是需要有区分的,例如通过颜色、形状等来区分。
我还是以上文的例子来说明:
这个数据集有两个维度:国家和性别。国家维度有两个实例:美国和中国;性别维度有两个实例:男和女。有两个指标,人口和就业率。这样的数据集,应该以怎样的图来展示?
这个图能够完美地表现数据集中的数据。但我们会发现:当国家的实例不止一个,而是200个时,这样的图就不合适了。因为横轴的空间是有限的,不可能容纳这么多的国家。
由此我们可以说,图的轴对数据集的维度的实例数量是有要求的,不能太多。其实这样说,也不是特别严谨。你会发现:如果横轴是时间轴的话,好像放个几百天的时间也不是问题,大不了中间的部分时间不显示罢了。
在此,我们引入另外一个新的概念——维度的实例的离散和连续。例如:国家维度的实例就是离散的,你不能在显示200个国家的时候,只显示首尾几个国家,就代表了所有国家。但是,日期维度的实例就是连续的,你要显示100天,只需要显示第一天和最后一天,别人自然会知道中间包括了这所有的天数。
所以,我们得出结论:图的轴对展示的维度的实例数量是有要求的。离散型的维度,只能展示较少的维度实例;连续型的维度,可以展示较多的维度实例。
说完数据集,我们来说回图表。数据集有维度,图也有维度,我们把图的维度叫做图维。图维是能够区分图的信息的方式的数量。如横轴、纵轴、颜色、尺寸、样式。
如下图,这是一个三个图维的图:横轴、纵轴、点的颜色。
下图是一个4个图维的图:经度、维度、气泡尺寸、气泡颜色。
相对于数据集维度的实例数量,图维也是有实例数量的。如:颜色维度,一般只使用较少的颜色,较多的颜色会让数据区分困难。
我们把数据集和图结合起来看:数据集有维度、维度的实例数量、指标数量;图有图维数量,图维的实例数量。数据集展示成图,就是讲维度。指标区分都对应到了图维上,维度的实例都对应到了图维的实例。
一个数据集能够在图中展示的前提条件时:图维数量>=指标数量+维度数量,图维实例数量>=数据集维度实例数量。
一个典型的图表页面:
常规场景下的图选择:
本文由 @ 流风 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
统计图表一直是我的短板,受益匪浅
不错