数据可视化(1):从认知心理学角度的理解
同样一组数据,只是把数字罗列出来,和用简单的线图表达数据,这两者的效果可能完全不同。本文作者从认知心理学的角度,对数据可视化进行了分析,一起来看一下吧。
一、为什么可视化?
下面是一组非常简单的数据,Excel 里面 6 个月的分渠道销售额。请问你能快速找出什么规律?
虽然只有 6 个月乘以 3 个渠道 18 个数字,迅速搞清楚也不没那么容易,我们要把数字一个个进行对比,甚至要刻意背下来一些信息才能发现规律。不然有时候看了几个数字前面的就忘了。人类短期记忆只有 6-7 个单元。
那么用简单的线图表达同一组数据呢?
我们可以看出,会展渠道在 6 月效果异常突出,而官网渠道从七月份起效果有明显下降。而我们得到这个理解只需要一瞬间,和之前找规律的难度对比鲜明。
假设根据上面信息,我们得知 6 月份有个重要峰会导致业绩上升,同时官网在 7 月份有改版,那我们甚至可以再加工一步,用不同的色相突出想表达的线图(官网渠道),并用醒目的红色标出重要事件,更好的表达需要调查官网改版以及进行修补。
但是也许有人会说,通过统计数据,比如平均值,不也可能快速理解和掌握数据吗?那我们看下面四组统计:
这四组数据应该一模一样吧?
那我们再看下,这四组数据,画成图表的样子:
Source:https://en.wikipedia.org/wiki/Anscombe%27s_quartet
是不是明显不一样,要不是看到可视化,我们差点被统计骗了?这几组数据由英国数学家 Anscombe 在 1973 年设计,就是为了突出只有统计数据是不够的,可视化至关重要。
数据可视化给我们带来的是,帮助我们理解,洞察,和表达数据,做更好的决策,以及影响他人。数据可视化一般分为两类,explanatory 解释性数据可视化,以及 exploratory 探索性数据可视化。实际应用场景普遍为数据看板辅助决策和监控,数据探索进行数据分析,以及通过可视化讲故事影响他人。
数据可视化带来的价值巨大,本身市场也在快速增长,Fortune Business Insights 预估其年增长率约为 10%,会在 2027 到达约 200 亿美金。
二、认知心理学角度
近几年开始流行一个词“中国式报表”,密密麻麻的一片数字放在 Excel 一样表里,作为中国特色。甚至有人认为,中国人不需要图表,只需要看数字,报表不适合中国人。
其实,欧美曾经的报表也是那样,比如 VisiCalc 和 Lotus 1-2-3 的年代:
Source: https://www.wired.com/2009/01/jan-26-1983-spreadsheet-as-easy-as-1-2-3-2/
之后数据可视化的逐渐胜出,是基于人类本性,基于人类无数年进化获取的视觉感知,认知,及短期记忆特性。这些本质,让可视化变成人类洞察和理解抽象信息的重要工具。
暂时回到一开始用过的例子:
其实一个认真负责很专业的员工,在对以上数据非常熟悉的状态下,完全掌握公司经营状态,只看这种表格也是可以的,而且数字密度高反而会有效率高的错觉。很多努力工作的小伙伴可能都在这种状态。但是如果以上数字再乘以几倍几十倍几百倍的复杂度呢?比如加上产品分类,产品分类细分,活动,活动分类等。这时候有效找出规律和问题,就不得不需要正确的工具支持了。
接下来让我们探索认知心理学,视觉感知中的先意识属性,以及格式塔原则。
三、先意识属性 Pre-Attentive Attributes
在下图中,数出一共有几个数字 9,需要多久?
把上图稍微改下呢?
找出数字 9 变成了一瞬间的事情,再数一下就好了。
在大脑过滤和整理视觉信息并传给意识之前,所有采集的视觉信息会先由潜意识进行处理。即先意识处理 Pre-Attentive Processing,先意识属性 Pre-Attentive Attributes 会被先意识处理快速提取出来。我们在第二张图能迅速找出数字 9 就是因为色相差是先意识属性之一。
先意识属性与处理就像人类的神经反应一样,如果不小心摸到滚烫的锅,我们会在大脑反应过来之前,迅速的自动把手缩回去。
先意识属性分为色相 Hue,形状 Form,空间位置 Spatial Position,以及动作 Motion。因篇幅限制这里一笔带过(色彩尤其重要和值得研究,会在未来另一篇文章深入探讨)。以下为一些常见例子:
下图为一个运用先意识属性的例子,每月支出超出或低于预算状况:
数据为 1-8 月份实际支出和预算的对比。目标是每月支出都在预算 95% 以内,用灰色标注线注明,支出超过预算 105% 视为严重超出预算,用红色。每个条形的长度为低于或超过目标的量。
我们第一眼就能看到红色部分,即 7 月份支出超过预算的 105%,第二会看到 4 月份和 7 月份超出预算但是还没到 105% 的部分。因为到达目标的月份条形方向朝下,我们也可以一眼看出 1,2,5,6 月份达到了目标。8 月份因为还在进行中,条形是虚的。整个 YTD 支出与预算对比一目了然。
四、格式塔原则 Gestalt Principles
格式塔在德语中意思为形状或规律,代表人类如何把看到感知到的信号,整理成信息并赋予理解。以下为六种大脑根据视觉信号创建感知的方法:
1)相近
我们的大脑会自动把下面左图按大概位置分成三组数据,中间图分成上中下三组数据,右图按左右分成五组数据。
2)相似
同理,我们会按照图形的相似度进行分组。
3)围绕
4)闭合
我们自动的“脑补”了图形,甚至文字的缺口。
5)持续
同样是脑补缺口,但是效果为持续。
6)相连
通过连接,把不同的物件放到一起。
下面是一个运营格式塔原则的例子,下图为某季度末,对两个团队一共 10 个员工的评分,每个三角或者圆圈都是一个员工:
能力评分低于 3.5 同时业绩评分低于 2.5 的同学,可能会被毕业输送给社会,要重点关注,于是用浅红色背景“围绕”起来。能力和业绩评分都很高的优秀同学同理。
而同样团队的员工们用同样的图形标注,也能轻易看出团队 A 的员工普遍能力更强,但是团队 B 的员工业绩更好。
当然,视觉感知的原理也是为什么我们能被自己的眼睛欺骗,比如下图的直线,怎么看起来似乎歪歪扭扭的:
Source:https://en.wikipedia.org/wiki/Caf%C3%A9_wall_illusion
或者下面两个橙色的点其实一样大小,但是看起来感觉就是不一样:
Source:https://en.wikipedia.org/wiki/Ebbinghaus_illusion
五、结语
我们在演示或探索数据的时候,无论是做 ppt,报告,BI 看板,设计产品,还是分析,若能有效使用可视化,可大幅度提高我们自己对数据的洞察,以及更好的传达我们的主张。
这篇文章只是讲了些基础以及简单运用方法。数据可视化是一个庞大的跨学科领域,包括设计,人机交互,统计学,计算机科学,以及本文中触及的视觉感知,认知科学等。
而本文想强调的,是数据可视化的力量来源和直接效果,都是基于人类本身,辅助认知,扩大认知。
Max(微信号 invicti 公众号 SaaS 沉思录)。硅谷海归,Salesforce 和 Intuit 高级工程师。ThoughtSpot 初期员工。曾管理 ThoughtSpot 全公司市场运营,销售运营,和数据分析。UC Berkeley 电子工程与计算机科学。
作者:Max,公众号:SaaS 沉思录,微信: invicti
本文由 @Max 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
人类如何把看到感知到的信号,整理诚信息并赋予理解。“诚”是个错别字。
收到,非常感谢指出!!