如何评估视觉体验?试试“合意性测试”

1 评论 4136 浏览 23 收藏 11 分钟

在用户使用产品的过程中,视觉体验会决定用户对产品的第一印象,因此,设计人员需要格外注重视觉体验设计。那么,我们要如何才能了解用户的真实感受、有效评估页面的视觉体验呢?也许你可以结合合意性测试来进行评估和分析。本篇文章里,作者便阐述了合意性测试的内涵与应用,一起来看看吧。

人类是一种高度依赖视觉的动物,在我们每天接受到的信息里,80%来自于视觉,可见视觉的重要。而对于产品本身而言,初次见面,就会很大程度影响用户是否愿意继续使用、是否愿意信任该产品,而决定用户第一印象的,便是产品本身的视觉体验。

市场竞争随着各类相似产品软件数量的爆炸式增长而愈演愈烈,视觉体验通过营造用户的第一印象,将产品本身的价值和主张传递给消费者,从而潜移默化的影响用户的购买决策,因此,视觉体验的重要性愈发得到重视。

因此,当定义好产品想要表达的价值和主张后,设计师会根据这些价值主张选择一些能传达该价值主张的视觉元素和设计风格,并期望我们的用户能够很好的感知到产品想要传达的东西,但在设计师看来是是非常“友好”的设计,用户真的买账吗?当设计师展示自己的设计方案时,如何去评估该页面的整体视觉体验呢?

一、视觉体验的探索

在进行视觉体验评估时,除了关注视觉效果是否好看的同时,还需要关注视觉体验能否引起用户的情感共鸣,也就是说我们在进行视觉设计时,除了需要好看的皮囊外,更需要其有趣的灵魂。

然而在通常的用户研究中,用户的客观行为、认知态度都较为容易测量,但是情绪反应却很难测量,很难通过直接询问得到用户当前的情绪反应,因为用户对自己的情绪反应很难有清晰认知以及精准描述。

而合意性测试给大家提供了一种简单有效的视觉测试方式,通过用户对结构化词汇的选择,去帮助用户表达自己的情绪,从而帮助设计师内部达成视觉方向的一致性。接下来会通过实际案例跟大家讲解什么叫合意性测试,以及如何进行合意性测试。

二、什么叫合意性测试

合意性测试的方法论首次提出是JoyeBenedeck和TishMiner在他们2002年的论文《衡量可取性:在可用性实验室环境里评估可取性的新方法》中,Benedek和Miner开发了一套结构化的词语列表,在这个列表中,一共有118个词汇,这些词汇涵盖了几乎所有视觉设计能引发的用户情感积极或消极反馈。Benedek和Miner会向用户展示某个用户界面,然后要求用户从118个词汇列表中选择5个最能描述该界面的词语。

视觉测试-合意性测试

翻译版见附录

三、如何使用合意性测试

之后所有的研究过程,均是围绕这套词汇列表展开的。合意性测试可以算是一种态度测试,既能应用到定性研究中,也能应用到定量研究中,具体执行方法如下,可根据自己的研究需要选择不同的执行方式。

视觉测试-合意性测试

四、如何选择测试词汇

在进行正式的合意性研究之前,选择合适的词汇列表是整个研究过程的关键。Benedek和Miner开发了118个词汇供我们使用,但我们需要将118个词汇列表全部纳入我们的研究列表中吗?这显然是不现实的,基于实际评估过程中用户的浏览&填答体验,以及针对不同的产品、不同研究目的,评估的重点也会存在差异,因此必须对原有的词汇进行有重点有规律的选择。具体如何进行选择,有以下几点建议:

1. 控制阅读疲劳

118个词汇需要用户大量时间去阅读和思考,即使是在有偿调研的情况下,也很难保障用户能将所有的词汇阅读完且进行认真思考,因此为了减少阅读疲劳,我们应该尽可能减少给用户呈现的词汇,只要能保障需要的词汇能纳入其中,建议词汇量在25个甚至更少,这样有助于获得更好和更高质量的用户反馈。

2. 词汇选择与测量目的相关

选择什么样的词汇取决于你想测量什么,如果我们测量的是与美观相关的维度,那就应该尽可能减少与功能、性能、内容等相关的词汇,如果我们测量的是与品牌属性相关的维度,那在词汇选择过程中,一定需要将最初预设的品牌属性词以及与品牌属性相关的词都纳入其中,同时词汇的选择不一定只能从Benedek和Miner开发的词汇列表中选择,可以根据自己的研究目的适当纳入自己认为必要的词汇。

3. 词汇包含各类反应

在Benedek和Miner开发的词汇列表中,不仅包含积极词汇,也包含消极词汇、中性词汇,如果说我们在选择自己的词汇列表时,仅选择积极词汇,其实是没有意义的,可以参考微软的研究,在词汇列表中,保留40%的消极词汇。

4. 减少无关因素影响

在进行问卷调研时,对词汇的呈现可以随机显示,避免排在前边的选项频繁被用户选中;此外在选择词汇时,尽量避免呈现一些含义较为接近的词汇,对用户的选择和理解易造成干扰。

五、如何分析测试结果

当我们分析用户的反馈时,需要先分析不同词汇被选择的百分比,然后通过从高到低的排序找到最常出现的词。但是不同的情况下,同一版本用户引发情绪反馈存在差异,可以使用”Venn图表“来展示,不同设计或同一设计不同版本或不同用户的测试结果。

视觉测试-合意性测试

除了统计词汇频率以外,如果我们不仅关注我们期望引发用户反馈的情绪,更关注我们的设计是否能引发更多的积极情绪,我们找出了参与者最常选择的形容词,并且计算每个设计中积极词汇和消极词汇的总数,并按照对词汇表中与设计目标的相关度,对不同的词汇进行赋权,然后计算最终不同版本用户得分。如下图:

视觉测试-合意性测试

六、结尾·小感悟

在我们进行评估时,特别是对不同版本的设计评估,尽可能让用户评估一些视觉差异较大的版本,一些微小的变化,如对某个元素的微调,某个局部的小改动,对设计师而言可能是显而易见的,但对于普通用户而言却很难发现,当你要求其进行评估时,通常会让他们感觉困惑,甚至为了回答你的问题,他们会编造或者随意选择几个答案回答你。

总结而言,合意性测试的核心在于让用户在限制的条件下,通过我们给予的结构化词汇列表进行选择描述,帮助用户将感知聚焦于我们期望用户感知的可能方向,未来期望合意性测试作为一种研究范式,能更广泛应用到各种产品测试中。

附录:

视觉测试-合意性测试

参考文献:

J. Benedek and T. Miner. 2010. Measuring desirability: New methods for evaluating desirability in a usability lab setting. Proceedings of UPA 2002 Conference

C. Rohrer. 2008. Desirability studies: Measuring aesthetic response to visual designs. xdStrategy.com

Measuring emotional valence to understand the user’s experience of software. Int. J. Hum. Comput. Stud. 65(4): 306-314 (2007)

作者:王楠

原文标题:视觉测试-合意性测试

来源公众号:58UXD(ID:i58UXD),58UXD,全称58同城用户体验设计中心。

本文由人人都是产品经理合作媒体 @58UXD 授权发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 本人在文章中有两个疑问:一是:“并按照对词汇表中与设计目标的相关度,对不同的词汇进行赋权”是什么意思?;二是:“计算最终不同版本用户得分”,是如何计算出分数的?希望有大佬可以解释一下,谢谢

    来自广东 回复