用户研究赋能用户体验建设
用户研究有两只抓手,一只是用户洞察,另外一只就是用户体验。本文结合案例解答用户研究人员在其中所扮演的角色,以及如何发挥用户研究人员在用户体验建设方面的作用,未来的趋势是什么的问题。推荐相关领域从业者阅读学习~
现如今,用户体验行业在我国经历了20多年的发展,已然成为一个社会化分工明确,有着由开设用户体验相关课程的高校院所、企业内部的用户体验相关部门、用户体验专业顾问机构、用户体验专业设备公司、用户体验行业组织(Uxren等)构成的完整产业链的行业。
一、用户研究在用户体验行业的角色分工
“用户体验”行业自诞生到现在,仍然处于成长期,远未成熟,期间经历了一系列的衍变,用户研究在其中的角色分工也经历了一些变化。
1. “用户体验”行业的发轫
用户体验行业毫无疑问发轫于用户体验设计。
在最早的软件产品开发时代,产品开发的流程是市场(需求提出)——开发(编程测试)——用户(使用),因为开发人员往往是非常专业的技术人员,导致最后生产出来的产品也只能专业人士使用。
随后开始引入设计角色,产品开发的流程变成市场(需求提出)——开发(编程测试)——设计(可用性)——用户(使用),这提升了产品的可用性,据此用户体验萌芽。
设计角色的引入从20世纪四十年代就开始了,心理学专家介入进行可用性工程学研究,其结果应用于飞机驾驶舱系统、电话系统等设计,是最早的用户体验设计师雏形。
在这个阶段,用户体验行业等于用户体验设计。
2. 用户体验行业的发展1.0时代
再然后,引入测试团队和设计优先团队,产品开发流程变成市场(需求提出)——设计(可用性)——开发(编程)——测试(测试)——用户(使用),产品可用性进一步提升,用户体验经济到来。
设计角色的加入和设计优先提升了产品可用性/体验,同时随之而来产生了对可用性/体验进行诊断、量化评估的需求。
为此,围绕着用户体验诊断及度量发展出日益完善的方法论、工具。
- 1965年,由 Parasuraman 和 Zeithaml提出了CSAT(Customer Satisfaction),中文名顾客满意度。
- 1986年,John Brooke提出了著名的SUS(System Usability Scale),中文名系统可用性量表,虽然略显“快速而粗糙”,但大量的实验证明是有效和可靠的。
- 1994年,IBM公司的Jakob Nielsen提出了著名的10 Usability Heuristics for User Interface Design,中文名尼尔森十大可用性原则。
- 2003年,贝恩咨询公司用户忠诚度业务的创始人 Frederick Reichheld在Harvard Business Review 的文章中首次提出NPS(Net Promoter Score),中文名净推荐值。
- ……
这个阶段,用户体验行业仍是由用户体验设计主导,同时用户体验行业从设计向度量延展。
3. 用户体验行业的发展2.0时代
随着移动互联网时代的到来,出于对用户的抢夺,开始盛行以“用户为中心”的设计理念,产品开发的流程变成设计(用户需求洞察、可用性)——开发(编程)——设计(可用性评估)——测试(测试)——用户(使用、反馈),产品在保证可用性的基础上开始追求人性化、愉悦,用户体验经济到来。
用户研究职业正是在这个大背景下诞生的,开始承接起原本属于产品设计团队的用户需求洞察、可用性评估(体验诊断&度量)、用户使用反馈收集的职责。
无论是可用性测试,还是满意度、NPS评估,本质上还是基于问卷调研得到的用户主观数据,随着大数据的崛起,用户体验的度量开始加入了客观用户行为数据指标。
典型的有Google提出的PUSLE模型(Page Views,Uptime,Latency,Seven-day active users,Earnings),全部由客观用户行为指标组成;HEART模型(Happiness,Engagement,Adoption,Retention,TaskSuccess),由主观指标+客观指标组成,是基于PUSLE模型的改进。
通过和大数据的结合来对用户体验进行诊断&度量,这其实已经超越了用户研究的边界。另外用户体验长久以来在很多企业内部其实并没有受到重视,因此有必要将用户体验作为一种企业文化引入,并设立长期体验目标。
这意味着需要从更高层面去整合数据、设计、用户研究等资源,从上至下推动,于是“用户体验战略”被提出。
此外,为了体系化、长效化进行用户体验建设,围绕用户体验水平持续跟踪与优化、对用户体验进行数字化管理、对用户体验组织进行管理等而形成了用户体验运营体系。
自此,发轫于用户体验设计,闭环于用户体验运营的用户体验行业成形,而用户研究在其中的角色明确并固定下来,那就是聚焦用户体验诊断&度量。
需要说明的是,用户研究之于用户体验的核心价值是体验诊断&度量,并不是说就不参与用户体验设计、用户体验战略、用户体验运营,从用户体验研究的角度,上述四个环节都需要用户研究人员的支撑。
二、用户研究如何助力用户体验建设
目前,用户体验的诊断&度量的应用场景主要表现在产品、运营、品牌三个层面。
1. 产品层面
产品层面的体验诊断&度量主要涉及可用性、满意度和NPS评估。
(1)可用性测试
用的最多的研究方法当属可用性测试。可用性测试是通过还原任务场景,观察用户使用(操作)行为,并配合访谈、竞品分析、可用性量表(SUS)来发现产品体验问题,并对可用性进行简单度量的方式。
可用性测试主要关注产品的可学习性、效率、可记忆性、容错性等,下面是实际操作的常用指标。
可用性测试还可借助眼动仪等设备监测用户的使用过程,属于神经营销学的手段之一,帮助更深层地了解用户。
传统研究方法(有意识/主观研究方法)和神经科学研究方法(无意识/客观研究方法)的结合,会产生1+1远大于2的效果。
(2)眼动追踪
以主流的眼动追踪(Eye tracking)为例,其原理是基于眼睛视频分析(VOG,Videooculographic)的“非侵入式”技术,捕捉瞳孔位置,并将该位置信息通过内置算法计算,获得用户在所看界面上视线落点,即用户当前注视点在界面上的具体位置。
眼动追踪主要关注发现度、兴趣度、理解度、接受度等指标,其中理解度、接受度要结合测试后访谈。
(3)用户众测
用户众测,是邀请一定数量的用户按照给定的任务脚本自行完成产品体验并进行反馈、评价的研究方式。
用户众测和可用性测试的主要区别在于两点:一是是否需要用户研究人员主持,二是样本数量。用户众测执行不需要用户研究人员的主持,样本数量较可用性测试的6-8个更多,通常可以达到30+从而可以用来进行定量统计。
如果说可用性测试主要用来发现体验问题,那么用户众测除了体验诊断外,还可以进行度量。
用户众测的流程一般包括任务设计、用户招募、任务测试、数据回收几个步骤。
任务设计环节需要考虑可行性,注意任务的难度,任务太难或者太简单都不合适;此外要考虑任务的合理性,有的任务不适合用户众测。
用户招募环节注意抽样误差,条件允许时可以做配额控制;此外需要注意招募的渠道,一般情况下内部渠道招募的用户会有本品牌光环效应,造成系统性误差,一个比较好的解决方法是无品牌盲测。
任务测试环节此外需要注意用户的任务完成度和效率,必要的话可以建群定期督促进度。
数据回收环节需要注意虚假作答和敷衍作答,看单个样本是否存在打分“糖葫芦串”现象,开放性反馈内容是否过于简单、有重复内容等。
(4)满意度
“满意度”就是“现实的产品质量和接受的服务”与“客户期望”之间的差距,说白了就是一种主观感受,希尔顿酒店满意度评分4.5分,桔子水晶酒店满意度评分4.8分,是不是桔子酒店的住宿体验比希尔顿好呢?不一定。
满意度评估项目的四个关键环节分别是假设模型(指标体系搭建),模型验证(指标体系调整),模型评估(满意度得分,权重和优先级确定),模型应用(内部宣导,绩效考核等)。这里重点说说假设模型和模型验证。
满意度指标体系通常基于用户体验旅程(触点)来搭建。比如一个贵宾厅的满意度指标体系,二级指标区分线上满意度和线下满意度,线上的三级指标又包括预定入口、价格、位置说明等,就是一个从线上到线下完整用户体验路径的设计思路。
但有时候满意度指标体系的设计也需要基于业务需求来设计。例如设计师表示,目前贵宾厅的满意度指标体系没有办法很好地衡量设计工作,发现设计问题,如果发起一个考察设计体验为主的满意度项目,指标体系就需要另外设计。
满意度指标体系的搭建需要遵循一些基本原则,具体包括用户认可,可干预,可测量,可对比。
满意度指标体系搭建好后,通过回收的数据需要对模型合理性进行检验,两种常见的方法就是探索性因子分析(主成分分析法)和验证性因子分析(结构方程),这可以帮助我们把与总体满意度不相关的二级指标剔除掉。此外,还要做信效度检验。
如果所有的二级指标跟一级指标都没啥关系,那就是我们的指标设计有效度问题,即用户不是用这个角度看问题。
(5)NPS
与满意度比较,NPS有很多不一样。
- 满意度更多是询问的态度层面,而NPS更多是基于行为层面的。
- 满意度是基于现状和过去的,NPS更多是基于未来的。
- 满意度是看重整体所有用户的评价,而NPS更加关注两头的用户,即口碑推荐者和贬损用户。
- NPS的波动性更大,即从样本量来看,因NPS是用口碑者减掉贬损者,NPS采集的样本量要求更高,这样数据的稳定性代表性更强。
企业实践中,通常用单一NPS研究和NPS+满意度两种设计思路,具体指标体系搭建不再展开,需要注意的是在执行了NPS+满意度的调研后,NPS与整体满意度出来的结果可能有以下四种情况:
尤其注意相悖的情况:高满意度但低NPS,可能说明产品和服务本身体验较好,但品牌/模式丧失吸引力;高NPS但低满意度,可能说明品牌力(概念/模式)强劲,但产品/服务存在痛点。
此外,NPS的人群结构不同,后续的策略不同。当推荐人群比例大/较竞品高时,策略是优先关注推荐者,维护引导、开发推荐人群价值;当中立人群比例大/较竞品高时,策略是关注中立者,满足中立人群在产品服务上的痛点需求,将其转化为推荐者;当贬损者人群比例大/较竞品高时,策略是优先关注贬损者,建立贬损者的预警、干预、反馈的机制,减少贬损人群的负面影响。
2. 运营层面
运营层面的体验诊断/度量主要涉及活动、客诉、广告效果评估。
(1)活动
活动效果的评估我们通常可以从数据和用户两个层面来看,数据层面关注活动对于活跃、留存、商业化收入等影响,但只看数据是不行的,因为不知道活动的问题所在以及改进的方向,所以用户视角的活动效果评估也很重要。
用户视角的活动效果评估主要可以解决四类问题,分别是活动用户画像、认知与行为、参与动机、评价态度。
其中核心的效果评估指标主要是活动转化和活动评价。
(2)客诉
客诉主要是以录音、文字的形式存在,其中对非结构性文本的分析和挖掘是重点。
文字形式的客诉基于数量级采用的研究方法不同。如果是小样本的开放性客诉,通常采用人工Coding方法就可以解决,具体操作就是对用户反馈进行分类然后分别打上标签,再进行统计,可以得到词云图、整体情感倾向(负向、正向)等。
大样本的开放性客诉就没法人工进行分析了,那样效率太低,通常借助文本挖掘软件进行分析,比如KHCoder。
KH Coder可以实现词频分析(Word Frequency),词的共线分析(Co-Occurrences of Words),词的相关分析(CorrespondenceAnalysis of Words)等,这里主要介绍下用得最多的词频分析和共线分析。
在《基于网络数据文本分析的目的地形象维度分异研究——以南京为例》一文里,以马蜂窝游客对南京的10077条在线评论文本为数据,运用网络大数据文本挖掘法、词频统计法和共现网络法,分析得出目的地形象维度重要性存在差异。
图 KH coder词频分析
研究结果显示,旅游吸引物(主要是人文类)所占的词汇最多、词频最高,它是游客感知目的地形象维度的第一层次,公共基础设施是第二层次,在目的地形象的感知维度中占有重要的成分;休闲和娱乐、旅游环境和地方氛围形成第三层次,而旅游基础设施是第四层次,它们共同构成了目的地形象感知维度。
图 KH coder共线网络
对目的地形象成分的研究结果显示,共现网络呈现6个节点群。游客感知的南京整体形象由景点、美食、交通、历史、建筑构成,主要源于旅游吸引物和公共基础设施维度,这也进一步验证了目的地形象感知维度的重要性存在差异。
(3)广告
广告评估一般分为前测和后测,前测指广告投放前的测试,通常帮助在多个创意里挑选最优的投放,后测指投放后的效果评估。
MillwardBrown(现为Kantar)作为全球知名的广告测评公司,其广告评估指标主要包括穿透力、信息传递、说服力三个维度十多个指标。
3. 品牌层面
品牌评估主要涉及品牌力、品牌漏斗、品牌形象三方面。
(1)品牌力
品牌力(Brand Power)通常是由模型计算得出,这方面比较知名的有MillwardBrown(现为Kantar)公司的MDS模型,该模型不仅可以用来对不同品牌的品牌力指数进行排名,还可以通过品牌力的结构进行分类。
(2)品牌漏斗
品牌漏斗的指标主要包括品牌知名度、品牌渗透率、品牌好感度、品牌忠诚度、品牌推荐等。
(3)品牌形象
品牌形象区分功能形象和情感形象,功能形象指产品功能层面的印象,通常用“性价比高的”、“智能领先”、“人性化设计”、“质量好的”等语句来描述;情感形象指对品牌的拟人化联想,通常用“年轻的”、“理性的”、“有趣的”等语句来描述。品牌形象的分析通常用到对应分析技术。
三、聊聊趋势
在用户体验诊断&度量方面,又可以构建起由指标体系搭建、数据采集、结果应用组成的小的闭环。
下面从这几个方面着手聊聊观察到的趋势变化。
1. 体系搭建
首先,指标体系颗粒度更加细化,并从单一指标发展为监测体系。
例如,中国平安在原有战略NPS体系的基础上发展了触点NPS和关系NPS。
战略NPS指对整个行业的本品和竞品用户进行测量,测量内容是用户体验旅程的所有关键触点,对标竞品识别体验差距,一般一年开展一次,主要用于战略规划。
关系NPS指围绕本品和用户关系,考察在所有用户生命周期阶段的本品NPS表现,同时每个阶段的测量内容和测量对象有所不同,比如手机新机阶段监测内容侧重新机使用体验,及时发现新产品体验问题,测量对象是新用户;购机后3个月监测内容侧重日常使用体验,测量对象是购机后一段时间的存量用户。
触点NPS指对用户体验旅程里的关键触点单独做监测,比如售前和售后触点NPS,同时触点NPS的测量表现出实时性,也就是用户在完成一次购物后就可能实时收到NPS调研问卷。
同样的满意度评估指标体系适用。例如以前我们在做一个APP的满意度监测项目时,通常只会基于本竞品对标一年做一次,也就是战略满意度。随着流量见顶存量用户精细化运营时代的到来,对产品满意度的评估可能需要下沉到某一个功能模块,会对该APP的关键功能单独进行满意度评估,也就是触点满意度。
其次,指标体系的度量维度更加丰富和立体化,除了用户体验维度,也开始整合技术维度,用户行为,商业维度等。
例如蚂蚁金服的PTECH指标体系,是以Google的HEART模型为基础,结合B端产品的实际情况整合而成的用户体验度量模型,是技术维度,用户行为维度和用户体验维度的结合。
再者,基于度量指标的模型化。典型的如上文提到的MB的品牌力模型,实质就是基于品牌知名度、喜爱度、差异化等指标搭建的模型;其他如蚂蚁金服发布的PTECH模型,微众银行发布的WeUX指数等,感兴趣可以自行了解。
2. 数据采集
随着指标体系的精细化,基于场景的关键触点体验监测的流行,数据采集开始以场景嵌入的形式出现,从而更加敏捷和即时。
例如,我们在刷抖音时会弹出一个小调研,询问用户对推荐的内容满意程度;又或者我们在美团上完成点餐,结束后的页面会有对本次手机点餐满意度的调研。
此外,相对于传统的人工数据采集,数据采集过程越来越自动化。
例如,我们在盒马完成购物,用盒马APP完成支付,用不了多久就会收到盒马的短信调研链接,询问用户在购物消费过程中的满意度。短信的发送可能不再是人工圈选用户然后推送的,而是满足一定条件后的自动系统触发推送。
又例如,一个抢票APP的产品体验度量项目,主要监测抢票得分、抢票成功率、抢票耗时等指标,最早是人工下单、人工统计各流程的时长和报错情况等,随后采用自动化框架测试技术,用机器代替人工,模拟真实用户下单,获取每单的查询时长、出票时长,可以精确到毫米级。
3. 结果应用
在数据采集完成后的成果应用环节,最明显的趋势是数据可视化或者说数字化。通过自动化管理仪表盘,可以简单明了的形式将度量结果的汇总信息与问题发现第一时间向管理层发布。
图 华为数字化管理平台(模拟)
此外,随着数据的积累,开始具备搭建行业均值数据库的条件。比如活动效果评估类的项目,通过往期活动效果评估数据,并计算了线上活动、线下活动的活动效果指标均值,就可以形成活动效果均值数据库(Norm值)。
参考资料:
[1]杨智宝,袁小伟,刘远.用户体验在我国的发展概述[J].中国质量,2020年6月,468期
[2] 青旗沽酒趁梨花i.体验度量理论2021[R].简简单单(公众号),2021年10月
[3]徐菲菲,剌利青,Ye Feng.基于网络数据文本分析的目的地形象维度分异研究——以南京为例[J].资源科学,2018,40(7):1483-1493
#专栏作家#
刘佩龙,微信:loop_summer,人人都是产品经理专栏作家。毕业于中国人民大学,10年+市场与用户研究经验,曾先后就职于Kantar,Nielsen等全球知名市场研究公司,目前就职于vivo互联网用研团队。致力于让更多人了解市场与用户研究。
本文由@刘佩龙 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议
用户反馈和活动数据都非常需要重视,对于产品,品牌而言,用户体验非常影响复购率