智能语音交互应该如何设计？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

大鱼海棠

2020-11-27

1 评论 9421 浏览 94 收藏

14 分钟

编辑导语：随着亚马逊、小米、阿里巴巴等大公司都推出了智能语音产品，智能语音交互设计成为了一个值得探索的领域。语音交互如何设计才能达到更自然的交互反馈、更好的传达情感，这是目前需要解决的问题。对于用户来说，希望能与智能产品建立亲切的信任感，越相处越好用。AI时代，深知我者，才能久居我心。

一、语音交互需求价值

说到语音交互需求价值，总有一种不言而喻的感觉，语言作为人类信息传递的主要媒介，用其进行沟通交流，是一种遵循本能的行为。从我们记忆机器命令的键盘输入，到按机器提示的点击触碰行为，这类需要我们去理解机器的方式，随着科技的不断突破，也迎来了转变。

语音交互除了几乎不需要任何学习成本外，更有意义的是，解放了作为输入的双手（是不有种人类实现直立行走的伟大意义），人们可以同步开展其它任务，并且也调动了人类听觉的感官体验，而不用完全局限在视觉上。

下面就来说说如何设计一款语音交互产品，先说说语音交互产品设计的整体流程框架，再对其中各环节涉及的问题展开说明。

二、流程框架

查阅了亚马逊Alexa语音界面设计规范和Google的语音界面设计规范后，结合自己的解分为五个关键步骤：调研→定位→设计→测试→完善。

调研—— 挖掘语音交互使用场景

定位—— 聚焦产品定位，创建用户画像

设计—— 设计状态流程图，编写脚本，建立原则

测试—— 真人感受，在线模拟测试

完善—— 数据+案例分析，优化调整。

1. 调研：用户场景的选择

虽说语音交互（VUI）带来了便利，但并不是说现有的交互方式都可以完全替换，想想毕竟文字的形式不也还存在嘛。其简单快捷的方式对需要复杂信息的呈现，需要时间思考反馈的产品反而会增加复杂度。

Google给出了3条指导原则：

人们可以快速做出回答的场景。比如用户输入不需要思考的基本信息；
快捷，可以省去中间交互的时间，强执行操作比如给XX打电话（搜索框输入XX，点击查询，拨打的步骤合并一步提交后台处理）；
双手已被占用，需要并行处理其它任务场合。比如开车的时候，做饭的时候，记笔记的时候，这些场合双手多数是被占用的。

2. 定位：创建人物画像

语音交互是在模拟人的行为，建立的虚拟人的形象，也会让人们将现实中人的行为与其关联。字正腔圆的新闻联播是严谨真实的，少儿节目是活泼可爱的，相声综艺是轻松诙谐的。

在设计对话前，定位出产品态度，才好选择词语风格，句子结构。

3. 设计交互对话

设计分为三个步骤：逻辑状态图——对话脚本编写——解决方案分级

1）围绕用户产生的结果状态，梳理出逻辑图

机器与人的对话存在多种可能性，除了完成核心场景外，还要考虑意外的情况。用户输入不在范围内，用户不按提示操作，用户重复输入多次，用户没有回应等等。

但是这些都不算用户输入错误，这个概念是不存在的，都是一种状态，需要引导到正常会话下图是未展开细节的状态流程图示例。

唤醒——响应——输入——理解——输出

（橘色是人的输入，绿色是机器输出，无色是处理逻辑）：

如何设计AI 时代的入口——语音交互

2）对每个状态编写对话体验脚本

如何设计AI 时代的入口——语音交互

3）结合情感化设计的解决方案分级

从用户体验划分为三个层级，满足人们功能、心理、自我探索共鸣需求。

功能级：期望对话的产品更像一个自然人亚马逊Alexa设计规范指出人类对话的核心特点：串联，有上下文的相关性轮流，你说一句我说一句的互动潜在效率；省略词，简洁高效的本能多样性：一句话可以有多种表达形式。
心理级：激发未知好奇心人类天生有好奇心，喜欢新事物，计算能力强是机器的优势，如果每次对话，同样的问题会有不同的回答，用户会主动想去体验互动。
自我探索级：触发情感共情人是有感情的生物，一本记满日记的本子，陪你走南闯北的行李箱，何况是一只会说话的产品。并且经过时间的磨合，她越来越懂你，记得上次你查询的内容，记得你上次问的问题。会唤起你小伙伴在身旁的感觉。

4. 测试

1）大声的朗读出来，听起来是口语，而不是书面语言；

2）谷歌在线模拟器 ?https://developers.google.com/assistant/console/simulator。

5. 迭代完善

1）结合用户反馈，数据统计进行分析

比如：对于用户同一个问题提出多次原因可能是：

答案不是用户想要的；
用户忘记了第一次答案；
用户顽皮这时候可以结合人工理解，大多数用户选择进行优化。

2）示例中等待时间5秒按Cathy Pearl书中试验得出，这个值可以根据不同产品用户的反应速度调整。

三、设计中考虑的因素

从用户，产品，信息内容，传达方式中的问题与语言特征依次说起。

1）用户意图的识别

人们问的问题，因为个体差异，关注的点不同，需要的结果也会不一样。

比如：今天出门需要带伞么？

——男性：关注下雨；

——女性：关注日晒。

区别个体差异，让用户觉得你懂他，体验到产品的温度。

2）产品人格塑造

我们在与他人交流的时候，会注意场合，自我形象，用连接词进行话语的过渡。语音交互，作为一个拟人化产品，这些也是要考虑的。

自我形象：面向小朋友的教育软件，要树立一个勇敢权威的形象，而他们本身就是可爱的，就不应该再加入卖萌的话术。而客服类语音，由于客户面对问题会存在不耐心烦躁的情绪，就可以用幽默的话术缓解一下气氛。
注意场景：在公共场合，话语要简洁，高效解决问题。在私人空间，比如家，可以网络语化、逗逗乐。
过渡词：人们谈话的时候，不会拘泥于一个话题，会不断展开话题，比如：对了、其实、但是…

3）控制内容范围

语音交互实质是连接产品服务与用户需求，所以答案要么和产品有关，要么和产品无关。有关的是基于产品本身的有限搜索信息库。无关的用兜底的话术结束（这个功能我还在努力学习）还有一种是引导用户，结合着视觉，罗列出和主题相关的选项，引导用户找到答案。

如何设计AI 时代的入口——语音交互