VUI+GUI,AI时代全新的立体交互方式
语音的交互,将会给我们的产品设计带来极大的改变,一种视觉、听觉更为立体的方式,应该是提升产品效率,提升用户体验的一种进步和挑战。未来的产品方向,或者说是人机交互的方式,极可能是语音与屏幕的立体交互,我们会有机会来设计一种完全不一样的用户体验,和完全不同的产品认知。
语音交互的优势
这几年全球AI市场迅猛发展,Amazon Echo更是异常迅猛。根外媒统计,Echo在2016年的出货量就达到650万台。
Echo是一个能真正完成简单指令的音箱,回归了人类最为简便的交互方式,当你喊一声“alexa,play xxxxx”就能播放你想要歌曲,完全靠吼,彻底解放了双手。作为人与人之间最直接最自然的交流方式,语音对话中每一句话都包含多个场景下的多个动作,同时语音相对不容易受时间、地点的约束限制,可在短时间内进行大量信息的获取与处理。
而GUI是一种预设路径的交互方式,系统只能通过识别用户的下滑、点击、双击等交互行为以及用户所处的页面位置,判断用户的指令并作出准确的反馈。形成一种将用户限制在一个固定的脚本中的,强迫用户沿着单一路径去完成操作的人机交互方式。
VUI聚焦于如何发挥语言和表意的强大力量,采用人们日常的语言来交流,真实,自然的表达和获取反馈,获取用户的信任、传递信息。用户不再像过去GUI的体验一样,语音交互的流程更加直接,用户只需要通过有限的语音提示以及短期记忆来完成操作,甚至可以发出不同的语音指令来期望获得同一个反馈。
最自然,人性化,少用户摩擦的交互方式
不受实体UI形式的性质,用户可在任何时间,任何地点,以任何方式进行信息的获取与处理
从场景切入
语音交互同互联网诞生以来用户就习惯的GUI界面交互相比,主要是输入方式不同导致的,最显著特性就是“解放了双手”——你在使用语音请求时,眼睛和手可以同时忙于其他的事情,从这点出发,语音交互在家居和出行领域有天然的优势。
1、智能家居
在家庭“相对封闭与安全”(特指针对语音信号采集的干扰程度),通过语音交互指令控制家居开关是很好的切入点。相信在不久的将来,搭载了语音交互系统的智能家居,都可以听你的话,你说所说的每个指令,都会直接影响/控制到当前家居的运行状态。“你可能越来越惬意,你越来越懒……”
2、辅助驾驶
车载语音交互系统释放了驾驶员的手和眼,让司机专注于前方的路况,如接听电话,开关车窗,播放广播音乐,路线导航等语音交互指令。
3、企业应用
未来会有各种各样专业的知识工作者会在或大或小的程度被简化或者被替代,比如文本、数据的录入工作,比如客服机器人。
4、医疗&教育
如语音记录病历,不管对医生来说还是患者来说,都是提高看病效率的很好的辅助手段之一。
VUI是否取代GUI
语音交互不是一个独立的或者取代触摸交互的一种升级,而是基于人类最本能和最自然的一种形式方式。它是否能够广泛应用,有赖于对场景的深度理解,以及人能智能技术的进步。人工智能的发展,须从硬件、软件、操作系统各个环节的深度定制,才能带给用户最好的体验。
在GUI中,用户的行为实际上是已被预先设计或者设定(这也是为什么要在设计中强调对用户引导的一个因素),通过引导用户点击、滑动等指令交互来完成相关的判断和反馈。而在语音交互中,用户的行为将变得完全的不可预知,你无法预设用户的行为(语音内容),甚至同样的用户在不同的情境下(区别于场景)都可能有完全不同的行为和预期,导致系统必须通过更多的场景理解和上下文关系,去解析用户的意图来做出可能合理的信息反馈。
语音交互本身是非可视化的,非常消耗用户的注意力
语音交互的优势,在某些场景下,会变成劣势。比如你站在电视机旁边,开关机这个动作最适合的交互应该是手——直接一按就可以解决。人在获取信息的适合,视觉要强过听觉,别人讲话你极可能要等他说完你才理解,而你看文字的时候,甚至可以直接跳过部分文字你也能理解。这种场景下,语音交互的劣势会进一步放大。而当你开车的时候,语音交互简直惊世绝伦,在这种伴随式的场景下,语音的交互方式彻底解决了人的双手,极大的提升了效率。
(图片来自网络)
语音识别技术一旦取得进一步的突破,人机的交互也将更以人类最为熟悉的方式进行。当前,以智能音箱类产品作为切入点,打造了IoT的新入口,从需求到服务的路径被极大地缩短。从产品本身的交互设计出发,语音交互的特性和逻辑一定会促使它逐渐将凌驾于浏览器、App等入口之上,形成一个以语音交互为核心的全新生态链。
AI的来临,一定带来场景的巨变,交互方式也将从目前主流的纯软件(界面、触屏)/纯硬件,升级到更复杂的人机交互形式。
人类耳听、眼观、嘴说,手动的自然构造,其最符合于人类的交互体验,应该是在不同的场景由不同的器官(方式)来完成,自然的与外界信息进行交互。随着技术的进步,交互的方式定将发生颠覆式革新,未来的人机交互将更趋向于立体和本能。GUI+VUI,是一对有机的结合体,因为它符合人类的本能,不会被取代,只会彼此共同促进,通过恰当的协作机制提供更好的用户体验。但与纯GUI具有显著区别的是,未来的交互形式一定会更具感性的色彩,——“像人一样”。
语音交互好不好,不仅仅依赖硬件设备的识别准确率,更需要垂直场景下的语义理解,以及后端内容服务。
本文由 @杜松 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自PEXELS,基于CC0协议
难道不是还有一个SUI(sight)吗? 🙂
说实话,不看好VUI,至少现在不看好,碍于现在识音技术的限制和有限的语义理解,人类离真正的VUI还有很长的路要走。
不错支持