打造智能硬件上“无感知声纹支付”的购物体验
人们的购物方式一直都在不断地迭代更新,从最初的现金支付到pos机支付再到如今的手机支付,购物体验逐渐完善。而如今,在智能设备上实现声音购物或许将成为下一个很新潮的消费方式。
一、背景
目前的大多数的智能语音设备,特别是智能音箱和智能机器人,主要是通过语音实现智能的人机交互,从而打造一种非常自然的交流方式。
除了听音乐问天气等常规功能外,通过智能设备进行购买商品或服务,正逐渐成为一种全新的购物方式,在智能设备上打开一个全新的购物流量入口,正因为如此,很多做智能音箱和智能机器人的厂家都在正尝试或已应用了通过声音购物的功能。
例如,天猫精灵连接天猫商城、小米AI音箱连接小米商城、叮咚音箱连接京东商城等。而要实现这种声音购物的唯一技术手段就是声纹识别。
本文将介绍在智能音箱或智能机器人这类语音设备中声音购物场景的特点、声纹支付方案及实现声纹支付的应用流程设计,在智能设备上打造一个全新的声音购物体验,实现购物“动口不动手”。
二、购物场景
回想一下我们在线上是怎样购物的?大多数人都是在京东、天猫、淘宝等主流线上购物平台进行挑选,不单要对比各个品牌、各个型号,还要看在不同平台的价格,整个过程非常耗时,且需要综合对比各种信息后才能做确定购买,还包括加入购物车、结算、付款等一系列操作。这还是在有屏幕、有视觉信息展现的情况下,依然需要非常耗时且复杂来完成整个购物流程。
在智能音箱上且不说没有屏幕,单是通过语音来实现这些流程就足以让用户放弃购物。因此,在智能音箱上的做声音购物场景确实是一个巨大的挑战。
2.1 声音购物有哪些场景特点?
- 安全:只要涉及到与钱相关的操作,都是强安全性的,也就是关键应用,声音购物必须保证支付的安全,也就要求对声纹验证的准确率有非常高的要求,一般要求千分之一的误识率下,有95%以上的通过率。而且,声纹识别必须具备活体检测功能,以防止非本人通过录音的方式冒充购物;
- 小额:一般购物的金额不超过200元,具体也可按实际产品设计来做限制,主要是为了控制风险;
- 便捷:整个购物流程需要简单,使用起来方便快捷,即要求好的用户体验。
2.2 哪些商品类型适合声音购物?
这个是需要根据场景特点来寻找的,既不能是大金额的商品,又要保证购买起来简单快捷,购买时不需要进行太多的商品对比。因此,有两类商品是比较适合在此场景下购买的:
- 标准化的商品:这类商品的特点是非常标准化,即使是不同商家提供的也都是一样的,不存在差异,是让用户“少选择”的商品,减少用户购物的思考时间,使购物流程更加便捷。例如,给手机充值、购买指定书名的图书等;
- 复购的商品:这类是用户已购买过的商品,是用户“已选择”过的商品,属于复购商品。例如,买过的牛奶、昨天点过的外卖等;
2.3 声音购物支付方式是怎样的?
- 自建支付账户:由智能音箱运营方自建支付账户,用户充值后才能使用;
- 第三方支付:绑定第三方支付账户进行支付,如使用微信支付、支付宝、银行卡等;两种方式各有优劣,对用户来说用常用的支付方式是最方便的。
三、支付验证
支付验证是整个声音购物最重要的环节,如果没有安全可靠的支付验证机制,则声音购物场景也就不存在了。在智能音箱中,语音作为主要交互手段,声纹识别也就成为了唯一一种支付验证的技术手段,如何使用声纹支付及如何设计安全便捷的支付验证流程,这成为声音购物场景落地重要的考验。
我们需要对支付验证点进行设计,一般分为两种设计思路:
- 第一种思路,在购买支付前设计支付验证点,引导用户读出设计的语句,以判断说话者身份,比如,让用户读出唤醒词、或者引导用户读8位随机数字等;
- 第二路思路,在购买支付前不设计验证点,以自由文本方式在交互过程中即完成了身份验证,这是一种用户体验更好的交互方式,同时对声纹识别的性能有更高的要求。
基于上述两种思路,有如下5种支付验证设计方案,至于在实际应用中选中哪一种方案,需要从各个方面综合考虑。
四、购物流程
回忆一下我们去商品购买汽水的流程:老板,我要买汽水、确定数量、给钱、拿汽水走人。
然而,我们现在面对的是机器,而且需要做支付验证,这就要求整个交互更明确更简洁,以减少异常情况。
以手机充值为例,按支付验证的第一种设计思路第二个设计方案,采用在支付前使用唤醒词+4位随机数字进行声纹验证,同时校验4位随机数字的内容合法性,并配合活体检测算法,以此确定说话人身份。交互流程如下所示:
上述购物流程是常规的流程,已经非常简洁了,然而,处女座的产品经理总是苛求完美,希望能以更少的步骤实现购物流程,就像我们去商品买汽水一样,不需要在支付时跟着老板说“天王盖地虎”的暗号。
我们根据支付验证的第二种设计思路第五个设计方案,还是以手机充值为例,参照在商店买汽水的流程,在自然交谈中即完成了支付验证,整个购物过程的身份验证是无感知的,我们称之为“无感知声纹支付”。因此,我们理想的购物流程,也是用户体验最好的流程应该是这样的:
我们是如何进行声纹验证的呢?其实表面上是自然购物交谈,但实际上在交谈过程中的每一句话都会进行声纹验证,以保证整个购物过程都是由同一个人完成的,当发现交谈中出现有两个或以上声音时,则自动进入加强验证流程,既保证了正常用户购物的体验,也通过加强验证避免可能存在的风险,提高系统安全性。如下流程图所示:
声纹流程确定好后,对于声纹注册流程、支付账户绑定流程等就只需要相应进行设计就可以了,在这里就不详述了。
五、小结
在智能设备上实现声音购物确实是一个很新潮的消费方式,这段时间也有好几家做智能的厂家来聊这方面的需求,自己也体验过声音购物的流程,确实,对于购买某些标准小金额的商品是非常方便,大家都在创新,这是一件好事,当然用户也还需要培育。整个购物流程每个细节需要反复思考,而声纹识别作为安全控制手段,更是重中之重。
相信这种便捷高效的购物方式会越来越多出现在我们的生活中,用声音连接你我,让科技服务大众。
相关阅读
作者:Micos,昵称:不知道(Never_Know_It),在人工智能浪潮中推波助澜的产品经理,致力于用智能语音实现人与机器最自然的交互方式。
本文由 @Micos 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自 Unsplash ,基于 CC0 协议
那支付方式流程呢
我想提个问题,为啥需要说手机号?
这是是以手机充值为例,而且也不一定是给自己的手机号充值,还可能是给家人手机号充值。
所以我们是不是可以设计的更加人工智能一点。你可以考虑下具体语境,假如更加智能的话,交互步骤会从三步变为两步,这会是很大的一个进步。只要你的语言识别能识别到那个“我”字。个人见解哈。
一般来讲,我们不会给陌生人冲电话费,所以只要你掌握通讯录,并允许对一个用户做多个备注的话,理论上,常规场景,都可以一步搞定。
首先,难道充话费就只局限于通讯录好友?如果自己能记得住手机号,所以通讯录没保存呢,其次,关于支付方面,最主要的是以安全为主,单靠一个字来识别,安全性能太低。
参照移动的自动语音服务,“请输入要查询的手机号码,按#号结束,查询本机请按#号”。
甚至,1步。