对话系统与AI PM的发展之道
编辑导读:如今基本每一个品牌的手机都装载了自己的对话系统,可以帮助用户订机票、记事项,甚至能够讲笑话。本文作者围绕对话系统进行了分析,希望对你有帮助。
本文将介绍对话系统的基本情况及局限,由此衍生出从事该领域的PM应该如何进行产品设计,以及笔者对未来的一些设想,希望能给大家一点启示。
本文将从以下几个方面展开:
- 对话系统的分类及简介
- 对话系统的局限
- 未来的设想
- AI PM的设计之道
事不宜迟,我们现在开始!
一、对话系统的分类及简介
首先,提及到对话系统,大家第一感觉是什么?我相信在当今智能终端时代,大家都会立马联想到siri,小度和小爱同学等。
这类对话系统具备了任务型和闲聊型的产品功能,既能同人对话,又能提供一部分服务,让用户感觉到智能科技感,虽然偶尔会有些智障,但很多人都相信只要给它们足够多的时间,有足够的数据和训练,未来肯定能像人一样智能,而这真的有可能吗?
我把手头碰到的对话系统按领域进行整理分类:
从上面可以看出对话系统现在已经渗透到各行各业,但其实它们实现的技术方案流程参考如下:
由于不像智能手机的触控交互(GUI)可视化,对话系统(VUI)看似像黑盒处理一般,只给一个输入,就可以输出一大段结果。
但其实整个过程其实就是将语音信号处理成文本,然后将文本整理成结构化数据,即我们常见的表格格式,接着就是按照产品经理设计的逻辑和词槽进行对话管理,最后按照设计好的接口和话术进行结果的反馈;
举个例子:
- “订机票”
- “从上海出发”
- “下周二出发去纽约的”
- “商务舱的”
- 等等
我们可以从上面的递进逻辑可以看出,我们必须补充完一些必填信息后才能往下走,
而这类语音交互本质就是类似用手触控订票功能按钮,一步一步的把你的出发地、目的地和时间等信息补充到应用上,然后给你呈现对应的结果;
看完是不是觉得并不是很智能,其实语音交互的优势在于可以一次性补充多个不同维度的信息,
如:“找下明天去纽约的商务舱机票”
如果产品经理设计得好,都设计了对应的词槽进行解析,那么我们一步就可以直接检索出我们想要的结果,而用触控得几步;
但其实这种表述并不遵循人性和口语化,一般也很少人能准确无误的表达这么一句话出来,看起来这个优势又可有可无。
对话系统的本质在于听人话(识别)+讲人话(对话管理),其中离不开填槽\填表的操作,每个科技公司都是按照这种技术方案进行设计。
而决定每个对话系统的优势与劣势,本质是看产品设计、工程设计和如何解决体验和规模化的问题等方面;
二、对话系统的局限
先说结论,对话系统的局限有以下几点:
- 局限1:缺乏实质的推理归纳能力;
- 局限2:无常识认知和世界认知模型能力;
- 局限3:对话范围收敛,无法支持发散及引导对话节奏;
现市场的对话系统基本是无法通过图灵测试,通过也不代表这个就意味着智能,我们在这里先对AI做一个明确的定义:
- 通用人工智能:即由人造出来的真正智能,即超级智能;
- 基于统计的机器学习,即通过现有技术,实现基础的人机交互;
前面一种是最终实现的结果,也将是人类未来最后的一项发明,而第二种是现阶段,人工堆栈出来的人工智障;
局限1:缺乏实质的推理归纳能力
举个例子:“找飞机票,不要深圳航空的”
这个例子我相信绝大多数对话系统都会直接检索出深圳航空的飞机票出来;
因为我们机器人处理或者说代码处理时,都有一个步骤叫做命名实体提取,而这里面的“不要”一般我们不会做解析,机器会直接将深圳航空作为实体,填入航空公司的词槽中;
而这上面这个例子,在我们普通表达里面,其实是比较常见的一种形式,我们对航空公司的售票员阐述诉求时,其实她们一般就可以理解我们的意思;
因为人的大脑具备基本的推理归纳能力,懂得“不要”这个词指的是“排除深圳航空以外的其他航司”,而机器人只具备提取实体的功能,不存在归纳推理的能力;
而这,不是深度学习、模型训练和标注能解决的问题,这是我们的第一个局限;
局限2:缺乏常识认知及世界认知模型能力
例子1:
“这袋苹果好贵啊,(它)价格要几千块”
“这袋苹果好贵啊,(它)价格要几千块”
如果从人的角度来看上面两个例子,我们会自动将第一个例子的它认定为最新一代的iPhone,而第二个例子的苹果认定为真正意义的苹果;
但从机器认知来看,它并不能进行这么复杂的认知,因为它缺乏对常识性知识的补充和对世界的认知;
例子2:
“我想喝点东西”
假设我们以siri的角度来完成这个指令,那么我们可能会让用户补充想喝什么类型的东西或者干脆把附近的饮品店通通检索出来;
如果要更加智能,还可以根据用户历史行为习惯,判断他是否是想要继续喝咖啡\奶茶;
但假设我们再增加一个维度,时间维度,即用户在晚上12点说“我要喝点东西”,这时候我们的智能就显得很智障了,大晚上请我喝咖啡,不让人睡觉啦;
因为我们的对话系统中,缺乏了世界认知的能力,所以即使我们把推荐系统做到了千人千面,该智障的地方,还是会智障;
而这个局限,同样是深度学习无法做到的,因为深度学习仅能处理基于明文的信息;
局限3:对话范围收敛,无法发散及引导话题
很多人会觉得小冰是闲聊型机器人的典范,可以做到对话可持续;
但个人认为这个其实也是一个比较低价值的东西,一方面是由用户主动对话触发的前提,一方面对话的延展本质也是人与人的对话,无非就是产品设计中做了很多追问逻辑,本质就是人造而非机器造;
而任务型或者问答型更不用说,就是一个闭环的对话模式,不存在发散的概念,因为一发散就智障;
三、未来的设想
回到开头我们的问题:
“但很多人都相信只要给它们足够多的时间,有足够的数据和训练,未来肯定能像人一样智能,而这真的有可能吗?”
我认为不太可能,因此笔者对未来大胆做一些猜想,未来的对话系统,脑波及脑机技术可能会对AI对话系统提高一个新的水平:
- 注册脑波与语音交互联动
- 基于知识图谱进行世界模型认知
- 脑波检测及世界模型导入
能超越马车的,不是一匹更快的马,而是一辆汽车;能创造新交互模式的,不是按起来更舒服的按键,而是触控,能超越对话系统的,不是一个具备多数据和自学习的对话系统,而是一种通用人工智能;
四、AI PM的设计之道
聊了这么多,我们是不是说AI PM在对话系统这方面没有什么可以做的了?并不是,产品永远是技术与市场之间的桥梁,我们只需找到发展之道,同样能给对话系统带来价值,总的来说,有以下几点:
设计对话系统时,注意收敛及用户引导
在设计对话系统时,多做引导,多注意引导语的设计要遵循口语化、通用化,不要有歧义,另外不要让用户产生发散的想法,注重问答的收敛。
设计思路的基础:存在即感知
让用户知道什么时候是机器人,什么时候是人工服务,这方面可以管理用户的认知,不会让用户觉得自己在被一个智障系统耍得团团转,这在客服系统尤为重要。
永远不要觉得自己在做创造,永远记住自己是在做设计
永远对用户存在敬畏之心,尊重用户和保证用户体验,不要个人脑部过多非必要的话术,充分利用多人泛化的理念,10个人写100句和100人写10句的效果是不一样的。
以上为本文的全部内容,本文内容参考:
人工智障2:你看到的AI与智能无关—S先生
希望能给大家带来一点感触,谢谢~
本文由 @SiegZhong 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自Unsplash,基于CC0协议。
还得是ChatGPT 吊打国内的Ai产品
决定每个对话系统的优势与劣势,本质是看产品设计、工程设计和如何解决体验和规模化的问题等方面。”这句话说得太对了