科大讯飞华南研究院执行院长刘舒:“AI+”时代,产品经理能力模型
近日,由人人都是产品经理与腾讯大讲堂联合主办的2018中国产品经理大会深圳站完美落幕,科大讯飞华南研究院执行院长、讯飞易听说总经理 刘舒做了“AI+时代,产品经理能力模型”的主题分享,并引发探讨:整个AI行业的产品经理从业者,应该具备哪些能力模型?enjoy~
分享嘉宾:科大讯飞华南研究院执行院长、讯飞易听说总经理 刘舒
以下内容为嘉宾分享实录,由人人都是产品经理社区@Daisy 整理编辑,部分内容有修改,嘉宾已确认:
16年我曾提到,互联网时代的“流量暴利”已经消失了,所以当时提出了“互联网+行业”这个命题。回顾一下这两年多的发展,我们可以看到这样的命题实际上是成立的。
最近两年多,那种因暴利连接的产品其实已经是消失,取而代之的是垂直细分行业里生根的一些企业。其中,我们最重要的是要对行业知识进行一些理解,从而提升它的效率。而人工智能就是在“互联网+行业”的过程中引发出来的新一轮革命。到了2018年,人工智能实际上已融入到了我们生活中的方方面面。
所以,今天我也是希望结合这两年多的一些从业案例,以及对人工智能的一些思考,在此跟大家做一个主题分享《“AI+”时代,产品经理能力模型》,主要分为三个部分:
- AI时代的来临
- AI的前世今生
- AI产品经理的三大能力模型
一、AI时代的来临
1. 从国家层面上来看
无论是美国,还是中国和欧盟,都陆续发布了有关人工智能的国家战略;对于互联网来说,这是一个很重要的事件:
2017年7月20号,国务院发布了新一代人工智能的发展规划,这是国务院首次以行政规划的方式发布产业发展规划。从这一点上可以看出:中国正在以举国之力抢战AI的制高点。
2. 从行业层面上看
大家可以看到:无论从国家还是从行业的层面上,AI都已经到来。
无论是麦肯锡,还是科学杂志、德勤,以及埃森哲的一些报告,大家都纷纷预言:人工智能在未来会更多地取代人类现有的一些工作,并且使得人类社会的生产效率变得更高。对此,大家也感到了一些担忧,比如就业率会进一步地下跌——或者说失业率会进一步地上涨。
3. 从生活层面上看
AI并不仅仅停留在国家层面和行业层面,也融入到了我们生活中的方方面面。
从上图我们可以看到,AI现在确实很火。
而对于想要从事AI的产品经理来说,该抓哪些重点呢?
首先要了解AI技术的发展演进历程,包括它的一些技术原理和技术边界;只有这样,我们才能更好地去设计产品。
所以,我们先看下AI的前世今生。
二、AI的前世今生
AI其实并不是这两年才出现的,它很早就诞生了,但是为什么到这两年它才开始火起来呢?
1. AI的诞生与AI的成长
在1965年Dartmouth会议上,当时四个图灵奖的得主聚集在一起提出了十大问题,标志着AI行业的诞生:
自此之后,AI一共经历了三次浪潮:
70年代和90年代,由于算法结构及当时的计算能力因素,在当时行业的应用上、效果上,都没有达到一个很有效的效果,所以前两次浪潮都是潮起潮落。
随着这个深度学习的出现,历史上的一些问题得以被解决,且取得了超前的好成绩。比如语音识别、图像识别等,都比传统算法有更好的实用效果。因此,我们遇到的AI才变得实用,从而带到生活中。
所以,我们认为这一次是人工智能真正到了爆发的时候。
那么,什么是深度学习?
接下来,我就会用一些简单直观的例子,对深度学习做一个详细分解:
首先,深度神经网络本质上是一个分类器,它是模仿人的感知过程。
如上图,这是一个简单的深度神经网络。从左往右看,整个深度神经网络是一个函数(F就是一个函数),左侧的“1”和“-1”,我们称为输入的特征或者输入的向量;右侧的“0.62”和“0.83”,我们称之为它输出的一个结果。
在这个案例当中,“0.62”和“0.83”实际上是属于不同分类的概率。相当于图像识别中的“这个是男人还是女人?”。
那么,证明他是男人的概率为0.62,她是女人的概率为0.83。
所以,深度神经网络就是:每一个输入经过深度神经网络的运算后,最后得到它在不同分类的概率;而它的本质就是输入一个特征向量,即“1”和“-1”。
换言之,通过深度网络的逐层运算,最终得到该向量属于不同类别的概率。
至于如何定义这个类别?
- 比如语音识别:属于哪个中文字?属于哪个发音?这些都是分类;
- 比如人脸识别:是男是女?他年纪多大?这些都是分类;
- 比如自动评测:它得多少分?他得100分还是得0分?这也属于分类。
所以实际上,深度神经网络的核心就是解决一个分类的问题。
那么下面我们怎么来使用这个深度神经网络?
它一般分为三步走:
操作步骤1:准备标注数据
第一步,我们称之为叫标注数据。
刚才这个神经网络当中,进行逐层计算的时候,中间都有很多参数,那么这个参数是怎么得到的?
举一个数字识别的例子:假设我要识别一个图像,它里面写了0~9这十个数字。如果这个图片的像素点上有值,我就认为它是“1”;如果没有颜色,白色就认为它是“0”。
这样一来,我就把一个图像变成了一个向量——比如它是16×16,那么就是X1到X256。
我会事先准备一些数据,再交给机器去学习,我会事先选出标准“2”。
拿出来后,我告诉这个机器,它的输出是什么呢?
比如说我准备的标准是“1”,它的输出属于“1”的概率是100%;那么它属于其他数字,比如说2345等,它的这个概率为0,它不可能是其他的数字——所以我会准备大量的数据。
操作步骤2:训练网格
准备完这个数据以后,我就拿进去,我们称之为“训练”,即“训练”这个网格。
我们准备了大量的手写体“1”的各种变形、“2”的各种变形、“0”的各种变形……这些是图像,每一张图像我们都把它转化成向量(特征),然后把特征输到这个网络里面(右侧为输入);输出我也是跟机器讲好了,比如说第一排的这个数字,无论他怎么写,最后我认为它都是“1”,属于“1”的概率是100%,属于其他数字概率是0;第二行,所有的这种手写的方式,我认为它都是“2”——相当于把这样的输入和输出,明确地告诉机器,去训练这个网格。
在训练的过程中,需要的训练数据集是非常之大的。
比如在语音识别中,要大量的标注人员准备差不多10^11这么多的语料。而要解决某一个问题,比如说语音识别,要这么多的数据量;解决肺部结节的图像自动诊断,又需要这么多的数据量……每一个领域都需要这么大数据量,要提前输入到计算机里面,然后训练好这个网格——所以在做AI的时候,这个成本是巨大的。
操作步骤 3:使用网络
训练好以后就很简单了,这个网格就可以叫人工智能,就可以拿来用。
如上图,这个时候我再拿一个图片进来(事先不知道是几),我把它的特征抽出来后,用这个网格一算,最后得出:
- 属于“1”的概率是0.01(几乎不可能);
- 属于“2”的概率算出来是0.99(可能性很大);
- 属于“0”的概率是0.01(几乎不可能)。
这样逐层算下来后,最后我们认为这张图片就是“2”——实际上,这个网格就可以解决数字识别的问题。
以上就是关于深度神经网络的一个简单直观说明。
2. AI的现状
如上图,我们可以看到整个AI发展的三个阶段:
- 第一个阶段:计算智能。大数据和云计算技术的出现,使得计算智能机器已经远远超过人类,比如说Alpha Go;
- 第二个阶段:感知智能。由于深度学习的出现后,人工智能目前已经在大部分的领域能媲美,甚至超过了人类;比如在语音识别、图像识别等领域。
- 第二个阶段:认知智能。这是最重要的一个阶段,认知智能就是人区别于万物最核心的一个点,比如动物也是有感知的,也能分辨这个是不是能吃的,也能做一些简单的分类。
那么,这三者的区别在哪?
我们实际上认为:人类区别于动物最重要的是想象。
什么叫想象?就是人类能创造一些根本不存在的东西。
比如:
- 什么叫胜利?
- 什么叫失败?
- 什么叫沮丧?
- 什么叫神明?
这些概念实际上是人创造出来的——通过这种想象出来的概念去凝聚人类,共同去完成一个目标。
目前这个人工智能还没找到有效的一些模型;因为目前整个人工智能的发展,更多的是技术在人们已有的一些计算框架下,通过一些仿真学的一些方式,然后让它的效率变得更高。
因此,我们认为:目前人工智能的发展还处于前两个阶段,即计算智能和感知智能阶段——已经媲美,甚至是超越人类,但在认知领域是有待突破的。
最近这两三年,感知智能在深度神经网络出现以后,取得了飞跃式的发展。
那么在感知智能的应用上,目前已经在哪些领域里面已经非常实用了?
如下图:
我们简单地分析了算法的机理,下面我就会结合它的一些特征,然后继续分享:在这样的一个技术框架下,我们产品经理应该具备哪些能力,才能够区别于互联网的产品经理,从而在AI这个领域取得更好的一些成果?
三. AI产品经理的三大能力模型
基于AI的一些特有性,我们来分享一下关于AI产品经理的三大能力模型:
能力1:对AI技术边界的认知
第一个能力模型很重要, AI产品经理一定要对AI的技术边界要有很强的认知——因为你对所在行业技术边界的认知,直接决定了你设计产品的应用场景。如果你对AI技术的认知深度不够高,那么你设计出来的产品要么没人用,要么就累死开发——所以AI技术是一个很重要的特征,这是基于概率体系。
也就是说,所有的输入和输出不是一个确定性的结果。
比如我一个手写的“2”,对于一般的人理解,这个肯定是“2” ;但是对于计算机,对AI引擎来说,它输出的是概率,如:
- 输出属于“2”的概率是多少?
- 输出属于“1”的概率是多少?
- 输出属于“0”的概率是多少?
而且有些时候还会犯错——最后输出的结果,可能属于“1”的概率比属于“2”的概率还大。
这个颠覆了我们原来传统做软件、做互联网的思维。
举个例子:
在语音识别这个领域,我们的识别准确率在过去十多年是低于95%的。这时候,我能用这个概率去作会议记录吗?
这个是不行的——100个字里面错5个字,甚至可能有些关键字都错了,这个东西不实用。
但是在哪些地方能用呢?比如说K歌的评分,辅助的文字输入——这种偏娱乐性,对准确率要求不高的一些场景下面,我们就可以使用。
再举一个大家耳熟能详的例子:
在图像识别领域,前两年特别火的是什么?猜年龄,或者看你长得像哪个明星?——为什么当时这类型应用特别火?因为当时的图像识别准确率比较低,比如说是低于95%;在这种技术边界下,我们只能做一些娱乐型的设计。
最近两年的发展,在一些特定场景下,我们的准确率能提高到95%以上,甚至是99%。这项人工智能技术,由于它的边界前移了,往后也提升了,所以使得它的应用场景就变得更加宽阔了。比如现在的安防身份认证,包括用微信领公积金,都是用人脸识别作为密码,这个的原因在于:人脸识别的准确度,我们经过十多年的努力达到了技术边界。
这个是很典型的一种场景:
作为互联网软件的产品经理,你对开发说的一句话肯定走到他桌边,说:“哎,这个功能要多久实现?”
开发说:“可能要两个月吧。”
但如果你是AI产品经理,就不能这样去问了——因为这样问就显得太业余了;而且这样的问法,这个产品肯定做不好。
那么该怎么问?
你应该说:“三个月,语音识别率能达到95%吗?”
你绝对不能说三个月时间能不能搞定语音识别,这时没有人能回答你什么叫搞定——所以,你要把这个边界提出来。
而且参与这个的开发同事肯定会这样回答,
“三个月,识别率只能达到90%,而且需要标注100万条数据,需要100个标注师,如果你搞不定这些,那这个准确率也保证不了。”
所以在AI时代,作为产品经理设计产品的时候,关于技术边界的认知是最重要的。
能力2:具备行业相关知识和深刻洞察
作为AI产品经理,第二个能力模型一定是要具备行业的相关知识和深刻洞察——这一点也是区别于互联网其他领域的产品经理。
互联网创造了新的行业和规则。比如「微信」这种通信方式,之前是没有的,现在创造出来了这样的一种交互方式;再比如阿里巴巴这种电商,虽然这是从外国引入进来的,但对绝大部分中国人来说,以前是没有这样的一种交互方式,所以里面的规则、操作和一些认知结构全是由互联网人全新创造的——你会感觉到天地开阔,你设计的每个功能好像全国人民都能用。
但是,AI行业并不是去创造行业和规则;恰恰相反,AI行业是赋能传统行业,然后帮助传统行业提升。
因此结合上文提到的算法结构来说:AI得有输入和输出的数据,你才能够训练你的网格。而这个输入、输出则是由传统行业里面的专家给你提供的。所以,如果你对传统行业的认知不深,那么你是无法参与到AI行业中。
比如:
- 自动驾驶:除了掌握互联网的技术和算法,其核心是要了解整个驾驶的机械原理,包括对交通法规的了解等。你不具备这样的一些行业基础的话,光靠AI算法是无法从事这个行业。
- 智慧医疗:那么你得了解医学的一些病理知识、药理知识等,毕竟医疗是一个几千年的行业;
- 智能客服:你要帮一个电商公司,或者帮一个金融企业做机器人客服,首先得对这个行业的一些话术,包括他们答题的一些规范要做一个深入的了解。
- 智慧法院:要帮助法官去庭审、去审犯人,那么你要对法律知识足够了解才行。
所以,AI产品经理肯定比互联网产品经理更加受拘束。
大家一定是要首先理解行业,然后再运用我们的聪明才智,把AI和领域融合起来。因此,这就提出来——了解行业的痛点和技术的可切入点,1+1的模式是最好的入门途径。
什么叫1+1?
一般做AI的时候,一定是要找一个行业专家来合作——当然,这种行业专家可以是一个团队,也可以是顾问的形式。比如做教育,一定得跟很多有经验的教研人员来进行合作;做医疗,一定时和从事某个细分领域的医疗专家来进行合作。只有这样,我们才能真正提升AI产品的使用程度,也才有数据。
能力3:设计创新的人机耦合运营模式
第三点能力,我们称之为“设计创新的人机耦合运营模式”,AI时代的这个运营模式也是需要创新。
互联网时代,因为确定性的存在,所有的问题都减少了中间环节,直达终端用户,这是互联网的本质——提升效率。
但在AI时代,你不能这么去做,因为这可能会有问题:
案例1:智能客服——完整工作量降低10%,总体效率提升30%
如下图左侧的这个理想中机器人客服,用户一上来后面没人了,就是一个机器人“哒哒哒……”。但现实中由于AI技术边界的存在,这个对于语义理解的准确性还无法达到很实用。
现实生活中,我们都跟很多机器人对过话,也知道这个机器人的水平基本上就是两三岁小朋友的水平。如果你认识不到这样的技术边界,而要去设计这么一个机器人,在当前这个环境,你肯定会失败。
所以,我们提出了这样的一种方式:指针对AI领域的不完美性,通过“人+机器”一起来做。
如上图右侧的这个模型,现在的智能客服系统是这样的:用户打进来以后,把用户的行为分解成两种:导航和提问题。
你打到银行,首先银行都会先问你:“如果你要问某某某业务,请按1号键;如果你要问某业务,请按2号键……”这个就是分类,这是人工智能解决得最好的一个问题。
现在有一个语音导航,当你进来以后根据你语音识别成文字,再判断你的分类属于哪一类问题,自动帮你导航——这个接线员就不用了,而且也不需要用户一步步地操作。
当用户进来后可直接用自然语言说话,然后一秒钟就可以自己导到机器人客服;如果发现机器人理解不了客户的话,需马上自动转人工客服,这样一来就称之为叫人机耦合的创新模式。
这样的模式,已经被我们大量地应用在金融行业和运营商行业。
我们可以看到:完整的工作量降低了10%,就是说有10%的工作是完全被机器人取代了;总体的效率比原来提升30%,即通话时长节省了30%。
通过这种人机耦合的运营模式,AI才能在这个行业当中真正起到实际的效用。
案例2:医疗影像智能检测——有效降低误诊率
接下来一个案例,我们分析一下理想中的医疗影像智能检测:
比如说我们照完了肺部、乳腺等以后影像,就要判断是否得了癌症:这个结节有没有结节?有,是哪一种结节?有没有癌症也要做一些判定。
如下图左侧是我们理想中的模型:医疗这个机器人诊断医疗图像传进来,机器人给结果——但是这样的路径是错误的。因为我们是基于概率体系的,而机器人也会犯错;如果你这么去做,那跟以前的做法是一样的。
人际耦合模式是怎么做?
实际上,我们现在在医院里面合作的是右边这种模式。医疗影像上传以后,由人类的医生先看,医生把所有的图片以及诊断结果上传到云端。我们在云端部署一个叫质检的机器人。
也就是:质检机器人也来看一次,如果两者得到的诊断结果是一致,那就是pass;反之,则会让人类的专家再来仲裁。
通过这样的方式,能有效到降低误诊率,并且也非常实用。
所以,AI产品经理在设计产品时,不光是要设计功能,一定要预先考虑到产品在应用的时候,它的运营模式是什么。而你如何试用运营模式,是和你对行业的认知,对技术边界的认知,以及你的技术在行业中是否足够实用等都是息息相关的。
以上为本次大会分享内容。
相关阅读
虽然很多人都被点名,但很少有人被选中|2018中国产品经理大会深圳站现场报道
AI产品,如何做好从零到一?|2018中国产品经理大会深圳站嘉宾总结
当00后已经18岁,产品运营er如何“永葆年轻”?|2018中国产品经理大会深圳站嘉宾总结
你拼命追求的日活,其实一个公式就搞定了|2018中国产品经理大会深圳站嘉宾总结
用AI工具解构智能零售|2018中国产品经理大会深圳站嘉宾总结
本文为2018中国产品经理大会深圳站嘉宾分享整理总结,未经许可,禁止转载。谢谢合作
有两个错别字,AI识别一下
哈哈,就你皮~
比我记得笔记详细多了,自愧不如啊,不过你这样写确实很累啊,文字很多啊