科大讯飞华南研究院执行院长刘舒：“AI+”时代，产品经理能力模型

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

科大讯飞华南研究院执行院长刘舒：“AI+”时代，产品经理能力模型

人人都是产品经理

2018-08-03

4 评论 6942 浏览 56 收藏

28 分钟

近日，由人人都是产品经理与腾讯大讲堂联合主办的2018中国产品经理大会深圳站完美落幕，科大讯飞华南研究院执行院长、讯飞易听说总经理刘舒做了“AI+时代，产品经理能力模型”的主题分享，并引发探讨：整个AI行业的产品经理从业者，应该具备哪些能力模型？enjoy~

分享嘉宾：科大讯飞华南研究院执行院长、讯飞易听说总经理刘舒

以下内容为嘉宾分享实录，由人人都是产品经理社区@Daisy 整理编辑，部分内容有修改，嘉宾已确认：

16年我曾提到，互联网时代的“流量暴利”已经消失了，所以当时提出了“互联网+行业”这个命题。回顾一下这两年多的发展，我们可以看到这样的命题实际上是成立的。

最近两年多，那种因暴利连接的产品其实已经是消失，取而代之的是垂直细分行业里生根的一些企业。其中，我们最重要的是要对行业知识进行一些理解，从而提升它的效率。而人工智能就是在“互联网+行业”的过程中引发出来的新一轮革命。到了2018年，人工智能实际上已融入到了我们生活中的方方面面。

所以，今天我也是希望结合这两年多的一些从业案例，以及对人工智能的一些思考，在此跟大家做一个主题分享《“AI+”时代，产品经理能力模型》，主要分为三个部分：

AI时代的来临
AI的前世今生
AI产品经理的三大能力模型

一、AI时代的来临

1. 从国家层面上来看

无论是美国，还是中国和欧盟，都陆续发布了有关人工智能的国家战略；对于互联网来说，这是一个很重要的事件：

2017年7月20号，国务院发布了新一代人工智能的发展规划，这是国务院首次以行政规划的方式发布产业发展规划。从这一点上可以看出：中国正在以举国之力抢战AI的制高点。

2. 从行业层面上看

大家可以看到：无论从国家还是从行业的层面上，AI都已经到来。

无论是麦肯锡，还是科学杂志、德勤，以及埃森哲的一些报告，大家都纷纷预言：人工智能在未来会更多地取代人类现有的一些工作，并且使得人类社会的生产效率变得更高。对此，大家也感到了一些担忧，比如就业率会进一步地下跌——或者说失业率会进一步地上涨。

3. 从生活层面上看

AI并不仅仅停留在国家层面和行业层面，也融入到了我们生活中的方方面面。

从上图我们可以看到，AI现在确实很火。

而对于想要从事AI的产品经理来说，该抓哪些重点呢？

首先要了解AI技术的发展演进历程，包括它的一些技术原理和技术边界；只有这样，我们才能更好地去设计产品。

所以，我们先看下AI的前世今生。

二、AI的前世今生

AI其实并不是这两年才出现的，它很早就诞生了，但是为什么到这两年它才开始火起来呢？

1. AI的诞生与AI的成长

在1965年Dartmouth会议上，当时四个图灵奖的得主聚集在一起提出了十大问题，标志着AI行业的诞生：

自此之后，AI一共经历了三次浪潮：

70年代和90年代，由于算法结构及当时的计算能力因素，在当时行业的应用上、效果上，都没有达到一个很有效的效果，所以前两次浪潮都是潮起潮落。

随着这个深度学习的出现，历史上的一些问题得以被解决，且取得了超前的好成绩。比如语音识别、图像识别等，都比传统算法有更好的实用效果。因此，我们遇到的AI才变得实用，从而带到生活中。

所以，我们认为这一次是人工智能真正到了爆发的时候。

那么，什么是深度学习？

接下来，我就会用一些简单直观的例子，对深度学习做一个详细分解：

首先，深度神经网络本质上是一个分类器，它是模仿人的感知过程。

如上图，这是一个简单的深度神经网络。从左往右看，整个深度神经网络是一个函数（F就是一个函数），左侧的“1”和“-1”，我们称为输入的特征或者输入的向量；右侧的“0.62”和“0.83”，我们称之为它输出的一个结果。

在这个案例当中，“0.62”和“0.83”实际上是属于不同分类的概率。相当于图像识别中的“这个是男人还是女人？”。

那么，证明他是男人的概率为0.62，她是女人的概率为0.83。

所以，深度神经网络就是：每一个输入经过深度神经网络的运算后，最后得到它在不同分类的概率；而它的本质就是输入一个特征向量，即“1”和“-1”。

换言之，通过深度网络的逐层运算，最终得到该向量属于不同类别的概率。

至于如何定义这个类别？

比如语音识别：属于哪个中文字？属于哪个发音？这些都是分类；
比如人脸识别：是男是女？他年纪多大？这些都是分类；
比如自动评测：它得多少分？他得100分还是得0分？这也属于分类。

所以实际上，深度神经网络的核心就是解决一个分类的问题。

那么下面我们怎么来使用这个深度神经网络？

它一般分为三步走：

操作步骤1：准备标注数据

第一步，我们称之为叫标注数据。

刚才这个神经网络当中，进行逐层计算的时候，中间都有很多参数，那么这个参数是怎么得到的？

举一个数字识别的例子：假设我要识别一个图像，它里面写了0~9这十个数字。如果这个图片的像素点上有值，我就认为它是“1”；如果没有颜色，白色就认为它是“0”。

这样一来，我就把一个图像变成了一个向量——比如它是16×16，那么就是X1到X256。

我会事先准备一些数据，再交给机器去学习，我会事先选出标准“2”。

拿出来后，我告诉这个机器，它的输出是什么呢？

比如说我准备的标准是“1”，它的输出属于“1”的概率是100%；那么它属于其他数字，比如说2345等，它的这个概率为0，它不可能是其他的数字——所以我会准备大量的数据。

操作步骤2：训练网格

准备完这个数据以后，我就拿进去，我们称之为“训练”，即“训练”这个网格。

我们准备了大量的手写体“1”的各种变形、“2”的各种变形、“0”的各种变形……这些是图像，每一张图像我们都把它转化成向量（特征），然后把特征输到这个网络里面（右侧为输入）；输出我也是跟机器讲好了，比如说第一排的这个数字，无论他怎么写，最后我认为它都是“1”，属于“1”的概率是100%，属于其他数字概率是0；第二行，所有的这种手写的方式，我认为它都是“2”——相当于把这样的输入和输出，明确地告诉机器，去训练这个网格。

在训练的过程中，需要的训练数据集是非常之大的。

比如在语音识别中，要大量的标注人员准备差不多10^11这么多的语料。而要解决某一个问题，比如说语音识别，要这么多的数据量；解决肺部结节的图像自动诊断，又需要这么多的数据量……每一个领域都需要这么大数据量，要提前输入到计算机里面，然后训练好这个网格——所以在做AI的时候，这个成本是巨大的。

操作步骤 3：使用网络

训练好以后就很简单了，这个网格就可以叫人工智能，就可以拿来用。

如上图，这个时候我再拿一个图片进来（事先不知道是几），我把它的特征抽出来后，用这个网格一算，最后得出：

属于“1”的概率是0.01（几乎不可能）；
属于“2”的概率算出来是0.99（可能性很大）；
属于“0”的概率是0.01（几乎不可能）。

这样逐层算下来后，最后我们认为这张图片就是“2”——实际上，这个网格就可以解决数字识别的问题。

以上就是关于深度神经网络的一个简单直观说明。

2. AI的现状

如上图，我们可以看到整个AI发展的三个阶段：

第一个阶段：计算智能。大数据和云计算技术的出现，使得计算智能机器已经远远超过人类，比如说Alpha Go；
第二个阶段：感知智能。由于深度学习的出现后，人工智能目前已经在大部分的领域能媲美，甚至超过了人类；比如在语音识别、图像识别等领域。
第二个阶段：认知智能。这是最重要的一个阶段，认知智能就是人区别于万物最核心的一个点，比如动物也是有感知的，也能分辨这个是不是能吃的，也能做一些简单的分类。

那么，这三者的区别在哪？

我们实际上认为：人类区别于动物最重要的是想象。

什么叫想象？就是人类能创造一些根本不存在的东西。

比如：

什么叫胜利？
什么叫失败？
什么叫沮丧？
什么叫神明？

这些概念实际上是人创造出来的——通过这种想象出来的概念去凝聚人类，共同去完成一个目标。

目前这个人工智能还没找到有效的一些模型；因为目前整个人工智能的发展，更多的是技术在人们已有的一些计算框架下，通过一些仿真学的一些方式，然后让它的效率变得更高。

因此，我们认为：目前人工智能的发展还处于前两个阶段，即计算智能和感知智能阶段——已经媲美，甚至是超越人类，但在认知领域是有待突破的。

最近这两三年，感知智能在深度神经网络出现以后，取得了飞跃式的发展。

那么在感知智能的应用上，目前已经在哪些领域里面已经非常实用了？

如下图：

我们简单地分析了算法的机理，下面我就会结合它的一些特征，然后继续分享：在这样的一个技术框架下，我们产品经理应该具备哪些能力，才能够区别于互联网的产品经理，从而在AI这个领域取得更好的一些成果？

三. AI产品经理的三大能力模型

基于AI的一些特有性，我们来分享一下关于AI产品经理的三大能力模型：

能力1：对AI技术边界的认知

第一个能力模型很重要， AI产品经理一定要对AI的技术边界要有很强的认知——因为你对所在行业技术边界的认知，直接决定了你设计产品的应用场景。如果你对AI技术的认知深度不够高，那么你设计出来的产品要么没人用，要么就累死开发——所以AI技术是一个很重要的特征，这是基于概率体系。

也就是说，所有的输入和输出不是一个确定性的结果。

比如我一个手写的“2”，对于一般的人理解，这个肯定是“2” ；但是对于计算机，对AI引擎来说，它输出的是概率，如：

输出属于“2”的概率是多少？
输出属于“1”的概率是多少？
输出属于“0”的概率是多少？

而且有些时候还会犯错——最后输出的结果，可能属于“1”的概率比属于“2”的概率还大。

这个颠覆了我们原来传统做软件、做互联网的思维。

举个例子：

在语音识别这个领域，我们的识别准确率在过去十多年是低于95%的。这时候，我能用这个概率去作会议记录吗？

这个是不行的——100个字里面错5个字，甚至可能有些关键字都错了，这个东西不实用。

但是在哪些地方能用呢？比如说K歌的评分，辅助的文字输入——这种偏娱乐性，对准确率要求不高的一些场景下面，我们就可以使用。

再举一个大家耳熟能详的例子：

在图像识别领域，前两年特别火的是什么？猜年龄，或者看你长得像哪个明星？——为什么当时这类型应用特别火？因为当时的图像识别准确率比较低，比如说是低于95%；在这种技术边界下，我们只能做一些娱乐型的设计。

最近两年的发展，在一些特定场景下，我们的准确率能提高到95%以上，甚至是99%。这项人工智能技术，由于它的边界前移了，往后也提升了，所以使得它的应用场景就变得更加宽阔了。比如现在的安防身份认证，包括用微信领公积金，都是用人脸识别作为密码，这个的原因在于：人脸识别的准确度，我们经过十多年的努力达到了技术边界。

这个是很典型的一种场景：

作为互联网软件的产品经理，你对开发说的一句话肯定走到他桌边，说：“哎，这个功能要多久实现？”

开发说：“可能要两个月吧。”

但如果你是AI产品经理，就不能这样去问了——因为这样问就显得太业余了；而且这样的问法，这个产品肯定做不好。

那么该怎么问？

你应该说：“三个月，语音识别率能达到95%吗？”

你绝对不能说三个月时间能不能搞定语音识别，这时没有人能回答你什么叫搞定——所以，你要把这个边界提出来。

而且参与这个的开发同事肯定会这样回答，

“三个月，识别率只能达到90%，而且需要标注100万条数据，需要100个标注师，如果你搞不定这些，那这个准确率也保证不了。”

所以在AI时代，作为产品经理设计产品的时候，关于技术边界的认知是最重要的。

能力2：具备行业相关知识和深刻洞察

作为AI产品经理，第二个能力模型一定是要具备行业的相关知识和深刻洞察——这一点也是区别于互联网其他领域的产品经理。

互联网创造了新的行业和规则。比如「微信」这种通信方式，之前是没有的，现在创造出来了这样的一种交互方式；再比如阿里巴巴这种电商，虽然这是从外国引入进来的，但对绝大部分中国人来说，以前是没有这样的一种交互方式，所以里面的规则、操作和一些认知结构全是由互联网人全新创造的——你会感觉到天地开阔，你设计的每个功能好像全国人民都能用。

但是，AI行业并不是去创造行业和规则；恰恰相反，AI行业是赋能传统行业，然后帮助传统行业提升。

因此结合上文提到的算法结构来说：AI得有输入和输出的数据，你才能够训练你的网格。而这个输入、输出则是由传统行业里面的专家给你提供的。所以，如果你对传统行业的认知不深，那么你是无法参与到AI行业中。

比如：

自动驾驶：除了掌握互联网的技术和算法，其核心是要了解整个驾驶的机械原理，包括对交通法规的了解等。你不具备这样的一些行业基础的话，光靠AI算法是无法从事这个行业。
智慧医疗：那么你得了解医学的一些病理知识、药理知识等，毕竟医疗是一个几千年的行业；
智能客服：你要帮一个电商公司，或者帮一个金融企业做机器人客服，首先得对这个行业的一些话术，包括他们答题的一些规范要做一个深入的了解。
智慧法院：要帮助法官去庭审、去审犯人，那么你要对法律知识足够了解才行。

所以，AI产品经理肯定比互联网产品经理更加受拘束。

大家一定是要首先理解行业，然后再运用我们的聪明才智，把AI和领域融合起来。因此，这就提出来——了解行业的痛点和技术的可切入点，1+1的模式是最好的入门途径。

什么叫1+1？

一般做AI的时候，一定是要找一个行业专家来合作——当然，这种行业专家可以是一个团队，也可以是顾问的形式。比如做教育，一定得跟很多有经验的教研人员来进行合作；做医疗，一定时和从事某个细分领域的医疗专家来进行合作。只有这样，我们才能真正提升AI产品的使用程度，也才有数据。