定义一个AI产品的六个步骤
本文作者将与我们分享的是:如何去定义一个AI产品的基本流程。enjoy~
对每个公司而言,阶段的不同,商业模式的不同,以及部门性质的不同,都会使得工作流程发生变化。
比如说:
- A公司是做AI赋能的商业模式,它的模式就是在AI某个领域(比如图像识别),根据客户的需求或者客户业务流程当中可优化的部分,去定制解决方案(譬如说帮青旅和民宿定制短租客刷脸开锁的解决方案,这个服务面向的可能都不是民宿或者青旅,面向的是向这些民宿青旅提供电子锁服务的公司)
- B公司想要使用图像生成技术为核心,打造一款全新的UGC社交产品面向C端。或者更加模糊的一些,想用AI打造UGC产品。
- 再比如做智能玩具的C公司,做自动驾驶专用芯片的D公司等…
这些例子是我随便乱说的,想表达的是,在不同的场景、业务逻辑和商业模式下,工作流程、每天的工作内容和重点,都可能会有很大不同。
所以我想,今天的议题有很多种视角可以去谈,我因为自己在创业,所以主要从一个创业公司,或者说是早期创业者的角度,来分享下我的理解。另外,我今天要偷个懒,我只分享如何去定义一个AI产品的基本流程。因为作为初创公司,更关心的是如何找准大方向并找到切入点,所以我在定义产品方面的思考会更多一些;至于产品定义以后,具体的系统化研发及项目管理,可能其他几位大公司的同志来讲会更系统化。
一、基于技术落地周期,现阶段“拿着锤子找钉子”,反而是对的
在进入正题前,想聊一下这个阶段的AI产品经理意味着什么。
有个问题想与大家探讨,有过定义AI产品经验的同学可能也曾面临类似的纠结,就是我们为何给自己预设“AI”这个技术工具作为产品的边界。既然用户要的是“墙上的洞”而不是“电钻”,那不是用什么工具无所谓吗,只要解决一个问题,或满足一个需求即可。
那为什么一定叫自己是AI产品经理呢?或者换句话说,为什么一定要限制用“AI”去满足这个需求?
其实我理解的答案很简单,就是,新技术的突破,让人们看到两个希望,一是原有一些应用场景可以被颠覆式优化,二是会创造出全新的应用场景,产生全新的市场。
那么就会有这一技术的信仰者站出来,去发现可以革命的老场景,定义新场景,“为了应用AI而应用AI”,我反而觉得是对的,尽管这样会产出大量的伪需求,但最终时间会去伪存真,留下对的场景。而这个技术如果是颠覆性的,留下的场景应用就会是颠覆性的。不然容易造出“更快的马”,而很难发明“汽车”。
KK的《技术想要什么》里的核心思想是,技术作为一个特殊的有机体,也有自己的演化规律,一定程度不受创造他的主人控制。所以在技术突破、满足需求、产生新需求、技术再突破的螺旋上升中,已经很难分清是人的需求drive技术进步,还是反之。
所以可能我比较偏激,我不太认同“一切以需求为导向”的产品观(我也许是错的,需时间检验)。我反而认为这是一种局限于某个阶段的产品观,这个阶段我称之为“工具完备阶段”,比如我们认为web工具完备了,基本在web领域里,所有能想到的创意很大概率可以被实现。
所以,有人是电商产品经理、微博产品经理、github的产品经理,但没人会再说自己是web产品经理。如果做一个web产品,也不会首先想web能做啥,而是想,用户需要什么。(当然这个“工具完备”是有领域限制的,但我这时候问个问题,“用户需要永葆青春,你能实现一个治疗死亡的web app吗?”。这其实是我所说的跳出了web的领域。)
你看最早期的互联网公司,名字都叫做“网”什么,什么“net”的,从名字也可以看出来,它一定是在想“能用互联网做什么是用户需要的”,而不是想“用户需要什么可以用互联网实现”。这俩是有区别的,假如你以用户需求为主导,那如果用户需要某个东西用传统技术实现更加便捷,你做不做?你要想好如何回答这个问题。
现在已经不太会有人强调自己是做一个互联网公司或产品了,而是更加强调应用场景,比如“社交”“婚恋”;以及细分领域,比如“00后社交”“50后婚恋”。但你观察,比如现在的VR大量公司名或产品名仍然带着“VR”,AI公司一半带“智能”“.AI”等。
这其实是技术落地的一个必然周期,第一波是谁能造出锤子,第二波是谁能用好有限的几把锤子,第三波才是当锤子足够多的时候(工具完备),弄清楚用户需要什么,再去想用那把锤子能搞定这个需求。
AI我认为目前处于第一波到第二波的过渡阶段。并且第一波的技术突破,也并非齐头并进的。AI下围棋能战胜世界冠军,这是强化学习与算力综合突破的结果,能识别人脸,这是CNN结构与算力的突破,但无法因为“AI可以下围棋”就断定“AI可以参加辩论赛”,尽管这两者听起来等量齐观,但第一把锤子找到,第二把看似差不多的锤子,可能还得找十年。
其实我知道这些听起来跟咱们今天的主题关系不大,但在踩了很多坑以后,我感觉这个事情尤为重要,我自己觉得它是在技术突破伊始定义产品时,需要在心理默念的一个大前提,“我就是要拿着锤子找钉子”。
有了“AI既正义”or“AI大法好”这个基本假设。我们可以开始展开去推演,怎么定义产品。
我总结了一个螺旋图形,发给大家——
二、定义一个AI产品的六个步骤
聪明的小朋友们会发现,这特么不就是一个直线吗,从1到6步,画成螺旋是为啥?有两个很重要的原因:
- PPT一页放不下直线;
- 这样看起来更屌。
还有个原因,就是其实我在实践这个方法的路上,感性上觉得是一种“围猎真相”的过程。
1、世界将如何演化
(这里,很多是转述某个朋友的观点,感谢他跟我分享这样的认知)
其实我们活在一个注意力经济时代,注意力被不断解放又不断被新事物收割,技术代替人类去完成更多简单重复的劳动,人的注意力被解放出来。
据说2020年就会实现长途货运汽车的自动驾驶,因为高速是个封闭场景。那么,中国有3000万卡车司机,这些人的注意力何处安放?一个比较明显的趋势是,他们会向虚拟世界中迁移。另一个例子大家感受下,我印象中,小时候家门口小卖店的老板,你问他话他不理你,一半以上时间是在“点钱”,铺在报纸上一堆零钱的场景我历历在目。现在报亭小卖店老板他如果不搭理你,多半在“吃鸡”。中国有500万家小卖铺,这些店员或者老板被解放出的注意力又被虚拟泛娱乐收割。
向虚拟世界迁移是个如“熵增”般不可逆的趋势。
2、AI在其中扮演什么角色
AI革命可以看作是生产力的革命,从生产力的角度讲,第一是将人类从现实世界的非创造性劳动当中解放出来,从而更快速的向虚拟世界迁移;第二是赋予创造性劳动更低的门槛,以建设更丰富的虚拟世界。
这两点我总结为叫做对人类的“去工具化”,就是说,人之所以为人,是有人固有的价值,比如“想象力创造力”,“理解另一个人类需求的共情能力”。这些很难被机器替代。而人类完成自我实现,却需要掌握大量复杂工具,逐渐将自己培养成工具。比如,你有很好的想象力,却不会有画笔,也难以完成一幅画作。掌握画笔本身就是“工具化”。
但是我认为AI可以帮助人类实现“去工具化”,真正“身随意动”的发挥人之所以为人的价值,具体就是依靠上述两点。
3、哪些方向存在机会
首先看,“解放非创造性劳动”,首先可以想到的是,简单重复的脑力劳动,其实我认为只要是封闭域的问题,即使是复杂的非创造性劳动,也应该并可以被AI代替。不过后者有争议,先不讨论。
接着看,“降低创造性劳动的工具门槛”,可以联想到AI带来的全新UGC玩法,或者AI辅助创作的工具。
好现在我们获得了三个方向,第一个是“AI代替简单重复的脑力劳动”,第二个是“AI带来的全新UGC玩法”,第三个是“AI辅助创作的工具”。
4、方向中有哪些场景
第一个方向最典型是自动驾驶,当然还有很多很多,基本是目前最被人们普遍看到的方向,具体的选择还需要考虑结合哪个行业,自己是否擅长等,在这里就不展开了,因为基本很多地方都有讨论。
我们就选第二个方向,“AI带来全新UGC玩法”。内容生产主要有四个大类,图片、视频、音乐、文字。结合对AI生成技术的了解,我们可以想到很多场景,比如说最近看到“千面”的让你用明星的脸做鬼脸,比如俄罗斯那个用风格迁移做的app,让你的照片加入梵高风格。还有,其实抖音、快手、faceU也算是AI带来的新UGC玩法(这里主要指基于面部识别的特效,而不是推荐引擎),但是为什么我们感觉这几个不是显性的AI-UGC产品呢,这里正好就引入第五个问题。
5、这些场景应用AI的价值厚度
UGC的基本逻辑是,降低“优质内容”生产门槛,并连接内容生产者与消费者,让生产者得到正向奖励,让消费者变成生产者。
那么在这个逻辑链条里面,我们可以看到,让你用明星的脸做鬼脸,这个是AI技术才能创造出来的全新玩法,那么在内容生产上,AI扮演的价值厚度就很厚。没它做不了啊。
但是,短视频社区当中的面部识别特效,仅仅是给“优质内容”的生产加了个buff,所以在价值链条上面占领的厚度并不高。
那么如果说,我们做一个AI代替人们写诗的UGC app,这是否具有足够的价值厚度呢?按理说没有AI,没几个人能写出诗,但现在AI可以写出不错的诗,这不是很有价值厚度吗?但其实未必,因为这个价值厚度在于帮助用户“创作”更有趣的内容,但如果“创作”这个动作的参与感本身被剥夺,其实是剥夺了价值。
这么看,编曲场景是不是有足够的价值厚度呢?大部分人不会编曲,但很多人都有写歌冲动,AI可以把这些冲动变成作品,同时这作品又足够属于用户,足够有创作感,哈哈!
好,暂定这个场景。那么还有最后一个问题要回答。
6、是选择“场景为脉络串联能力”还是“能力为脉络串联场景”
这个其实我们看到,市面上有很多AI赋能商业模式的公司,这是典型的能力为脉络串联场景。
比如,我做图像识别有优势,我通过图像识别作为核心能力,做API调用的云平台,赋能给大量需要图像识别的场景及应用,我自己不与自己组合成一个完整产品。
举个最明显的例子,就是BAT都会提供的OCR识别。
用能力串联场景,这一能力在每个场景里的价值厚度可以很薄。比方说,一个医院的病例录入系统加入OCR,对这个医院病例录入系统本身的加分可能是5%。但这一能力具备足够的通用性,至少是在某个闭合领域里的通用性。比如你能在医疗领域做最好的OCR,你可以做这样一个商业模式。
回到我们刚才的例子,AI编曲UGC。假设我用能力串联场景,我所做的,应该是利用AI编曲的核心算法,供应给直播平台那些想发歌的主播,给视频博主提供更版权友好的商业化音乐,给词曲作者去赋能让他们更快速的写demo。
但如果我选择,用场景串联能力,可能我需要打造的是一个端到端的产品,需要培养UGC产品都要培养的自有生态。以AI生成编曲为核心,去降低用户创作音乐的门槛,以此培植一个完整的UGC产品。
如果我们选择用场景串联能力,我们基本就完成了产品的定义,那就是“通过AI编曲技术,让普通人的写歌冲动都能变成好听的作品,并明确感知创作乐趣,的原创音乐UGC社区”。
当然最后这个结论,可能拍脑袋凭直觉也有人会想到,但这不是重点,我是希望通过这个例子,分享给大家,我现阶段总结下来,系统性找到这个定义的一个方法论。
作者:郭靖,前迅雷、乐逗市场/产品,现创业者,曾获大数据BOT大赛冠军。公司曾开发选车聊天机器人,汽车维修门店智能助理,对话信息车险反欺诈。曾入选硅谷Draper University创业营,4个月英语从0学到能辩论并自学TensorFlow至可写主流CNN。“AI产品经理大本营”成员之一
本文由人人都是产品经理专栏作家 @黄钊 授权发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自StockSnap.io,基于 CC0 协议
这个说的就一般般了
很有启发,感谢分享。
挺有趣的PM😁
“聪明的小朋友们会发现,这特么不就是一个直线吗,从1到6步,画成螺旋是为啥?有两个很重要的原因:
PPT一页放不下直线;
这样看起来更屌。”
调皮,淘气
感谢作者分享的方法论,4个月从0学英语到能辩论的方法论可以分享一下吗
这你也信。。。