AI领域非算法产品可以做哪些工作？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

AI领域非算法产品可以做哪些工作？

JasmineWei

2017-09-19

7 评论 8352 浏览 68 收藏

9 分钟

文章为作者在AI领域做产品后的一些经验总结，希望对你有所帮助。

HI，我是Jasmine，是一位AI产品经理。在讲正式内容之前，我想跟大家简单分享一下我的经历：我大学本科不是IT相关，甚至在我工作之前，我没有做过任何与互联网相关的实习工作。

而现在我能负责公司的重点项目，证明了进入AI行业并不是你们想象中的那么困难。直至今天，我仍在这条道路上不断学习，也希望有更多的朋友给予我指点。

现在我就来说说，如何在对AI行业一无所知的情况下，快速了解到它的流程运作，并找准机会转行。

简单了解AI应用范围

首先要跟大家说明的是，AI是一个领域，AI的应用范围非常非常广，如下图

图 by@智能玩咖

图上每一个领域用到的算法都不一样，并且一个领域下面有很多的细分小领域。

比如语音识别，就包含了语音转文字、自然语言处理、文字转语音等等技术。而有很多想转型的产品，第一个考虑的点就是：不懂技术就做不了AI，我是不是学完算法才能入行？

其实不是。

如果不是想立刻转型到算法相关的AI产品，其实在平台——工程——算法之间有一个可以渐渐过渡的过程。

大家可能都知道：

对算法来说最重要的是数据，足够量足够好的数据才能得到更优秀的算法模型。

而关于数据其实可分为两种类型：被标记过的数据和未被标记过的数据。什么是标记呢？意同“贴标签”，当你看到一个西瓜，你知道它是属于水果。那么你就可以为它贴上一个水果的标签。算法同事用“有标签的数据”去训练模型，这里就有了“监督学习”。

重点就是这里：

只要是跟“监督学习”沾边的产品/技术，比如图像识别、人脸识别、自然语言理解等等，他们都有一个必走的流程

不断地用标注后的数据去训练模型，不断调整模型参数，得到指标数值更高的模型。

流程分解

数据标注

数据的质量直接回影响到模型的质量，因此数据标注在整个流程中绝对是非要重要的一点。一般来说数据标注部分可以有三个角色：

标注员：标注员负责标记数据。
审核员：审核员负责审核被标记数据的质量。
管理员：管理人员、发放任务、统计工资。

只有在数据被审核员审核通过后，这批数据才能够被算法同事利用。

关于数据标记的流程思考：

任务分配：假设标注员每次标记的数据为一次任务，则每次任务可由管理员分批发放记录，也可将整个流程做成“抢单式”的，由后台直接分发。
标记程序设计：需要考虑到如何提升效率，比如快捷键的设置、边标记及边存等等功能都有利于提高标记效率。
进度跟踪：程序对标注员、审核员的工作分别进行跟踪，可利用“规定截止日期”的方式淘汰怠惰的人。
质量跟踪：通过计算标注人员的标注正确率和被审核通过率，对人员标注质量进行跟踪，可利用“末位淘汰”制提高标注人员质量。

模型训练

这部分基本交由算法同事跟进，但产品可依据需求，向算法同事提出需要注意的方面；

举个栗子：

一个识别车辆的产品现在对大众车某系列的识别效果非常不理想，经过跟踪发现是因为该车系和另外一个品牌的车型十分相似。而本次数据标注主要针对大众车系的数据做了补充，也修改了大批以往的错误标注。（这两种为优化数据的基本方式）本次模型需要重点关注大众某车系的识别效果，至少将精确率提高5%。

产品将具体的需求给到算法工程师，能避免无目的性、无针对性、无紧急程度的工作。

模型测试

测试同事（一般来说算法同事也会直接负责模型测试）将未被训练过的数据在新的模型下做测试。

如果没有后台设计，测试结果只能由人工抽样计算，抽样计算繁琐且效率较低。因此可以考虑由后台计算。

一般来说模型测试至少需要关注两个指标：

精确率：识别为正确的样本数/识别出来的样本数
召回率：识别为正确的样本数/所有样本中正确的数

模型的效果需要在这两个指标之间达到一个平衡。

测试同事需要关注一领域内每个类别的指标，比如针对识别人脸的表情，里面有喜怒哀乐等等分类，每一个分类对应的指标都是不一样的。测试同事需要将测试的结果完善地反馈给算法同事，算法同事才能找准模型效果欠缺的原因。同时测试同事将本次模型的指标结果反馈给产品，由产品评估是否满足上线需求。

产品评估

评估模型是否满足上线需求是产品必须关注的，一旦上线会影响到客户的使用感。

因此在模型上线之前，产品需反复验证模型效果。为了用数据对比本模型和上一个模型的优劣，需要每次都记录好指标数据。

假设本次模型主要是为了优化领域内其中一类的指标，在关注目的的同时，产品还需同时注意其他类别的效果，以免漏洞产生。

产品工作补充

产品的工作不止是产品评估：

除了流程控制，质量评估。针对分类问题，由产品制定的边界非常重要，直接影响模型是否满足市场需求。

产品制定的分类规则：例如，目的是希望模型能够识别红色，那产品需要详细描述“红色”包含的颜色，暗红色算红色吗？紫红色算红色吗？紫红色算是红色还是紫色？这些非常细节的规则都需要产品设定。

若果分类细，那么针对一类的数据就会少。如果分类大，那么一些有歧义的数据就会被放进该分类，也会影响模型效果。

分类问题和策略问题道理是一样的，都需要产品对需求了解得非常深刻。

以上内容，都只是AI行业一个小领域内可梳理的工作内容。

针对刚刚入行的朋友，如果没有算法基础、没有工程基础。可以考虑在流程、平台上做过渡。在工作内容中不断总结学习，往自己想走的方向不断前进！

本文由 @jasmine 原创发布于人人都是产品经理。未经许可，禁止转载。

题图来自Pixabay，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

JasmineWei

8年AI产品经理/安泰MBA/商业创业/公众号：谈谈产品

6篇作品 73059总阅读量

05-2910666 浏览

02-272551 浏览

04-141413 浏览

05-265216 浏览

京东、抖音打开“个体小店”，集体向淘宝“开炮”

03-152651 浏览

左晨

人工智能是应用层才是PM的主战场吧

最近回复
电商产品经理老王霸

请问，数据标注在哪里进行的呢？如何标注呢

最近来自北京回复
1. JasmineWei 作者回复电商产品经理老王霸
  
  两种方式：1.专门开发一个平台进行标注 2.建立文件夹，修改文件名称标注。前者的效率、便捷程度远超后者，但前者需要投入一些开发成本。
  
  最近来自广东回复
暗号

本质上很多后端产品经理做事的方式，流程与某类AI产品经理有很大重合

最近回复
1. JasmineWei 作者回复暗号
  
  是的~以前黄钊有分享过，平台类产品有90%重合。个人觉得后台产品在这一块有很大的优势。不过这部分也不是AI核心，还是要慢慢地往算法/策略上面发展。
  
  最近来自广东回复
2. 暗号回复JasmineWei
  
  哈哈，神奇的黄大师，除了算法/策略，还有偏人文的思考也是很重要的
  
  最近来自广东回复
3. JasmineWei 作者回复暗号
  
  最近来自广东回复