关于Google发布AutoML的几点看法

1 评论 8818 浏览 11 收藏 10 分钟

文章为作者对AutoML的几点思考,希望能够给你带来一些启发。

我曾抛出过一个问题:

有没有这样的模型,可以对应用环境做出实时反馈,动态重构整套模型?例如:前一秒还是深度神经网络,接受刺激后,就立马坍缩成一个SVM。

当时得到的一个回答是Alpha Zero,这不是我期待的答案,但在大方向上比较接近。

提出这种疑问,是因为人类对事物的认知也是实时重构的。人脑的神经网络有一种在同经验的对话交流中重新串联它们自己的能力。每当人看到一个模式,那些认识这个模式的神经网络连接会长得更强大,直到认识变成某种自动反应。如果模式改变了,那么我们用来感知它的能力也会慢慢改变,直到我们自己的大脑重新串联来认识这个新模式。

若将人脑的这种学习机制放到AI领域,就是迁移学习,一种对变化环境的适应能力。

今天,Google发布了Cloud AutoML,能够通过增强学习自动完成模型选择+超参数优化。它一定程度上再现了Alpha Zero的设计理念,也比Zero更直观。

人工神经网络已经实现了学习模型的自编码,还需要人来训练。而AutoML更进一步,实现了训练过程的自编码,通过类似Axure的拖拽方式就能完成对话操作。部分场景的训练效果可能比AI工程师还好,提高了开发效率,也降低了准入门槛。

下面是本人对AutoML的几点思考,还不太成熟,欢迎指正。

AI工程师是否将被取代?

目前只会刺激更多人投身到AI领域,估计很快就会有《零基础1小时创建机器学习模型》这类教学视频出现。至于取代工程师?未来不好说,目前AutoML还远没有那么强大,优秀的AI工程师依然是争抢的对象。

AutoML对AI产品经理意味着什么?

它像一款制作Demo的工具,可以帮PM理解端到端学习的应用边界。大部分PM(尤其转型中的)并不具备AI工程师的实操能力,这是个真实存在的痛点。以后若要验证新的场景思路,可以先做个Demo试试。解放出更多精力,分摊到分析场景、获取数据、设计方案、推进落地上。

顶尖企业是否会用AutoML?

有AI基因的顶尖企业会选择自研ML训练平台,比如BAT、华为、讯飞会将AutoML作为参考和过渡,不会依赖。这类云服务有很好的商业前景,估计国内很快就会有类似的平台上线,并借助自研的平台高效为产业赋能。

非顶尖企业是否会用AutoML?

这取决于Google的功能迭代和售后服务,能否满足企业日益增长的细分场景需求。若AutoML能支撑更多场景,用真实数据打消中小型企业对黑盒训练的顾虑,就可以帮助互联网企业省掉大量研发成本。传统企业也可通过招募工程师或外包团队,借助AutoML搞定简单场景。

AutoML后续的迭代方向有哪些?

a)无监督、半监督学习

目前只支持监督学习,解决了设计模型、调参两大痛点。其实相对于训练模型,有时候标注数据的问题更令人头疼。后续肯定可以支撑半监督学习,将部分标签数据做为参考,对剩余数据自动打标。

b)增强学习

连AutoML本身都是增强学习的产物,没道理不支持。想想也蛮有意思,用增强学习来自动拟合增强学习模型,这就像师父教了个徒弟,然后徒弟再去教自己的徒弟。

c)NLP、CV、ASR、翻译

第一版本只开放了图像识别,也是最成熟的一块,其他标准模型的支撑不会太远。

d)从模型延伸到应用

能否进一步降低门槛,将模型对通用场景生成API,甚至直接生成AI应用呢?

例如一家小型超市,想知道如何调整商品摆放、商品品类、进货量、促销活动等来实现更高收益,他们雇不起工程师。这样的超市还有很多,AutoML将来能否满足类似的需求?

e)应用即训练

目前大部分模型的训练过程与应用部署是分开的,当然也看具体场景和终端的容量。小米的防盗锁,每次指纹识别都会增加下一次的识别速度、准确度,越用越爽。

AutoML能否在云端实现应用场景下的实时训练呢?相信会有这样的需求,比如在线医疗成像诊断,实时获取N家医院的诊断数据,通过动态的训练使诊断正确率持续提升。

f)共享模型/应用

数据是战略资源,共享数据(尤其打标好的)的阻力很大,但共享训练好的模型并非没有可能。若AutoML支持共享行业解决方案,会受到很多企业的青睐,尤其是冷启动的创业项目。这样企业就不用再愁训练数据,只要支付云服务费就获得现成的模型或应用。

g)通用能力

估计企业最关心的就是通用能力了,如果不支撑复杂场景、长尾场景,就有一大批企业无法靠AutoML训练出想要的模型。

AutoML对国内巨头意味着什么?

Google大方地公布Tensorflow、AutoML的源码,不仅因为开放的基因和格局,更因为它手里掌握着核心竞争力与撒手锏,具备降维打击的能力。它正在汲取群众的智慧来完善自己,把更多敌人变为朋友。

我觉得未来AI公司的竞争,拼的是这3方面:

  • 以区块链、迁移学习、AI芯片为代表的技术突破
  • 下探到行业将场景落地的能力
  • 持续自我迭代的进化能力

这三方面在AutoML上均有体现。不难想象,国内巨头们可能已经将自研类似的产品纳入到战略规划了。它在自编码、场景迁移的方向上拥有巨大潜力,这种向内生长的可能性比云服务本身更有价值。

在探索未来的道路上,Google是走的最远的那一个。我们有理由相信,AutoML只是道开胃小菜,后面会有一大波满汉全席靠近,不知国内巨头如何抵挡。

AutoML的局限有哪些?

AutoML降低了准入门槛,但目前的深度学习体系本就是残缺的,例如:抽象的层次太浅、无视因果关系、黑盒、基于统计。DNN还不够优雅,缺乏生机,这是我作为一名产品经理感受。

无论NLP还是迁移学习,瓶颈都在于机器意识、知识图谱的突破,我的思路是:

  • 从认知学、脑科学、神经学寻找灵感
  • 结合最先进的机器学习和区块链技术,做模型间的深度耦合,在算法层面持续推演
  • 量子计算芯片的突破,新的底层架构一定会催生出颠覆性的应用思路
  • 对知识图谱的思维转变,需要有更复杂的描述框架。相信未来的知识图谱不会是简单的存储结构,而是包含计算力和算法的动态体系,就像人和地球一样。

 

作者:于长弘,公众号:AI小宇宙(ID:AI_endless)

本文由 @于长弘 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自 Unsplash ,基于 CC0 协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
海报
评论
评论请登录
  1. 目前还没评论,等你发挥!