亲爱的，你已经连阅读理解都做不过AI了

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

亲爱的，你已经连阅读理解都做不过AI了

脑极体

2018-01-16

4 评论 2522 浏览 0 收藏

9 分钟

机器理解力，让我们在未来面前不止是个孩子。

提起“阅读理解”这四个字，你会想到什么？

被四六级雅思托福支配的恐惧？语文试卷上连原作者都搞不懂的选择题？

不管哪种答案，肯定都逃不出一个规律：进行阅读理解这项有益身心运动的主体，必然是跟你我一样的人类。

毕竟嘛，这东西需要阅读一大段文字，然后理解了意义之后再做题目，堪称一场考试中最复杂最费脑筋，也最考验综合能力的一个环节。所以你的英语老师一定说过这样一句话：得阅读理解者得天下。

然而，可是，但是，如果告诉你今天得这个天下的已经不再是人类，而是AI了，你会怎么想？也许此前我们想象过单词听写、句子翻译甚至写作都可以被AI完成，但是阅读理解这件事人类已经被甩在了AI身后，大概很多人都没想到。

可事实就是这样：

1月11日，斯坦福大学著名的机器阅读理解赛事SQuAD刷新了全球排名，阿里巴巴凭借82.440的精准率打破了世界纪录,超越了人类82.304的平均得分。

当然了，AI是不会去跟你比托福刷分的，这件事的背后，脑洞有点大哦…

什么是机器阅读理解？

机器阅读理解，虽然看起来只是让AI上阵来一场考试。但是却是自然语言处理技术中，继语音判断、语义理解之后最大的挑战：让智能体理解全文语境。

而斯坦福大学发起的SQuAD挑战赛，则是业内公认的机器阅读理解最高水平赛事。

SQuAD挑战赛的基本规则，是通过众包的方式构建一个包含10万个问题左右的大规模数据集，并给出来源于维基百科长度大约在几百个单词左右的文章。参赛者提交的AI模型在阅读完数据集中的一篇短文之后，回答若干个基于文章内容的问题，答案与标准答案进行比对，最终得出成绩。

由于阅读理解这项“智能”调整，需要运用到大量逻辑、细节和结构分析能力，并且直接作用于现实中的文本资料，所以实际价值很大。

比如说，我们首先要面对的问题就是，假如人工智能已经比人类平均水平更擅长在对文本中精准信息进行理解和回答，会带给我们什么呢？

当AI的“阅读理解”得分超越人类，意味着什么

举个例子或许可以很简单的理解这个问题：英语考试上，当机器可以翻译单词的时候，我们一点都不惊奇；但机器可以听写整句话的时候，我们会感叹技术进步了；当机器自己做阅读理解的时候，我们大概会想：还要我考这个试干什么?

这里面的差别，在于处理阅读理解相关问题时，AI不只是要运算和记录，而是要主动去分析和理解，所以阅读理解问题一直被人问是NLP的标志性临界点。但这个点被AI破解，直接意味着很多必须人类才能完成的工作已经正式能够被AI接管。

因为阅读理解问题，不只是要处理语音和简单的语义，而是要理解和关注词汇、语句、篇章结构、思维逻辑、辅助语句和关键句等等元素构成的复杂组织网络。

机器阅读理解“达标”，最直接的产业影响，是大多数今天还必须由人工完成的规则、对话、服务信息类的相关理解工作，都可以被人工智能所取代。比如说客服、信息管理和推荐类的工作，都可以考虑用不妙不休、高运算速度的机器来取代。

机器阅读理解如何工作

或许我们都注意到了这样一个问题：今天的互联网世界，在变得越来越多文本内容，各种各样的信息爆炸而来。太多你知道的、你不知道的、你以为自己知道的却实际不知道的事情呼啸而过。甚至你双11想要剁个手，都有各种各样的游戏规则等着你。自己读吧，太累太痛苦还没时间，问客服吧，很可能出错还很慢，简直是薛定谔式问题。

这里或许就可以用机器阅读理解来解决了。比如客户对某个电商促销规则有疑问，就可以直接向AI提问，而AI就可以把这个问题当做一道阅读理解问题来进行解决方案回馈。

机器阅读理解能力，将在如何向客户提供非模板式的智能客服服务中发挥作用。而当AI在这些能力上超越人工，那么机器客服的利用价值将可能快速提升。换句话说：机器客服终于可以不那么机器了…..

由此不难看出，这种关键能力的标杆性突破，对大量强调与普通消费者交互的产业线益处最多。

推而广之，机器阅读能力也是文娱领域进行内容寻找和推荐的有效方式，比如阅读用户提出的复杂需求，进行精准推荐；与IoT产品相结合，给出对用户大段语言的回馈，乃至对话互动，都必须以机器理解能力为依托。

理解力，让我们在未来面前不仅是个孩子

除了知道AI可以充当更好的客服之外，究竟我们为什么应该关注机器阅读理解这件事？或许关键，是我们应该知道“理解力”在目前AI世界中的重要程度和期待指数。

AI作为一种从计算机科学下的分支，一个智能体先天具备的是运算能力，而希望进行仿人类智慧的智能模拟，第二步就是模仿人类的感知。今天我们看到的机器视觉、语音识别、语义理解，都是在做这件事。而第三步，就是让AI产生理解力。

显然，识别有着庞大的应用场景，并会在接下来很长一段时间内占据主流。但是AI的理解能力是大多数识别能力的进化，假如单纯的识别出却无法产生输出，那么AI无非是更灵活的传感器而已。

从这个逻辑上看，阅读理解这道题绝不仅仅是个测试，或者商业应用的技术加持，更重要的是开启AI纪元里理解力的加速器。

更广阔的意义在于，我们或许距离永远不用测试机器阅读理解更近了一步。当我们不再考虑机器是否能理解人类文本和语言，那么DeepNLP将可能达成，人机交互的范围将级扩大。机器智能可以开始捕捉人类的逻辑和函指。

可能那还很远，也可能很近，但机器理解力让我们在未来面前不止是个孩子，应该是毫无疑问的。

作者：脑极体，微信公众号：脑极体

本文由 @脑极体原创发布于人人都是产品经理。未经许可，禁止转载。

题图来自unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

脑极体

从技术协同到产业革新，从智能密钥到已知尽头

315篇作品 1222038总阅读量

中央-门店模式私域企微产品设计：以线上渠道导流加微为例

03-242959 浏览

生鲜巨变：每日优鲜、叮咚买菜、盒马“分道扬镳”？

01-303918 浏览

智能客服是人工智能领域的“急先锋”

08-087061 浏览

国货“团建式商战”复盘：赢了吗？然后呢？

10-044048 浏览

跨境电商三国杀：许仰天与陈磊的局，蒋凡也来了？

06-203059 浏览

超级威震天

让AI来阅读中文啊，这么简单的意思给老板意思意思，不要不好意思，不是那个意思就是小意思。

最近来自上海回复
小北

这远远不代表计算机超越了人类的阅读理解水平，因为这样的跑分结果是有一个前提条件约束的，比如在确定的题库和测试时间，并且只是成年人平均理解水平。

最近来自福建回复
小白

看完楼主这篇文章，说实话我想到了终结者，想到了ai取代人类，人类获取知识容量，面，时间，效率有限，不像是机器存储数据，现在都能通过语境去逻辑分析了。。。说到底大数据太伟大了！

最近来自广东回复