知识图谱如何让“人工智能”更智能?
本文将带读者一起探讨两个话题——人工智能不智能的点在哪里,基于知识图谱的认知智能怎么就变得智能了。
一、为什么人人都谈论的人工智能是不智能的?
1. 自动驾驶这个行业所存在的问题
我们一起先来聊聊自动驾驶这个话题,先说下结论,无论是自动驾驶、机器人还是人工智能的任何领域都高度依赖于历史的数据,并且只能完成单项或者部分多项的协同任务,全部处于弱人工智能的阶段。
(1)产业及技术
从自动驾驶的产业链的体系中我们可以看到,这个行业大概会有3部分组成,感知端-客户端-云端。
- 感知端:时刻通过高精度的传感器及视觉设备感知定位所处的环境,根据环境做出决策,提取相关的数据,自动驾驶高度依赖各式的传感器,而多传感器融合的问题一直未解决;
- 客户端:主要包含操作系统及硬件平台,通过算法及底层芯片实时处理前端的数据,满足自动驾驶实时可靠性的需求,芯片处理及时延的问题也暂未解决,这个问题有望在5G的时代解决;
- 云端:主要用来存储模拟高精度地图绘制,为决策提供依据;
(2)自动驾驶等级
而在行业里面大家把自动驾驶分为5个级别L0-L5,而目前为止即使像谷歌和百度这样的头部公司,重金砸到了自动驾驶这个领域,目前也只能处在L3的级别,而其他研究自动驾驶的公司处在L2阶段。
而且有部分人认为自动驾驶要达到L5这个级别是不可能的,因为人工智能永远处理不了意外,而意外是历史数据包含不了的。
(3)用户使用(不安全)
2016年,特斯拉因自动驾驶未识别白色汽车导致驾驶事故;2016年的uber自动驾驶全球首例自动驾驶死亡事件;这样的事件还有很多,对用户来讲自动驾驶,至少现在它是不安全的。
所以单从目前的人工智能来说,数据-技术-应用都或多或少出现了很多问题,而过度依赖历史的数据这个人工智能最大的问题。
2. 现阶段的人工智能是什么水平?
AI项目投入:企业在AI项目上的投入是反应AI价值的一个维度,相比于制造和互联网行业,金融行业在AI上的投入最大。
成熟度:从技术及业务成熟度的角度分析,单拿金融行业来说,反欺诈、生物识别验证、智能客服这3项是在金融行业已成熟落地的场景,相比如其他行业应用最为成熟,其中金融行业最大的一点得益于金融行业在线化的数据,这也是AI可以快速落地的前提条件。
市场角度:从市场的角度来看,人工智能行业按照平台及市场的划分,已经形成头部及垂直行业的企业,不同角度的竞争及协作角度将快速促进这个行业的大力发展。
二、基于认知计算的知识图谱会变得智能吗?
1. 结论是正面的
直接给出结论:是的,而且是质的改变,知识图谱开始不再过分依赖于已有的历史数据了,比如精准营销,以前的精准营销服务,是基于已知数据做的,而实际情况往往获取不到那么多的数据来进行分析,而图谱开始利用知识推理来猜测用户的喜好。还有一点,图谱开始破坏人和机器反事实的状态了(这一点在后续的文章中再阐述)。
(1)数据、信息、知识、智慧
为了更好的了解知识图谱这项技术,我们先得知道数据、信息、知识、智慧这4个词的含义,它们之接的关系像一个金字塔一样,数据是形成信息、知识和智能的原材料,数据的量非常大,信息的量要小一些;
举个例子,我们人和人直接的相处,从陌生人开始接触对方这个人的言谈和举止都可以当做数据,但是当过一段时间后,你会对这个人有个鲜明的标签,比如这个人很努力,很靠谱,努力和靠谱就是信息了,所以数据是非指向性、非结构性的,信息是有指向性和结构性的;
而知识是在信息基础之上,那些被人们广泛接受并且成为共识的东西,而智慧其实是使用知识的这个人利用知识解决了某项问题就说这个人很有智慧。
从某种意义上来说,知识图谱是人工智能变的更加智能的必经阶段。
(2)从AI技术的方向去看知识图谱
从目前2019的技术成熟度来看,这项技术很快就会成为行业热点,而且对图谱技术的投资也会加大。
2. 举例
我们以一个智能问答的例子作为切入,基于知识图谱的智能问答应该是什么样子的。
(1)智能问答新趋势
目前智能问答这个领域大概经历了3个阶段,从传统的数据库检索到信息检索也就是智能客服类的机器人,再到以知识图谱建设为主知识型的问答机器人。
(2)从用户角度出发
而所有的无论是现在行业里听到的实体机器人、在线客服、智能语音导航、外呼这些新名词最终都可以归结为问答这个领域,而最主要对问答对象起到的不外乎客户维系以及客户提升这两方面的作用。
(3)技术组成
一个完整的问答系统,离不开的底层技术,包括NLP、ASR、TTS,而知识图谱在知识库构建及问答中才刚刚发挥作用。
智能外呼 智能X导航 智能质检
(4)智能服务机器人
实体机器人智能问答系统通过智能硬件作为载体实现真实的银行业务场景。
智能机器人与线上政务结合
(5)知识图谱与智能知识库
在知识库构建层面,目前主要还是以FAQ为主,未来基于知识图谱技术的知识库构建将发挥重要的作用。
(6)基于深度学习的图谱问答构成
主要会有两个方面,一种是利用深度学习对传统的方法进行改进,另一种就是基于深度学习端到端的问答构建。
框架算法设计:
利用LSTM进行实体模块儿识别,对传统的实体识别及关系映射进行改进:
基于深度学习的卷积神经网络
端到端的深度学习问答模型,将问题和知识库中的信息均转化为向量表示,通过向量间的相似度计算方式完成用户问题与知识库答案的匹配,进一步提升了问答的准确性。
最终问答的整体技术架构是基于多策略的统一问答,让问答更精准,问题覆盖更广。
整体的工作流程:从问题输入意图识别再到答案融合与生成。
回到现实,对于企业来说,无论是现在热议的新冠疫情还是本身技术发展阶段带来的一系列问题,对企业来说都蕴含着“危”和“机”,而在此次社会问题出现的时候,我想会加速催化产业的重组及技术的创新,政府也会在人工智能、5G这些高新技术上加大投资,我想未来是可期的。
对个人而言,我蛮喜欢罗胖跨年演讲中的一句话,疫情也好金融危机也罢,这就是我辈要解决的问题,“直面现实,躬身入局”。
本文由 @哥就是农村来的 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
我也想要下其中几张清晰的图片,方便加您微信吗
你好,最后一张:工作流程图 看不清,请问可以发高清图吗?谢谢~
可以的,加下我微信jfy139943,单独发你