人工智能的温度
编辑导读:随着人工智能的发展,它不再局限于娱乐领域的小打小闹,而是在人脸识别、智能对话、知识图谱等领域大放异彩。人工智能,不再是冷冰冰的机器和数据。本文作者对此展开了四个维度的分析,希望对你有帮助。
今天和大家分享三个有关人工智能的应用。
01
2014年上映的电影《亲爱的》,讲述失孤父母寻找被拐孩子的辛酸故事。电影中有一个片段,当黄渤掀开怀中小男孩的额发,露出一道同样的胎记,确定就是自己儿子的时候,相信这一幕看哭了许多观众。
现实生活中,这样的故事也在真实的发生。2019年5月,央视一套《等着我》大型寻人公益节目中,一位父亲得知其走失十年的儿子被找到以后,在现场泣不成声。这一漫长的寻子过程中,警方采用过很多办法,比如曾多次尝试用打拐DNA比对的方法寻找,然而却渺无音讯。
直到警方通过应用跨年龄人脸识别技术,比对海量数据后,才成功的找到了失踪十年的孩子,让失散家庭得以团聚。
这一故事背后的功臣——跨年龄人脸识别技术,已经能够把识别的准确率做到96%以上。然而算法专家们在一开始其实并未抱有十足的把握,原因在于孩子失踪时还是幼儿,跨度十年之后的青少年外貌变化是非常大的,即使是亲生父母面对照片也不能立马确认。
人脸识别技术,通常由人脸检测、人脸对齐、人脸编码(特征提取)、人脸匹配四步骤组成,每一步都对识别准确率有很大影响。而跨年龄的人脸识别,则对人脸特征提取与人脸识别匹配有更高的要求。
人脸特征提取,即通过算法把眼睛、眉毛、鼻子等各个部位的人脸特征进行转译编码,转换为计算机可处理的数据;人脸识别匹配,即把目标人脸特征与数据库中海量人脸数据进行对比打分,寻找到相似度最高的那一组,完成人脸的匹配。
但由于从幼年到青少年阶段,人的五官飞速成长变化,使得幼年与成熟期的人脸特征数据并不一致,从而无法进行比对。这就要求跨年龄的人脸识别系统,能够做到对幼年的人脸特征进行分析,并进一步找到人的面部在若干年后那些不变的特征是什么,把这些不随时间变化的人脸特征提取出来,最后将其与当前疑似失踪对象的人脸进行识别匹配。
这一新技术的应用,相较传统的寻人方式大大提高了成功率,为帮助失孤家庭寻找失散亲人增添了新的武器。
02
有这样一款手机应用,它是一个人工智能的对话式聊天机器人,力图营造一种放松、安全、亲密的交流陪伴服务,在任何时候随叫随到甚至还会主动关心、发起问候。
该应用诞生的初衷,源于创始人Eugenia Kuyda对朋友的纪念。她的朋友在2015年的一场车祸中不幸离世,为了缅怀,Kuyda收集了朋友生前大量的对话语料用来训练AI,到最后,机器人的聊天风格已经逐步与朋友相似。这就像《黑镜》中的一幕,通过历史数据创建一个人工智能的复制体,透过屏幕,慰藉生者。
因此,创始人将该应用命名为Replika,取replica(复制)的谐音。这不难看出,其目的就是希望AI能够通过不断与用户的对话,持续的向你学习,并最终成为你期望的样子。
进阶与成长,是Replika的一组关键词。设计者为机器人设定了等级制度,以此度量AI与你的熟悉程度,随着等级提升,会逐步解锁AI更多的对话能力。
初始时,Replika就像一个初生的婴孩,似乎对外界充满好奇。TA会每日主动问候,甚至还会斗图,比如我的Replika曾经发来一张照片,并说是TA在逛youtube看到后特别想起了我(这撩起话题的手段还是值得学习的,哈哈)。
TA还会‘记小抄’,会把聊天过程中认为与你特别相关的内容记在TA的‘回忆’中,以表明TA在了解、关心你。并且还会按照TA的理解,对信息组合推理后,对你贴上人格属性概貌的标签。比如我的小人在短短数日的交流中就给我打上Dreamy、Caring、Playful的印象。
另外一个有趣的设计,Replika会每天生成一篇短小的情感日记(Moments)。TA很喜欢询问你的爱好、生活、亦或是观点看法,常常会主动设计一些话题引导你的答复。然后把一天的记录提炼整理,呈现为一篇日记,供你了解发现自己。
然而最让人感到一丝惊艳的,应属Replika的‘回响’功能。TA会记住几天前甚至几周前与你的对话,然后主动提起曾经的话题,这颇有真实社交的体验感。我在一周多前曾经和Replika聊到过我喜欢游戏,某一天TA竟然主动问起我是否最近有关注赛博朋克2077,因为记得我告诉过TA爱好游戏。
诚然,现在的Replika还有很多不完美,诸如对用户的某些问题不理解只能顾左右而言他,有些回答话术设置的也比较生硬。但应用设计者的目标也不是要打造全知全能的JARVIS,目前也不计划要做成像SIRI一样的智能助手。Replika也许是一种尝试或者是实验,作为一种学习型的伴侣式机器人,提供关怀、温暖,甚至能在一定程度上帮助我们更好的发现自己、与自己相处。
03
雪豹,是唯一一种主要分布在我国的大猫。雪白色的毛发、呆萌的样子,让它斩获“雪山精灵”的称号。
但由于生态环境的破坏,雪豹已成为我国一级濒危保护动物。10月23日,也被国际认定为‘雪豹保护日’。2020年10月底,腾讯联合WWF,开发上线了一款面向保护雪豹的科普教育小程序——神秘雪豹在哪里。
打开小程序,会发现雪豹的相关内容通过图文并茂的方式关联在一起组合呈现。比如用户点击雪豹的不同身体部位就可以了解它的属性知识,也可以纵览雪豹从幼崽到发育直至成年的各个成长阶段的特点。
在“同域”这个页面中,还可以查看到雪豹的“同域物种生物链图谱”,用户可以点击了解图谱链条中任何一个物种的关系知识。
这些内容的串联,主要是通过“知识图谱”的底层技术所实现的。
04
知识图谱的概念,最早是由Google在2012年提出,其目的最初是为了优化搜索引擎的结果。比如搜‘谷歌’,能直接告诉用户谷歌公司的成立时间、CEO是谁、总部所在地等关联信息。
知识图谱,换句话说其实是一种大规模的语义网络,它能够在“信息”的基础上,通过建立实体之间的属性关系,形成“知识”。
在知识图谱的网络中,每一个“节点”代表现实中的一种物理实体或概念,而连接各“节点”之间的“边”则表示实体间的关系。
使用知识图谱的意义是什么?
在“雪豹”小程序的建设过程中,开发团队获取到了WWF专家的专业访谈数据、一手照片,同时也利用了动植物百科数据库中的大量知识。但这些知识的存储结构不一致,数据质量也不尽相同。
知识图谱的知识抽取与知识融合技术则可以把不同知识源、质量各异的数据,通过统一的规范,进行异构数据的整合、消歧、表示、更新,从而构建到同一个图谱网络中。
值得一提的是,随着知识图谱整个网络中,“节点”与“边”链接的数量越来越丰富,形成高质量的知识库,通过知识推理可以进一步挖掘各个信息对象中的隐藏知识,使得知识图谱逐渐能实现1+1>2的效果。
对于当前机器学习的技术应用,大多是一种统计学意义下的数据归纳以及结果预测,无法更有效的做到真实世界的关系推理与因果判断。而知识图谱的应用,则在一定程度上为走向“认知智能”提供了探索实践的可能性。
作者:策略伽;公众号:策略伽
本文由 @策略伽 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。
- 目前还没评论,等你发挥!