什么是AGI?人工智能的未来
【AGI】是推动人工智能发展的核心理念,一直以来,我们可能并未听说【AGI】的发展历程,或者是相关概念,好像是最近才突然“火”起来,为什么消失了多年的概念在当今又被提起?下面笔者会从AGI的原点,深入介绍一下AGI的现状,以及未来发展的猜想。
1 AGI概念&背景
1.1 AI(Artificial Intelligence)简史
最初在1955年,由约翰·麦卡锡(John McCarthy)创造的术语【人工智能】(Artificial Intelligence)指的是能够像人类一样思考、学习和推理的机器或计算机程序 – 其能够具备人类的普遍智慧,即能够学习各领域知识,并能将知识输出在各个领域。
当时,约翰·麦卡锡预计人工智能将在几个月内实现。
约翰·麦卡锡在实践过程中,遇到了极大的技术阻碍,因此多年来,【人工智能】领域演变为【狭义人工智能】,即:一次只解决一种类型的问题。
我们将AI的能力应用在了各个领域,比如:机器视觉(CV)、语音识别(ASR)、自然语言处理(NLP)。但将AI能力应用到各种场景细分的不利后果是:我们现在依然需要程序员或者数据分析师才能实现场景下特定的目标,而不是我们构建了类似智能人脑的系统。
因此,【人工智能】的重点从系统内在智能,转移到利用外部环境中的智能,需要程序员的智慧,解决特定问题。
随着业务的深入,也更加关注特定场景下的人工智能的使用,这样导致了:【人工智能】在迭代的过程中,忽视了适应型和主动性这两大核心。智能体的初步设计是能够自主地适应不断变化的环境,根据环境调整自身算法,进行主动知识学习和研判,从而完成预设目标,但现在完成目标的不是【人工智能】,而是场景中的相关技术/业务人员。
1.2 AGI的背景
【AGI】的词汇是“Artificial General Intelligence”的缩写。
1997年时,【AGI】这个术语被定义,我们称之为——【通用人工智能】。由Mark Gubrud在《Nanotechnology and International Security》(纳米技术与国际安全)中提出,其主要内容是:讨论全自动化军事生产和作战的影响。
其原文如下:
其翻译为:
通过先进的【人工通用智能】——在复杂性和速度上能与人类大脑相媲美甚至超越的系统。
这些系统可以获取、操纵和推理日常的知识,在需要人类智力的领域发挥作用,比如:在工业或军事行动的任何阶段。
这样的系统可能以人类大脑为模型,但并不一定必须如此,重要的是这样的系统可以被用来取代人类大脑,从组织和管理矿山或工厂到驾驶飞机、分析情报数据或规划战斗等各种任务。
Mark Gubrud认为【AGI】可以取代人类的大脑,做方方面面的领域应用,如:组织和管理工厂、驾驶飞机、分析情报等战斗任务。虽然当时Mark Gubrud没有提出一条确定的概念来描述【AGI】,但是我们可以从几个关键词来感知【AGI】的雏形:代替人类大脑、做各方面应用。
到2001年,许多人工智能研究人员独立得出结论,认为现在是回归【人工智能】原始愿景的时候,并决定联合撰写关于【人工智能】主题的书。2002年,其中三位作者分别为:本·戈尔策尔(Ben Goertzel)、谢恩·莱格(Shane Legg)和彼得·沃斯(Peter Voss)为该书的标题创造了术语【通用人工智能】(Artificial General Intelligence)。
1.3 AGI的定义
AGI(Artificial General Intelligence)的概念:指的是创建(半)自治、适应性强的计算机系统,具有典型的人类一般认知能力,具备支持抽象、类比、规划和问题解决的能力。(来源于:《Why We Don’t Have AGI Yet》: AGI refers to creating (semi-)autonomous, adaptive computer systems with the general cognitive capabilities typical for humans. The ability to support abstraction, analogy, planning and problem-solving. )
2 AGI的现状
下面以两个具体的场景为例,带入读者感受现阶段【AI】概念与【AGI】概念的不同。
2.1 狭义人工智能/弱人工智能
弱人工智能(英语:Weak artificial intelligence,简称Weak AI)或称狭义人工智能(Narrow AI)、应用型人工智能(Applied AI),是实现部分知识应用的人工智能,且仅能专注于某项特定任务。用约翰·瑟尔的话来说,它“对于测试关于思想的假设很有用,但实际上并非思想本身”。弱人工智能专注于模仿人类如何执行基本动作,例如记忆或感知事物、解决简单问题。比如:AlphaGo是一种围棋软件,只能专注于下围棋。
在1990年代和21世纪初,【狭义人工智能】在商业成果和学术地位上,已经达到了一个新高度,依靠专注于解决细分的问题。他们可以提供许多方案和商业应用,例如:人工神经网络、机器视觉以及数据挖掘。这些【狭义人工智能】今天已经在工业技术和科学研究中,得到广泛和深入的应用,在学术和产业方面都得到了许多资助。
2.2 狭义人工智能的使用场景
有一位名叫李明的企业家,他正在寻找一种创新的市场营销策略来推广他的产品。考虑到社交媒体在当下的重要性,他决定尝试利用【NLP-自然语言模型】助力社交媒体营销。
李明提供了一些关于他的产品特点和目标受众信息,请求【NLP-自然语言模型】生成一系列具有吸引力和影响力的社交媒体内容。【NLP-自然语言模型】开始分析这些信息,并生成了一系列引人注目的媒体帖子、广告标语和产品描述。
李明根据【NLP-自然语言模型】生成的内容,制作了一系列的社交媒体内容,并发布到多个平台上。这些内容不仅引起了用户的兴趣,还增加了产品的知名度和销售量,为企业带来了可观的营销效果。
这个案例讲述了,通过【NLP-自然语言模型】的协助,李明成功地实现了创新的社交媒体营销策略,为他的产品带来了广泛的关注和认可。这个例子突出了【NLP-自然语言模型】在企业营销中的应用潜力,为企业提供了创造性的市场推广方案,帮助他们实现品牌宣传和市场竞争优势。
但是这也会有一定的不足,如果李明想让AI帮助生成一整套商业推广策略,【NLP-自然语言模型】可能就有些力不从心了,因为整套的商业推广文件形式,涉及到视频、图片等。如果生成推广海报,可能需要【CV-视觉模型】和其他领域人工智能的介入。
通过这个案例,我们可以把这种【NLP-自然语言模型】、【CV-视觉模型】等,归类为【狭义人工智能】。这些【狭义人工智能】都有一个共性,其只是在某一领域给需求方提供一定的指导,其智能程度无法帮助需求方完成一整套需求落地,主要表现为:最终把生成的社交媒体内容推向市场的还是李明、而不是【NLP-自然语言模型】。
我们试想,如果上述案例让【AGI】执行,将会是怎样呢?
【AGI】得知李明需要推广产品后,开始查阅所有的方案推广可能性,根据现在市场行情,从中选择一个最优解;然后,【AGI】开始撰写符合商业场景的文案,并自动合成相关的宣传视频、生成推广海报;在这些物料准备完成后,
【AGI】开始分析广告投放策略,并通过不同渠道做精准的广告投放,把边际成本降到最低;在广告投放完成后,【AGI】会对市场反馈的数据再进行分析,优化现有物料、提升渠道效率,降低获客成本。最终结果当达到你的目标时,【AGI】给予你反馈。
而在【AGI】执行此任务的过程中,自身又根据事件及环境作出了自我优化。在面临相似需求时候,它会更加智能、更加高效。
2.3 现代通用人工智能(AGI)的使用场景
【AGI】的使用远不止上述案例,为什么说【AGI】只存在于小说里、科幻电影中呢?因为【AGI】具象化以后,就是一个无所不能的、集各领域行业专家知识于一身的智能体。下面再举一个案例请大家感受一下【AGI】的智能程度。
想象一下,现在有一个关于《治愈癌症》的课题急需攻破,其影响重大,可能挽救成千上万病患者的生命,但以现有的研发资源来看,这还是一个无法解决的问题,具体体现在:缺乏富有经验的医学人才,缺少对以往医疗案例有效数据进行深入挖掘。
【AGI】可以通过全面整合已有的医学文献、临床案例和研究报告,挖掘其中的关键信息和潜在规律。
【AGI】能够快速理解并分析大量医学数据,寻找可能的突破点和治疗方向。同时,【AGI】可以利用计算机模拟技术,对潜在的治疗方法和新药进行大规模虚拟实验,加速研发过程。通过分子模拟、蛋白质配体对接等技术,筛选出可能的有效药物及其作用机制。
在临床实践中,【AGI】可以提供最新的研究成果和治疗建议,帮助医生做出更明智的医疗决策。同时,在医生实际决策的数据中,【AGI】又会进行深度学习。
在很短的时间之内,【AGI】会变成一个行业的解决方案专家,当然了,不同的医院有不同的高级智能体,这些智能体之间会相互共享、分析数据,将各类深度学习的人工智能知识汇聚,做自我升级。
不久,【AGI】就会超越人类,率先研发出对抗癌症的解决方案。
虽然有了一系列的展望,但是AGI的伦理层面还是需要深度探索,国内外人工智能发展的现状总是技术跑在监管条例前面,因此,会引发一系列的社会问题,在对人工智能发展的监管力度应该加强。
2.4 狭义人工智能和AGI的不同
我们在理解AI与AGI的过程中,不要把【通用人工智能(AGI)】和【人工智能】相混淆,通用人工智能( AGI ) 是人工智能(AI)的一种,【AGI】可以在广泛的认知任务中表现得与人类一样好甚至更好,与专为特定任务而设计的【狭义人工智能】不同。创建【AGI】 是一些人工智能研究以及OpenAI、DeepMind和Anthropic等公司的主要目标。2020 年的一项调查发现,有 72 个活跃的 AGI研发项目遍布 37 个国家。
下面【狭义人工智能】与【AGI】 主要特点的对比:
理论上,【AGI】 能够执行人类可以执行的任何任务,并在不同领域表现出一系列智能、无需人工干预的特点;在解决大多数领域的问题时,它的表现应该与人类一样好,甚至更好。
相比之下,【狭义人工智能】擅长完成特定任务或特定类型的问题。许多现有的人工智能系统结合使用机器学习 ( ML )、深度学习(机器学习的子集)、强化学习和自然语言处理 ( NLP ) 来进行自我改进,并解决特定类型的问题。然而,这些技术并没有达到人脑的聚合处理能力。
目前使用【狭义人工智能】主要的应用领域有:
- 客户服务聊天机器人。
- 语音助手,例如苹果的 Siri 和亚马逊的 Alexa。
- Google、Netflix 和 Spotify 等推荐引擎,用于向用户推荐内容。
- 由人工智能驱动的业务分析和商业智能 ( BI ) 工具可进行数据分析、评估客户情绪并为最终用户呈现数据可视化。
- 图像和面部识别应用程序以及它们使用的深度学习模型。
2.5 AGI的价值
- 执行认知任务的成本大大低于人类。
- 【AGI】在彼此之间更擅长沟通和分享知识 – 没有自我设限阻碍。
- 无休止运转,7*24小时无休止工作,需求处理速度更快,解决问题注意力更集中。
- 不会受到人类感知的各种“干扰”,例如家庭、假期、爱好等。
- 更强的逻辑思维能力,以及进行复杂规划和推理能力得到大幅提升。
2.6 现代通用人工智能(AGI)的争论
通用人工智能【AGI】引发起一连串哲学的争论,例如:如果一台机器能完全理解语言,并回答问题,其是不是有思维。哲学家希尔勒认为不可能。
关于【AGI】的争论,不同于更广义的一元论和二元论的争论。其争论要点是:如果一台机器的唯一工作原理就是转换编码数据,那么这台机器是不是有思维的?希尔勒认为这是不可能的。他举了著名的中文房间的例子来说明,如果机器仅仅是转换数据,而数据本身是对某些事情的一种编码表现,那么在不理解这一编码和这实际事情之间的对应关系的前提下,机器不可能对其处理的数据有任何理解。基于这一论点,希尔勒认为即使有机器通过了图灵测试,也不一定说明机器就真的像人一样有思维和意识。
也有哲学家持不同的观点。丹尼尔·丹尼特(Daniel C. Dennett)在其著作《意识的阐释》(Consciousness Explained)里认为,人也不过是一台有灵魂的机器而已,为什么我们认为:“人可以有智能,而普通机器就不能”呢?他认为像上述的数据转换机器是有可能有思维和意识的。
3 AGI的发展与未来
3.1 人工智能的三次浪潮
几年前,美国国防部高级研究计划局(DARPA)提出了一个简单分类法,其按时间顺序和应用特征,划分人工智能,分解如下:
- 第一波浪潮——基于规则的方法:也被称为“GOFAI”(Good Old-Fashioned AI),在大约2010年之前主导了该领域,其特点是:数据和算法主要由开发人员手工制作。这包括专业系统、复杂逻辑和搜索算法、架构规划和调度系统等。其最显著的成功案例包括IBM在1997年的国际象棋冠军Deep Blue以及Jeopardy智力问答游戏冠军Watson。
- 第二波浪潮——神经网络:在2012年左右如海啸般来袭,当时研究人员发现如何利用海量数据和计算能力(包括GPU/TPU)构建神经网络。这推动了翻译、图像和语音识别的突破,最终通过GPT实现了强大的视觉、语音和文本生成。目前,这些发展的顶层交互体现在各种LLM(大型语言模型)中,如ChatGPT。这一波浪潮以统计学和强化学习为特征;其中许多都是无监督或自监督的。
- 第三波浪潮——通用人工智能:第三波浪潮仍处于萌芽阶段。它的重点完全符合AGI的要求:自主、实时学习;适应、高级推理。它还期望概念更加贴近现实(而非语言统计)、稳定的少样本学习和可解释性。人工智能专家希望这些系统,能够优雅地将次符号模式匹配,与高级符号模式和语言推理相结合。满足所有这些要求的一个明显候选方案就是【认知架构】方法。
3.2 第三次浪潮——【认知人工智能(cognitive AI)】
能够推动【通用人工智能】落地的知识架构是【认知架构】,其具体表现形式是【认知人工智能】。
【认知人工智能】(Cognitive AI)是具备人类式认知能力的智能体,认知人工智能阐述了一个系统,其能够:理解语言、运用常识知识、推理和适应未知情况;具备这些特征的集合体,更像一个具备高级知识的人类,是一个能够帮助我们解决问题的【AGI】助手,它需要深刻理解生活和科学、与我们进行有效的沟通、使用我们日常的工具和系统,同时具备学习和创新能力。实现这个目的,需要构建一种特定的【AGI】方法,专注于实时、终身的概念学习和推理。
如果AGI一旦落地,将会在很多领域远超人类,但在他们实际的应用环境中,需要的信息总是不完整而且相互矛盾,同时我们会规定有限的时间和资源来完成任务。另一方面,它们不需要人类级别的感知敏锐度或灵巧性。可以将其称为海伦或霍金模型的【AGI】(Helen Keller / Stephen Hawking)——具有人类级认知能力但没有整体人类水平的身体能力。然而,它们也需要某种方式来捕捉、与我们的实际世界互动。 例如:可以通过个人电脑屏幕、键盘和鼠标进行访问来实现这一点。此外,AGI也将成为卓越的工具使用者,就像在办公室的员工一样。 我们看到【认知人工智】能是通往【AGI】最清晰、最明确和最直接的途径。
3.3 【认知人工智能】的核心-认知架构
认知架构基础理念是创建、涵盖并体现出:人类水平的思维,所需的所有基本结构的系统。
重要的是,它还考虑了这些结构和功能,如何需要与不断变化的知识、技能相结合,以在多样、动态的环境中产生智能体。
虽然有多个认知架构项目已经持续活跃了几十年,但迄今为止,没有一个显示出足够的商业前景,被广泛采用或受到特别充分的资助。
原因是多方面且复杂的,但一个共同的特点是:它们正在以模块化和低效的方式运行,并且缺乏深入的学习反馈和认知理论。
4 为什么我们还没有实现AGI
简单来说,也许是因为目前还没有一个采用正确方法、理论,并拥有足够资金支持的项目。
最近ChatGPT的成功表明,硬件限制目前可能不是主要瓶颈,现有硬件的支持,使得高度复杂的语言生成或“推理”变得可行。
4.1 没有实现AGI的原因:
- 尽管成千上万的【AI】研究人员在【人工智能】领域工作,无论是通过自我承认还是客观分析,只有极少数人,直接致力于研究实现【AGI】的方法。
- 一个客观的标准是,在实现【AGI】的过程中,所做的【AI】工作,是否有明确定义的步骤或整体详细计划。很少有【AI】工作符合这一标准。具体来说,生成式【AI】研究不符合【AGI】的实现路径。
- 目前,致力于开发【AGI】的项目,很少有明确符合【AGI】所需的自主适应智能要求的理论。
- 由于在过去的十年里,统计(与认知AI)取得了巨大成功,目前该领域的几乎所有领先专家和从业者都来自统计学、数学或形式逻辑的研究。随着研究的深入,现有的行业【AI】专家,几乎不可能从“0”再次从认知角度看待【AGI】的要求。
- 在市场经济体中,个人、团队和公司的动机和激励很少有助于朝着【AGI】进展。对于学者来说,发表论文是最重要的,而非开发实际的AI系统。对于公司来说,是制作令人印象深刻的演示,或者在某些游戏或活动中击败人类以获得额外资金。对于大多数人来说,是突破现有的能力,而非从源头上改变它们。
- 使用现有的基准来评估【AGI】存在很大问题:首先,将焦点放在对特定基准的逐步改进上,会分散开发其他更基础解决【AGI】问题的工作。相对于解决困难的未知问题,更容易着手处理已经掌握如何取得进展的事物。其次,当前的基准极不适合衡量原型【AGI】的进展。早期【AGI】系统的定义,在现有的狭窄基准上表现很差,同时也不擅长高水平的智商测试,和其他专业测试。
- 即使一切都顺利朝着【AGI】预定义的目标发展——拥有良好的理论基础和发展计划,出色的开发团队和雄厚资金,以及正确的目标基准、开发标准,但仍然存在着“狭义AI陷阱”的隐患。 人的本性使得我们本能地希望在最短时间内取得最大进展。但对于【AGI】来说,这往往意味着我们最终利用外部人类智慧来实现特定结果,或在给定基准上取得进展,而不是以一种将智慧(适应性、自治的问题解决能力)融入系统的方式来实现。随着开发深入,最终导致的结果是:只有名义上是【AGI】的【狭义人工智能】工作。
4.2 AGI的隐患
许多进行人工智能研究的专家,对通用人工智能的实现,持怀疑态度。有些人质疑【AGI】的落地是否值得。
英国理论物理学家、宇宙学家和作家斯蒂芬·霍金在2014 年接受英国广播公司采访时警告了【AGI】的危险。“人工智能的全面发展可能意味着人类的终结”,他说。“它会自己成长,并以越来越快的速度重新设计自己。当人类受到缓慢的生物进化的限制,无法与AIG进行竞争时,就会被取代。”
一些人工智能专家预计【AGI】将继续发展。发明家兼未来学家雷·库兹韦尔 (Ray Kurzweil) ,在 2017 年西南论坛(South by Southwest Conference)上接受采访时预测,到 2029 年,计算机将达到人类的智能水平。库兹韦尔还预测,人工智能将以指数级速度进步,带来突破,使其能够在一定水平上运行超出人类的理解和控制。人工智能的这一点被称为奇点。通用人工智能是有助于人工智能最终发展的人工智能类型之一。
2022 年,在席卷全球的生成式人工智能发展的推动下,这一愿景更加接近现实。随着 ChatGPT 于 2022 年 11 月首次亮相以,以及其他【生成式 AI 】出现,世界各地的用户亲眼目睹了:人工智能软件可以理解人类文本,提示并回答不限范围的问题,虽然答案并不总是准确,但是这些生成式人工智能模型已证明了:它们可以生成大量不同类型的内容,从诗歌和产品描述,到代码和合成数据。像 Dall-E 这样的图像生成系统也颠覆了视觉交互,除了医学图像、物体 3D 模型和视频之外,还生成模仿著名艺术家作品或照片的图像。
尽管生成式人工智能的功能令人印象深刻,但它们仍然达不到完全自主的 【AGI】。无论是因为此类工具容易产生不准确和错误信息,还是因为它们无法自主获取、处理最新信息。
5 总结
最近GPT技术的惊人表现引起了:我们实现“AI”最初愿景的可能性——拥有人类水平的“思考机器”。术语【AGI】被创造出来(重新)专注于这一目标,同来带来解决人类面临的许多问题、促进人类繁荣的技术。 然而,对人类认知水平的详细分析显示,目前AI主导的领域,大多数技术方法、动机和基准都没有与实现这一目标保持一致。
为加速朝着【AGI】发展,我们需要专注于:类似人类认知的核心要求——比如自主的、实时的、渐进式学习;概念形成、以及元认知控制。我们需要从第二波AI转向第三波AI,从统计生成式AI转向认知AI。
以上是笔者对AGI概念的分享,希望可以和大家一起了解、分享前沿的AI知识。
本文由 @Steven的产品炉 原创发布于人人都是产品经理。未经作者许可,禁止转载。
题图来自Pixabay,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!