生成式人工智能「1」- 神话与幻想的实现
大模型发展到现在,在各个领域的应用已经很强了。人类梦想的强人工智能,是不是已经来到了?看懂现在,展望未来,或许可以从回顾历史开始。
一转眼已经到了2024年的4月,不知道屏幕前的各位是否安好,距离大语言模型,或者说GPT,被很多人熟知已经过了一年半。
作为互联网从业者,第一次给我带来震撼并非是chatGPT,而是在更早之前使用Github Copilot;
一个可以帮助开发者自动写代码的工具。
一个「聪明」的代码助手
关于自动写代码的工具,也就是代码辅助,其实开发者的编辑器一直都有;
给非开发者的小伙伴举个例子:就像上图,编辑器会根据你当前的输入给出代码的提示,此类提示都是语法的提示,机器其实并不知道你究竟要写什么代码,只是在匹配在字典中提前做好映射关系的字段,就像输入“今天”,输入法推荐,“今天很开心”一样,输入法并不知道这句话什么意思。
同时是代码提示,为什么Github Copilot可以给我一种震惊的感觉呢?
Copilot仿佛能够看懂我的代码,并给出他的建议,而不是语法上的提示,就像真的有一个程序员在帮我写代码。
这种感觉就像:你想拿扫把来扫地,结果扫把自己动起来了,而且还知道具体怎么扫,而你需要的只是,确定一下。
这是一种非常的震撼的感觉。
而Github Copilot这个工具的背后,就是微软与openAI公司合作开发的一款人工智能工具,这款产品正是基于生成式AI GPT3.0进行实现。
如果AI都能“看懂”代码,并可以编写代码,距离直接看懂人类的语言还远吗?
我们人类一直以来的梦想强人工智能(AGI),是不是已经来到了我们的身边?人工智能正在如何改变我们的生活?它将把我们带向何方?
看懂现在,展望未来,或许可以从回顾历史开始。
古老的梦想
人工智能的起源可以追溯到神话、哲思、想象。
早在机器人(robot)的概念被大众所知晓之前,人类世界就有了很多关于自动机械的想象,多被称为“automaton”,该词最早起源于亚里士多德的《物理学》。
大约在2500年前的古希腊神话中,人类历史上出现了一个行走的机器人,据《荷马史诗》描述,那是一个叫做塔洛斯的铜制巨人,保护克里特岛免受外来入侵。
除了古希腊罗马文化,其他文明也不乏对人工智能的探索,犹太人传说中存在有生命的泥人,印度传说中守护佛祖舍利子的机器人武士,虽然这些似乎都和现在我们理解的人工智能不相关,但是总是能够看到人类尝试模拟、创造人类的梦想。
这样的超级智能的机器,依旧是更多的存在于想象而不是现实,至少目前是如此。
而我们今天的主角AI,作为计算机科学的一个分支,一个短短70年的历史的学科,似乎让这一切有了可能性。
经典人工智能时代
1956年,4位AI鼻祖麦卡锡(John McCarthy)、明斯基(Marvin Minsky)、罗切斯特(Nathaniel Rochester)和香农(Claude Shannon)一起写一份提案,人工智能(artificial intelligence)一词正式亮相。
人们开始研究机器是否可以模拟人类的认知、学习过程,用逻辑推理与现有信息来解决问题,并做出决定?
1957年,AI的第一个研究方向确定了:符号主义(symbolists),后来我们称之为:经典人工智能。
符号主义源于数理逻辑、基于逻辑表达式,用数学和物理中的逻辑符号来表达思维的形成,最终产生人一样的推理与决策;
简单来说:如果我们把这个世界所有的问题都告诉AI,AI就能帮助人类解决问题了。比如:
看到红灯 = 停下;看到绿灯 = 通过;禁止停车的标志 = 禁止停车;
任何形式化的符号问题都可以被此程序解决,理想情况下机器将知道了所有“符号”在物理世界的含义。在这样的原理的基础上,通用问题解决器(General Problem Solver)诞生了,后面也被称为专家系统。
其原理其实非常简单:内部包含一个巨量的知识库,就像“专家的脑袋”,以及推理引擎,用户理解人类语言的技术从知识库中寻找最可能的问题的答案。
在接下来的20年中,专家系统逐渐被全世界接受,并且在知识库、知识工程领域发挥了巨大的威力
但是,它能够被称得上是人工智能吗?
很显然这样的逻辑匹配距离我们人类期望的人工智能还相差甚远,通用问题解决器看似智能, 但实际上他们只是盲目地进行模式匹配。
并且还存在一些难以解决的问题,专家系统维护费用很高,它们难以升级,难以使用,脆弱(当输入异常时会出现莫名其妙的错误),专家系统的实用性仅仅局限于某些特定的场景。
1980年,美国哲学家约翰.瑟尔提出了一个思想实验《中文房间》:
当有人说恭喜发财的时候,我们就从这本书找到了对应的答案,谢谢,再反馈给对方
一个对中文一窍不通,只说英语的人关在一间只有一个开口的封闭房间中。房间里有一本用英文写成的手册,指示该如何处理收到的中文讯息及如何以中文相应地回复。房外的人不断向房间内递进用中文写成的问题。房内的人便按照手册的说明,查找合适的指示,将相应的中文字符组合成对问题的解答,并将答案递出房间。
尽管房里的人可以以假乱真,让房外的人以为他说中文,但事实上他根本不懂中文,就像通用问题解决器,他并不知道人类的语言究竟是什么意思。
虽然这似乎与”人工智能“差距还很大,但是为人工智能的发展作出重要贡献,专家系统的成功开发与应用,为实现人工智能联系实际走向应用具有重要意义。
机器学习时代
在专家系统大放异彩的时候,另一个在2000年左右大放异彩的技术已经出现,机器学习(Machine Learming)。
1952年,阿瑟·萨缪尔在IBM公司工作时研制了一个西洋跳棋程序,这个程序具有“学习能力”,它可以通过大量棋局的对弈,越来越会下跳棋;并且程序很快就下赢了萨缪尔自己。
该程序推翻了一直以来人类的传统认知:计算机不可能超越人类。
关于机器学习后来也有了准确的定义:在不直接针对问题进行编程的情况下,赋予计算机学习能力的研究领域。
但是为什么在2000年之前的几十年的时间里面,机器学习这一概念一直被专家系统遮掩了光明呢?
因为机器学习需要巨量的知识来进行学习,在互联时代还不够发放的时候,想获取大量的数据并非易事,比如让机器学习识别小狗,就需要巨量的小狗的照片。然而到了20世纪90年年代,随着互联网时代的到来了,爆炸式增加的数据,让机器学习获得了充足的养料。
随后我们迎来了AI的机器学习的发展浪潮,以及一些震惊世界的标志性的事件
- 1997年IBM的深蓝在世界象棋领域击败了冠军卡斯帕洛夫
- 2016年AlphaGo在围棋领域击败了排名世界第一的柯洁
在2000年以后,机器学习不断发展,开始出现了很多分支、有监督学习、无监督学习、半监督学习、深度学习、强化学习、集成学习,机器学习伴随移动互联网渗透到到我生活中
比如使用有监督学习+无监督学习,可以实现了让我们每个人受益的推荐系统,比如网易云的每日推荐音乐、抖音的推荐、淘宝的推荐,这些都可以算作机器学习的范畴,他们在垂类领域做到了比用户更加了解自用户己。
既然AI已经存在这么多年,并且对我们每个人都存在深远的影响,为什么似乎我们以前没有学习AI的焦虑呢?
我觉得原因主要是:机器学习的人工智能,只能在垂类训练与发挥能力,比如做推荐、做分析,并非通用性的人工智能。
并且稍微深入了解,大家都知道一点,就是本质上,他并不知道人类世界,依旧是机器,我们依旧可以使用机器的运作逻辑去解释他。
直到大语言模型的到来。
大型语言模型
2018年,OpenAI发布了第一个代号为“ChatGPT的生成预训练变换器模型”,这是一种新型的深度学习模型。
深度学习起源于1943年,由美国神经科学家麦卡洛克提出神经元的数学模型,参数越大,代表神经元越多,比如GPT-3的相当于人脑中1750亿的神经元。
2019年,GPT-2发布,拥有1.5亿参数(参数可以理解为知识量),已经可以做到配流畅的生成文本、一定程度的理解上下文。
2020年,GPT-3发布,拥有1750亿参数,在文本生成、创作、代码生成多个领域展现出惊人的实力,在巨量数据以及技术优化下,GPT-3开始涌现出“智慧”,它似乎形成了智慧。
2022年11月底,OpenAI发布了GPT 3.5模型驱动的ChatGPT。
5天之后,该网站注册用户超过100万。
众所周知,早些时候注册GPT并不是简单的事情,我们使用国内科技爱好者搭建的镜像网站,和chatGPT聊了很多,只是当时我没有意识到,一个能听懂人类的语言,感知人类的情绪,并能够提出建议的AI是一种什么样的存在。
直到2023年2月,chatGPT开始出圈,开放API接口能力,让大家都可以基于GPT做应用、发布更强的GPT4、多模态能力、文生图能力。
那一个月我感到非常焦虑,因为我突然意识到了我这身处人类历史的一个里程碑,大语言模型让人类一直以来追求的真正的通用型人工智能不再遥不可及,远在几千年前的神话故事有了发生在人类世界的可能性。
《创造亚当》时刻来了,上帝创造了亚当,人类创造了AI。
虽然他还存在很多限制,比如模型本身不能联网、记忆是有限的、偶尔会瞎回答,但是他也表现出了类似人类的智能,它理解你文字的含义,满足你的各种需求。
这样的人工智能的想象空间实在是太大了,随着更多资源的投入,生成式人工智能将会在未来几年得到超快速的发展,以及逐渐在我们生活中出现。
我们国内相应也出现了很多生成式人工智能,比如在侧重数理领域的文心一言、多模态领域表现出色的通义千问、自然语言理解出色的云雀大模型、2000K长文的KimiChat、各项评分不俗的智谱清言。
虽然与美国有些差距,但是在大模型这个领域我们依旧走在前沿,互联网公司的大语言模型,将会逐渐赋能各家App,由该技术支撑的AI助手会逐渐走到每一个消费者的面前。
大语言模型对于我们所生活的世界的改造已经在发生,并且呈现不可阻挡之势。
身处时代洪流之中的我们
每当新的先进技术的出现,一些工作就会消失,就业市场也会发生改变。
当闹铃出现的时候,那些专门敲门提醒人们起床的工作消失了。
当计算器出现的时候,专门计算的人就会失业。
这并非坏事,我们工作中重复、肮脏、沉闷、危险或者困难的某些部分,未来都很有可能自动化;我们将更加专注我们工作的本质,例如创造力、解决问题、同理心、领导力。
如果说工业革命为人类创造了工业化的工作,那么生成式人工智能革命将使我们从这些工作中获得解放与自由。这是对未来的范式彻底改变。
我们每个人都会变成自己的创意工作室,你的愿景和实现之间的障碍将消失,复杂的写作、绘画、音乐、电影和其他形式的创意制作工具将会被简化并触手可及,人类将从消费者转换为创造者。
那我们现在应该怎么做呢?
- 主动学习、拥抱生成式AI,让AI成为你的最佳助手
- 增强个人独特的情感、创造力、交流能力,这是任何AI都无法模仿的
最后
让更多人、更多组织可以从生成式AI中收益,是本系列文章的初衷;学会运用AI,与AI和谐共处也是我们共同面临的挑战,在接下来的系列文章中,我会使用通俗易懂的语言,与大家带领大家学习与了解提示词工程、插件、知识库、agent,普通人也可以在很短的时间内学习与使用AI,我们一起走到时代的前沿。
本文由 @狗阿木的产品日志 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
写得太好啦!读的津津有味
哈哈哈,谢谢夸张呀,记得关注,这是系列文章~
谢谢夸奖,打错字了