深度|扎克伯格最新对谈:Llama 3.1 比 GPT4 成本低 50%!未来企业拥有 AI Agent 数量或超地球总人口
从 Llama 3.1 的发布到对未来 AI 助手的展望,扎克伯格不仅展示了 Meta 的技术实力,更描绘了一个由 AI 驱动的全新商业生态。正如他所说:“开源 AI 将成为行业标准。”让我们一起探索这场对话中的洞见,感受 AI 技术如何塑造我们的未来。
7 月 23 日,Meta CEO 马克·扎克伯格与科技评论家 Rowan Cheuang 深入探讨了开源 AI 的未来及其对社会和商业的深远影响。
扎克伯格强调,开源 AI 不仅是确保 AI 未来发展的关键,也是提升全球生产力和创造力的重要工具。
他认为,开源模型将使 AI 技术更安全、更透明,并加速其在各个领域的应用。Meta 通过发布 Llama-3.1 等开源模型,致力于建立一个更开放、更具创新力的 AI 生态系统。
Meta 的目标是在今年年底前使其 AI 助手成为全球使用最广泛的 AI 助手。通过提供免费且易于使用的先进模型,Meta 还希望每个创作者和小企业都能轻松创建自己的AI Agent,提升客户服务和业务沟通的效率。
扎克伯格将当前对 AI 的怀疑态度与 20 世纪 90 年代对互联网的怀疑态度相提并论。他认为,随着时间的推移,AI 技术将被越来越多的人接受和认可。开源方法将有助于确保 AI 技术的广泛应用,使更多人从中受益,从而减少对AI的恐惧和反对。
此外,Meta 不仅关注技术的开发,还重视将其整合到实际产品中,以便用户能从中受益。扎克伯格透露,Meta 未来的商业模式将侧重于构建最好的产品,而不是通过销售模型本身来赚钱。通过开放生态系统,Meta 希望推动更多企业和开发者参与进来,共同推动 AI 技术的进步。
他还认为,AI 技术有潜力显著提升全球的经济增长和生产力。开源 AI 将使更多国家、企业和个人能够利用最先进的技术,促进全球创新和经济发展。
以下为这场对话的全部内容,enjoy~
Mark Zuckerberg
我们第一次发布了一个具有 4050 亿参数的模型,这是迄今为止最复杂的开源模型,这是任何人所发布的最先进的开源模型。
Rowan Cheung
我有点震惊于你直接批评 Apple 及其封闭的方式。你能否详细讲述一下 Apple 在什么地方阻碍了 Meta ?
Mark Zuckerberg
是的,当你构建了一些你认为对社区有益的功能,但被告知你不能发布它们,因为某家公司想把你限制在一个框架内以便更好地与你竞争时,这是有点令人沮丧的。
Rowan Cheung
你能否谈谈你对 AI 的长期愿景以及未来可能会发生的事情?好吧,马克,非常感谢你做这个访谈。显然,今天 Meta 发布了重大的 AI 公告。你能否概述一下所有发布的内容以及为什么它们很重要?当然,没问题。
Mark Zuckerberg
今天的大新闻是 Llama-3.1 的发布,我们推出了三个模型。我们第一次发布了一个具有 4050 亿参数的模型,这是迄今为止最复杂的开源模型,这是任何人所发布的最先进的开源模型。
在某些领域,它甚至超越了一些领先的封闭模型。所以,我非常期待看到人们如何使用它,特别是现在我们制定了社区政策,允许人们将其用作教师模型来进行蒸馏和微调,基本上可以创建他们想要的任何其他模型。
除此之外,我们还将 4050 亿参数的模型进行了蒸馏,制作了更新的并且现在在其尺寸上处于领先地位的 7000~8000 亿参数模型。它们也具有非常好的性能和成本效益比。
所以,我非常期待看到大家如何使用这些模型。从整体上看,这是开源 AI 的一个重要时刻。我一直认为开源 AI 将成为行业标准,它会遵循类似于 Linux 的发展路径。
在 Linux 流行之前,有很多公司都有自己封闭版本的 Unix。当时,没有任何开源项目能达到这种复杂程度,人们认为封闭的开发模式是唯一可行的方法。
但最初, Linux 取得了一定的立足点,因为它更便宜,开发者可以以不同的方式定制它。随着生态系统的发展,它得到了更多的关注,因此实际上变得更加安全,功能也更强大。越来越多的合作伙伴为其构建了更多的功能,这使其比任何封闭的Unix系统都更具能力。
所以,今天 Llama-3.1 的发布是一个类似的转折点, Llama 有机会成为开源 AI 的标准,使开源成为 AI 的行业标准。
即使在性能上还未完全领先,但在成本、可定制性以及可以拿来微调和进行各种操作的能力方面,它都有巨大的优势。开发者会充分利用这些优势,我们专注于构建这个生态系统,围绕它可以开发出各种不同的能力。所以,我很高兴能讨论这些内容。
Rowan Cheung
是的,我看到了所有的基准测试结果,确实令人难以置信。这是首个具有 4050 亿参数的开源前沿模型。你对人们用这个模型构建的任何具体现实世界的用例特别感兴趣吗?
Mark Zuckerberg
我最感兴趣的是看到人们用它来蒸馏和微调自己的模型。正如你所说,这是第一个开源的前沿级模型,但它不是第一个前沿级模型。所以,已经有其他具有这种能力的模型,人们会希望直接在 4050 亿参数的模型上进行推理,因为据我们的估计,这样做的成本将比 GPT-4 低 50% 左右。
这对很多人来说显然是一个很大的差异。但这世界上真正新的东西是因为它是开源的,人们可以将模型蒸馏到任何他们想要的大小,用于合成数据生成,作为教师模型使用。
所以,我们对未来的愿景并不是说会有一个单一的东西。OpenAI 有一种愿景,他们会构建一个大 AI ,Anthropic 也有类似的愿景, Google 也是。但这从来不是我们的愿景。我们的愿景是应该有很多不同的模型。
每个创业公司、每个企业、每个政府都希望拥有自己的定制模型。而当封闭生态系统比开源系统好得多时,使用现成的封闭系统是更好的选择,因为即使你可以定制开源系统,性能之间仍然存在一些差距。但现在我们不再看到这种情况。
现在,开源基本上弥合了这一差距。你会看到模型的广泛扩散,人们现在有动力去定制和构建并训练适合他们需求的模型,将他们的数据训练到模型中。
因为像 Amazon 通过 AWS 或者 Databricks 这样的公司提供的一整套服务用于蒸馏和微调开源模型。我们与这些合作伙伴进行了很多特定的工作以实现这一目标。同时,还会有像 Grok 这样的公司,他们在超低延迟推理方面做了非常有趣的工作。
我非常期待将其交到他们手中,他们正在为推出而构建一些东西,这也将实现这一点。然后,还有一整套企业公司,像 Dell、Scale. AI 、Deloitte 或 Accenture,他们与世界各地的企业合作进行技术部署。
这些公司会帮助构建定制模型,无论是大型企业还是政府,很多公司希望拥有一个可以训练其定制数据的模型。但很多公司不想通过API将他们的数据发送到 Google 或 OpenAI 。这并不是因为这些公司有特别的隐私问题,而是出于类似于人们喜欢加密和 WhatsApp 的原因。
人们希望拥有一种设计上安全的架构,他们的数据可以保存在他们自己手中。会有一个围绕这些构建的完整市场。所以,我对所有这些都感到非常兴奋。但这次我们采取了更积极的立场,帮助构建生态系统,因为这是它增长并为每个人创造更大价值的方式。
Rowan Cheung
是的,这确实是一个大事。你们是如何教育开发者使用这些工具的?更广泛地说, Meta 是否有计划或策略来教育世界其他地方关于开源的重要性?
Mark Zuckerberg
是的,在 Llama-3.1 之前,我们的做法主要是这样的。Meta 投资于此的根本原因是我们希望确保我们可以获得领先的模型。由于我们在移动互联网历史上的一些经验,我们不希望处于必须依赖某个竞争对手提供这种基础技术的地位。所以我们为自己构建了它。
在 Llama-3.1 之前,我们本能地认为,如果我们将其开源,就会有一个社区围绕它成长,并实际上扩展其能力,使其对包括我们在内的每个人都更有价值。因为最终,这不仅仅是一项技术,它是一个生态系统。为了使它对我们来说成为一个有用的东西,必须有一个广泛的生态系统。
在 Llama-3.1 中,我们看到的一个重大变化是,我们不仅仅是为自己构建它,然后将其发布给开发者使用,这次我们采取了更加积极的立场,建立合作伙伴关系,确保有一个公司生态系统可以用模型做有趣的事情,并以我们不会做的方式服务开发者。我们不是公共云服务提供商,对吧?开发者市场不会来找我们构建他们的东西。但我们希望确保所有这些公共云都能够很好地进行这项工作。
这包括一些更基本的功能,比如托管模型和提供推理服务。但我们也希望确保一些新的功能能够实现,比如蒸馏和微调,因为这些在封闭模型中不太可能实现。所以我们必须与这些合作伙伴进行特定的工作来实现这一目标。同时,也会有一些公司,如 Grok ,他们在超低延迟推理方面做了非常有趣的工作。
我对 AI 的担忧实际上不是 Apple ,而是其他公司,担心这种封闭生态系统的发展。在某种程度上,我并不是在说他们是坏人,而是这种系统的物理和激励结构会推动你去限制某些事情。
如果生态系统像网络一样开发,但更加强大,它会更健康。因为在移动互联网的发展过程中,封闭模式获胜了, Apple 获得了最多的收益,虽然可能有更多的安卓手机,但 Apple 几乎获取了移动电话市场的所有利润。这存在一定的近期偏见,因为这些是长期的周期。
iPhone 于 2007 年推出,我们已经接近 20 年了,这是一个漫长的周期,但人们很容易忘记封闭模式并不总是获胜。如果回到 PC 时代,尽管很多人,尤其是使用 Linux 类比的人,可能不认为 Windows 是完全开放的,但相比 Apple 将操作系统与设备捆绑的方式,Windows 的开放生态系统更胜一筹。
我的希望是,下一代平台,包括 AI 和我们在增强和虚拟现实方面的工作, Meta 希望站在建立开放生态系统的一边。我们不仅希望建立一个封闭生态系统的替代品,还希望恢复行业状态,使开放生态系统成为领导者。
这是可能的,我们在 AI 、AR 和 VR 方面都在取得良好的进展。但这也是我个人和哲学上的一个关注点,因为我感受到的创造力限制在过去 10~15 年间是由于移动互联网封闭模式的发展。
我不想深入讨论这个点,但这确实是一个重要的议题。我们现在有了 Llama-3.1 的 4050 亿参数模型,它在一些关键基准测试中与最好的封闭模型竞争,甚至超过了一些封闭模型,这本身就很惊人。
Rowan Cheung
但在你的信中还提到, Llama-4 有望成为行业中最先进的模型。你对 Llama-4 有什么特别兴奋的地方吗?
Mark Zuckerberg
我们刚刚发布了 Llama-3.1 ,可能谈 Llama-4 还为时过早。我们已经建立了计算集群,准备了大量的数据,对架构有了一个大致的概念,并进行了大量的研究实验来最大化其性能。所以我确实认为 Llama-4 将是 Llama-3 的又一次大跃进。我们还有很多进展可以取得。
这是 Llama 的首次发布,还有很多我想做的事情,包括推出多模态模型,我们在这一点上遇到了一些不幸的挫折,但我们将在未来几个月内推出它们,尤其是在欧盟以外的地方。
现在谈 Llama-4 可能有点早,但它肯定会很棒。管理公司时,计划计算集群和数据轨迹不仅仅是针对 Llama-4 ,而是未来四五个版本的 Llama ,这确实是件有趣的事情。因为这些都是需要长期投资的事情,建设数据中心、配套的电力、芯片架构和网络架构等。
这个回答可能有点含糊,只是表达了一些一般的兴奋。但 Llama-3.1 至少应该有一周的时间让我们消化一下发布的内容,然后再谈未来。
Rowan Cheung
接下来的几周将是疯狂的,只因为 3.1 的发布。但听到 Meta 已经在为 Llama-4 做准备,仍然令人兴奋。在这个方面,你能否多谈谈你对 AI 的长期愿景以及未来可能会发生的事情?
Mark Zuckerberg
是的,我很高兴从技术和产品的角度来谈论这个问题,但既然我们已经谈论了很多模型方面的内容,那我就先从产品开始吧。我们的愿景是,应该有许多不同的 AI 和 AI 服务,而不仅仅是单一的 AI ,这也确实影响了我们的开源方法,并影响了我们的产品路线图。
Meta AI 目前表现相当不错,我的目标是在今年年底前使它成为世界上使用最广泛的 AI 助手,我们很有希望在几个月内达到这一里程碑。而且我们有能力和商业模式来构建世界上最先进的模型,并向所有人免费提供,这是一个巨大的优势。我们的所有应用程序都非常容易使用,所以我对目前的进展感到非常兴奋。这是我们所拥有的基本助手,这将是一件大事。
但更重要的是,我们的重点是让每个创作者和每个小企业都能创建自己的 AI Agent,使每个人都能在我们的平台上创建他们想要的 AI Agent。
如果你想想看,这些都是巨大的市场。世界上有数亿的小企业,非常重要的一点是,通过相对少量的工作,一个企业可以通过几次点击就能创建一个 AI Agent来进行客户支持、销售,并与所有客户沟通。
未来每个企业都会像现在有电子邮件地址、网站和社交媒体一样,拥有一个他们的客户可以交流的 AI Agent。
我们希望为这些企业实现这一点,这将会是数亿甚至数十亿的小企业 Agent。对于创作者来说也是同样的道理,我们的平台上有超过 2 亿人自认为是创作者,他们主要利用我们的平台来建立社区、发布内容,感觉这就像是他们工作的一部分。他们都有一个基本问题,就是一天的时间不够用,无法与他们的社区进行足够的互动。
同样,他们的社区通常希望能有更多的互动时间,但时间总是不够用。这将是一个巨大的突破,基本上每个创作者都可以从社交媒体上获取所有信息,训练这些系统以反映他们的价值观和业务目标,然后人们可以与之互动。这几乎就像是创作者创作的一个艺术品,人们可以以不同的方式与之互动。
这还不包括所有其他人将能够为自己创建不同的 AI Agent来做不同的事情。所以我们将生活在一个拥有数亿甚至数十亿不同 AI Agent的世界里,可能最终 AI Agent 的数量会超过世界上的人口,人们将以各种不同的方式与它们互动。这是产品愿景的一部分,显然其中有很多商业机会,这是我们希望赚钱的地方。
我们不会通过销售模型本身来赚钱,因为我们不是公共云公司。我们将通过构建最好的产品来赚钱,最好的产品的重要组成部分是拥有最好的模型,而围绕开源建立最好的生态系统将帮助我们做到这一点。这就是为什么所有这些都对我们来说是一致的,也是为什么这对我们构建高质量产品并取得最佳商业结果非常有价值。但这也是为什么这在哲学上是一致的。我
们不相信会有一个单一的 AI 产品或模型,每个人都使用。我们根本上相信拥有多样化的模型集,每个企业和个人都将希望拥有他们自己的东西,这将是非常有趣的,这也是让这个事情有趣的原因之一。
Rowan Cheung
是的,看到 Meta 将技术直接整合到产品中,并且向数十亿用户免费提供前沿 AI 模型,这是一个巨大的突破。在这个基础上,我有一个关于怀疑态度的最后一个问题。
在 20 世纪 90 年代,对互联网的怀疑态度无处不在,但最终反对它变得几乎是不合理的。现在关于 AI 的怀疑态度似乎也在经历类似的轨迹。你认为我们正处于这一早期阶段,并且会有一个时刻反对 AI 的态度会像今天反对互联网一样被视为不合理吗?你认为哪些因素将是改变这种看法的关键?
Mark Zuckerberg
人们有不同的方式来担忧某件事。我很清楚的是,互联网在成功之前经历了一次大泡沫破灭,所以所有对互联网持长远观点的人最终都是对的,但有时候事情的发展比你预期的要慢,你需要有信心坚持下去。这是我意识到的一点,因为我对 Llama-3 以及 Llama-4 、 Llama-5将带来的所有解锁感到非常兴奋,这将转化为更好的产品。
但现实是,很难提前知道某件事什么时候足够好,可以让数十亿人使用,然后准备好成为一个大生意。我们现在都在投入大量的资本来训练这些模型,所以人们可能会在相当长的一段时间内亏钱,但我不知道,也许这一切会更快发生,这很难说。
你更关心的是人们对其生计的担忧。在这方面,这也是开源方法、许多不同的个性化和定制化模型的重要原因之一。如果这一发展仅仅是由少数公司构建产品并从中受益,而人们只使用这些产品,虽然可能他们喜欢与 AI 助手交谈,这对他们有价值,但如果这没有在某种程度上帮助提升所有人的生活水平,那么最终会出现反弹。
在 Web 2.0 的发展过程中,我花了一些时间思考,在 AI 、AR 和 VR 等下一代技术中,如何不仅创建一个繁荣的产品集和经济生产力增长,还如何创建一个更好、更可持续的政治经济环境,让更多人感到他们从中受益并支持这一系统。
我们在社交媒体方面做得相对不错,但从世界的一些反馈和回应来看,在 AI 和其他新技术方面,我们需要做得更好,以缓解人们对这些技术对他们生计、工作和生活影响的担忧。
本文由人人都是产品经理作者【江天 Tim】,微信公众号:【有新Newin】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自采访截图
可以看到AI对就业的冲击是毫无疑问的,但我相信挑战相应的会带来机遇,科技从来不会因为谁而停下发展的脚步,这样看终身学习是个很重要的能力。