Meta已在训练比Llama 3更强大的后继产品

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

Meta已在训练比Llama 3更强大的后继产品

AI新智能

2024-04-19

0 评论 3950 浏览 2 收藏

根据Meta公司首席人工智能科学家Yann LeCun的说法，今天发布的开源Llama 3人工智能模型只是一个开始。他表示，一个新的、更大规模的版本正在开发中。

周四上午，Meta发布了其最新的人工智能模型Llama 3，宣称这是有史以来最强大的开源模型，任何人都可以使用。

同一天下午，Meta的首席人工智能科学家Yann LeCun宣布，一个更强大的后继产品正在开发中。他暗示这款新模型有潜力超越当前世界上最优秀的封闭式AI模型，包括OpenAI的GPT-4和Google的Gemini。

Meta今天发布了两个版本的Llama 3，一个拥有80亿参数，另一个则有700亿参数。参数数量是行业术语，大致能表明模型的能力。LeCun表示，更大的模型正在研发中，其中最强大的模型参数超过4000亿，目前正在训练中。

LeCun在麻省理工学院举行的“想象力行动”会议上表示：“精调需要很长时间，但未来几个月将推出这些模型的多种变体。”目前尚不清楚何时会发布超过4000亿参数的模型。

Meta于周二推出了一款名为Meta AI的新助手，基于Llama 3，公司表示测试显示这些模型优于以往具有类似参数数量的开源模型。尽管像Google和OpenAI这样的大型AI开发商保持其技术的封闭，但LeCun预测开源AI模型将更快进步。理论上，他说，这将更快地推动AI向人类水平智能迈进。

LeCun指出，广泛的软件行业的观察显示开源技术最终将胜出。他说，开放的方法已经成为软件基础设施的主导，因为它允许更快地共享改进并更全面地审查代码。“更多人查看代码时，AI会更好，”他说。“基础设施需要是开源的——这样进步更快。”

Meta的开源AI战略已经加速了当前围绕生成性AI的热潮。该公司在2023年7月发布Llama 2模型时，为许多初创公司、研究人员和企业家提供了下载、实验和构建的更强大的AI模型。

OpenAI的GPT-4和Google的Gemini仅通过付费API提供，尽管Google在二月份提供了一个较小的模型Gemma供下载。还有少数其他公司选择加入Meta，发布强大的开源AI模型。

就在几周前，来自初创公司Databricks的一款新模型成为目前可用的最强大的开源变体。如果Meta报告的基准测试分数准确的话，Llama 3似乎更有能力。

LeCun还在周二承认，Meta的策略包括免费提供AI模型，这些模型的研发和计算资源对Meta来说代价高昂。Meta的创始人兼CEO马克·扎克伯格在1月份告诉CNBC，Meta计划在2024年投入数十亿美元购买GPU，用于训练机器学习算法。

同月他宣布，Meta的终极目标——与OpenAI和Google所宣称的相似——是开发所谓的人工通用智能，即可以完成任何和所有人类智能可以做的事情的机器。

扎克伯格今天在Instagram上解释说，Meta将把新的Meta AI助手整合到包括WhatsApp、Instagram、Facebook和Messenger在内的产品中。这款助手由Llama 3驱动。

Meta在其宣布Llama 3的博客文章中表示，公司重点改善了用于开发该模型的训练数据。公司表示，它使用的数据量是其前身Llama 2的七倍。一些人工智能专家指出，Meta发布的数据还显示，创建Llama 3需要巨大的能源来支持所需的服务器。

开源AI模型能力的增长使一些专家担心，这可能使开发网络、化学或生物武器更加容易，甚至可能对人类产生敌意。Meta已经发布了一些工具，公司称这些工具可以帮助确保Llama不会产生可能有害的话语输出。

什么是B端产品经理？和C端产品经理有什么区别？

B端产品经理中的B是Business，商业的意思，B端产品经理首先就要理解这个职位的重要性，要设计出更适合这个项目需求的产品方案，B最终产品经理在日常工作中...

查看详情 >

AI领域的其他人士表示，Meta的Llama模型并不像它们可以的那样开放。公司对模型的开源许可证施加了一些限制，限制了研究人员和开发人员可以构建的内容。

艾伦人工智能研究院的高级应用研究科学家卢卡·索尔达尼在Llama 3发布后的一份声明中表示：“看到越来越多的模型公开释放它们的权重是很棒的事情。”

他补充说：“但开放社区需要访问人工智能管道的所有其他部分——它的数据、训练、日志、代码和评估。这将最终加速我们对这些模型的集体理解。”

参与非营利开源AI项目EleutherAI的AI研究员斯特拉·比德曼表示，Meta对Llama 2的许可证限制了AI研究人员可以进行的实验，并补充说Llama 3的许可证看起来更加限制性。“Meta发布了权重，但它对你可以用它们做什么非常有限制，”比德曼说。

该模型的许可证的一部分规定，拥有“超过7亿月活跃用户”的公司必须从Meta寻求特殊许可——这显然是为了防止该项目帮助公司的最接近竞争对手。

即便如此，Llama 3似乎很可能引发一波新的AI实验热潮。开放AI模型库HuggingFace的CEO克莱门特·德朗格表示，开发者已经基于Llama 2创建了超过30,000个变种。“我确信我们也将看到基于Llama 3的新模型的大量涌现，”他说。“Meta的这一社区举措非常棒。”（Wired）

本文由人人都是产品经理作者【汪仔5037】，微信公众号：【AI新智能】，原创发布于人人都是产品经理，未经许可，禁止转载。题图来自 Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

AI新智能

一个致力于探索人工智能对商业世界和社会影响的平台。

42篇作品 93683总阅读量

百亿补贴，京东的良药还是毒药？

03-072858 浏览

深度拆解五大招聘APP的首页设计

02-1513641 浏览

成功B端产品经理的年终总结秘诀：掌握这几个技巧！

刚刚

抖音外卖，快一点还是慢一点？

07-243493 浏览

运营飞轮，让好产品“转动”起来

04-106905 浏览

“奖牌”狂赚5亿，Keep大梦初醒

02-107167 浏览

目前还没评论，等你发挥！

开发转产品的成功之路：我给你的3个建议

本专题的文章分享了情人节的营销思路。

逻辑图是用图标符号、说明文字以及连接线等，形象化地表达复数要素之间的相互作用关系。本专题的文章分享了如何绘制逻辑图。

专题

12531人已学习12篇文章

如何搭建私域模型？

现如今，越来越多的企业开始重视私域，很多的企业都对私域的发展进行了布局。本专题的文章分享了如何搭建私域模型。

专题

15612人已学习12篇文章

交互设计文档的撰写指南

本专题的文章分享了交互设计文档的撰写指南。

专题

14003人已学习12篇文章

解读4P营销理论

4P指产品（Product）、定价（Price）、渠道（Place）、宣传（Promotion）。本专题的文章分享了解读4P营销理论。

专题

14762人已学习13篇文章

用户行为分析指南

在产品的运营过程中，无论是产品、运营还是市场团队，都希望能清晰地了解用户的行为路径，通过用户行为分析，优化用户体验，实现更精准的运营和营销。

网站统计