马斯克发布Grok 3,具备防“蒸馏”技术

0 评论 2309 浏览 1 收藏 8 分钟
B端产品经理要负责对目标行业和市场进行深入的分析和调研,了解客户的需求、痛点、期望和行为,找到产品的价值主张 🔗

近日,埃隆·马斯克的人工智能公司xAI发布了其最新旗舰模型Grok 3,这一模型不仅在性能上实现了显著提升,还引入了独特的防“蒸馏”技术以保护知识产权。本文将深入探讨Grok 3的技术亮点、应用场景以及其对未来AI发展的潜在影响。

埃隆·马斯克的人工智能公司xAI于周一晚些时候发布了其最新旗舰人工智能模型Grok 3,并为Grok的iOS和网络应用程序推出了新功能。

Grok是xAI对OpenAI的GPT-4和谷歌的Gemini等模型的回应,能够分析图像并回答问题,并为马斯克的社交网络X上的多个功能提供支持。Grok 3已经开发了数月,并曾乐观地计划于2024年发布,但未能按时推出。

周一的发布显得雄心勃勃。

xAI在孟菲斯的一个庞大数据中心中使用了大约20万个GPU来训练Grok 3。马斯克在X上发布的一篇帖子中声称,Grok 3的开发使用了比其前身Grok 2多10倍的计算能力,并采用了扩展的训练数据集,其中可能包括法庭文件。

“Grok 3比Grok 2强大了一个数量级,”马斯克在周一的直播演示中表示。“这是一个追求绝对真理的人工智能,即使这种真理有时与政治正确相冲突。”

Grok 3实际上是一个模型家族。Grok 3迷你版是一个较小的版本,它以牺牲一些准确性为代价,能够更快地回答问题。目前,并非所有Grok 3的模型及相关功能都已上线(部分功能仍处于测试阶段),但它们已于周一开始逐步推出。

xAI声称,Grok 3在包括AIME(评估模型在数学问题上的表现)和GPQA(使用博士级别的物理、生物和化学问题评估模型)的基准测试中超越了GPT-4o。

根据xAI的说法,Grok 3的早期版本还在Chatbot Arena中取得了具有竞争力的评分。

Chatbot Arena是一个众包测试平台,不同的AI模型相互竞争,用户会投票选择他们更喜欢的回答。总部位于伦敦和旧金山的Latent Labs将与制药行业合作,设计合成蛋白质,这些蛋白质可用于抗体治疗等药物中。

新推出的Grok 3模型有两种变体:Grok 3 Reasoning和Grok 3 mini Reasoning,它们能够像OpenAI的o3-mini和中国人工智能公司DeepSeek的R1这样的“推理”模型一样,仔细“思考”问题。推理模型会在给出结果之前尝试自我事实核查,从而避免一些通常会绊倒其他模型的陷阱。

xAI声称,Grok 3 Reasoning在多个流行的基准测试中超越了o3-mini的最佳版本——o3-mini-high,其中包括一个名为AIME 2025的较新的数学基准测试。

这些推理模型可以通过Grok应用程序访问。用户可以要求Grok 3进行“思考”,或者对于更复杂的问题,使用“超级大脑”模式,该模式会调用额外的计算能力来进行推理。xAI将推理模型描述为最适合数学、科学和编程问题。

马斯克表示,为了防止知识提取(distillation)——一种AI模型开发者从其他模型中提取知识的方法,Grok应用程序中会隐藏一些推理模型的“思考”过程。最近,DeepSeek被指控通过提取OpenAI模型的知识来创建自己的模型。

Grok的推理模型支持了Grok应用程序中的一个新功能——DeepSearch,这是xAI对OpenAI的深度研究工具(deepresearch)的回应。DeepSearch会在互联网和X平台上扫描信息,并在回答问题时提供一个摘要。

X平台的Premium+订阅用户(每月50美元)将首先获得对Grok 3的访问权限,而其他功能将被限制在一个名为SuperGrok的新计划中。根据泄露的信息,SuperGrok的定价为每月30美元或每年300美元,它将解锁额外的推理和DeepSearch查询,并提供无限的图像生成功能。

马斯克表示,未来——大约在一周后——Grok应用程序将增加“语音模式”,为Grok模型提供合成语音。在此之后的几周内,Grok 3模型将通过xAI的企业API提供,同时还将提供DeepSearch功能。

马斯克还提到,xAI计划在未来几个月内开源Grok 2。

“我们的总体方法是,当新版本完全推出后,我们会开源上一个版本。”他继续说道,“当Grok 3成熟且稳定时,可能在未来几个月内,我们就会开源Grok 2。”

两年前马斯克首次宣布Grok时,他将这款人工智能模型定位为大胆、未经筛选且反“觉醒”(anti-“woke”)——总体而言,它愿意回答其他AI系统不愿涉及的争议性问题。他在一定程度上兑现了这一承诺。例如,当被要求使用粗俗语言时,Grok和Grok 2会欣然从命,说出你可能从未从ChatGPT那里听到的色彩斑斓的言辞。

然而,在Grok 3之前,Grok模型在政治话题上有所保留,并不会跨越某些界限。事实上,一项研究发现,Grok在跨性别权利、多元化项目和平等问题上倾向于左倾立场。

马斯克将这种倾向归咎于Grok的训练数据——公开网页内容,并承诺要“将Grok调整得更接近政治中立”。目前还不清楚xAI是否已经实现了这一目标,以及可能会带来什么后果。(TechCrunch)

本文由人人都是产品经理作者【AI新智能】,微信公众号:【AI新智能】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!
专题
12071人已学习16篇文章
“老板记账”,这个词相信大家都不陌生,其实这个词就等同与我们现在的“消费金融”,就是把钱借给有消费需求的人用于消费,融合场景:消费时选择分期或借一笔钱去直接消费。
专题
40094人已学习22篇文章
不想当CEO的产品经理不是好运营
专题
48826人已学习16篇文章
看看别人家的PM是怎么做产品测试的。
专题
69430人已学习26篇文章
学会数据化运营能够提升效率,让你的工作事半功倍。
专题
14142人已学习12篇文章
本专题的文章分享了SaaS产品的商业模式和产品定价。