无论好坏,“推理”人工智能模型已成为一种趋势
“推理 AI 模型兴起,前景机遇挑战并存。” 在人工智能领域,推理模型成为新趋势。它们究竟为何备受关注?又面临着哪些困境与争议?未来发展之路在何方?
推理模型让AI走得更远,但它的成本却让人望而却步。
在OpenAI发布其所谓的推理模型o1之后,来自竞争对手AI实验室的推理模型如雨后春笋般涌现。
今年11月初,由量化交易员资助的AI研究公司DeepSeek发布了其首个推理算法DeepSeek-R1的预览。同月,阿里巴巴的Qwen团队也推出了他们声称是首个“开放”版的o1挑战者。
那么,是什么引发了这一波浪潮呢?其中一个原因,是寻找创新的方法来优化生成型AI技术。正如我的同事Max Zeff最近报道的那样,“暴力破解”式的技术,虽然曾经帮助模型规模化取得进展,但如今已经无法带来过去那样的提升。
AI公司面临着激烈的竞争压力,必须保持当前创新的步伐。根据估算,全球AI市场在2023年已达到1966.3亿美元,预计到2030年将增至1.81万亿美元。
OpenAI表示,推理模型能够“解决比以前更难的问题”,并代表了生成式AI发展的一个重大进步。但并不是每个人都确信推理模型是未来发展的最佳路径。
卡内基梅隆大学的机器学习副教授阿米特·塔尔沃卡(Ameet Talwalkar)表示,他对首批推理模型感到“相当印象深刻”。但他也同时提到,他“会质疑那些坚定声称知道推理模型会将行业带向何方的人”。
塔尔沃卡说:“AI公司有财务动机去描绘他们技术未来版本的光明前景。我们面临的风险是,过于狭隘地关注单一范式,这就是为什么更广泛的AI研究社区必须避免盲目相信这些公司所宣扬的炒作和市场营销,而是应该聚焦于切实的结果。”
推理模型的两个主要缺点是:一是成本高,二是能耗大。
以OpenAI的API为例,使用其推理模型o1,OpenAI收费每分析约75万字为15美元,每生成约75万字为60美元。这是OpenAI最新的“非推理”模型GPT-4o的3到4倍费用。
o1可以在OpenAI的AI驱动聊天平台ChatGPT上免费使用,但有使用限制。然而,OpenAI本月早些时候推出了一个更高级的o1版本——o1 Pro模式,年费高达2400美元。
加利福尼亚大学洛杉矶分校计算机科学教授盖伊·范登布罗克(Guy Van Den Broeck)告诉 TechCrunch:“大型语言模型推理的总体成本肯定不会下降。”
推理模型成本如此高的一个原因是,它们在运行时需要大量的计算资源。与大多数AI不同,o1和其他推理模型在生成内容时会进行自我检查,这帮助它们避免了通常困扰其他模型的陷阱。然而,这种自我验证也意味着它们往往需要更长的时间来得出结论。
OpenAI预计,未来的推理模型将“思考”数小时、数天甚至数周。尽管使用成本会更高,OpenAI承认,但这些推理模型可能带来的突破性成果,从新型电池到新型癌症药物很可能是值得的。
然而,今天的推理模型在价值上并不那么显而易见。非营利组织Ai2的研究员兼机器学习工程师Costa Huang指出,o1并不是一个非常可靠的计算器。社交媒体上的简单搜索也能找到许多o1 Pro模式的错误。
“这些推理模型是专门化的,可能在一般领域表现不佳,”Costa Huang告诉《TechCrunch》。“一些限制会比其他限制更早被克服。”
盖伊·范登布罗克认为,推理模型并没有真正进行推理,因此它们能成功解决的任务类型也有限。他表示:“真正的推理适用于所有问题,而不仅仅是那些在模型训练数据中可能出现的问题。这个挑战仍然是我们必须克服的主要问题。”
考虑到市场上强烈的动力推动推理模型的发展,我们可以合理推测它们会随着时间的推移不断改进。毕竟,不仅仅是OpenAI、DeepSeek和阿里巴巴在投资这一新兴的AI研究领域,风险投资家和来自相关行业的创始人也在聚集,共同展望一个由推理AI主导的未来。
然而,塔尔沃卡担心,大型实验室可能会“把控”这些进展。
“大型实验室出于竞争原因保持保密是可以理解的,但这种不透明性严重妨碍了研究社区与这些想法的互动,”他说。“随着越来越多的人朝这个方向努力,我预计[推理模型]将迅速发展。不过,虽然有些想法将来自学术界,鉴于此领域的经济激励,我预计大多数(如果不是全部)模型将由 OpenAI 等大型工业实验室提供。”(TechCrunch)
本文由人人都是产品经理作者【AI新智能】,微信公众号:【AI新智能】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!