无论好坏，“推理”人工智能模型已成为一种趋势

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

无论好坏，“推理”人工智能模型已成为一种趋势

AI新智能

2024-12-17

0 评论 336 浏览 0 收藏

产品经理的核心价值是能够准确发现和满足用户需求，把用户需求转化为产品功能，并协调资源推动落地，创造商业价值

“推理 AI 模型兴起，前景机遇挑战并存。” 在人工智能领域，推理模型成为新趋势。它们究竟为何备受关注？又面临着哪些困境与争议？未来发展之路在何方？

推理模型让AI走得更远，但它的成本却让人望而却步。

在OpenAI发布其所谓的推理模型o1之后，来自竞争对手AI实验室的推理模型如雨后春笋般涌现。

今年11月初，由量化交易员资助的AI研究公司DeepSeek发布了其首个推理算法DeepSeek-R1的预览。同月，阿里巴巴的Qwen团队也推出了他们声称是首个“开放”版的o1挑战者。

那么，是什么引发了这一波浪潮呢？其中一个原因，是寻找创新的方法来优化生成型AI技术。正如我的同事Max Zeff最近报道的那样，“暴力破解”式的技术，虽然曾经帮助模型规模化取得进展，但如今已经无法带来过去那样的提升。

什么是B端产品经理？和C端产品经理有什么区别？

B端产品经理中的B是Business，商业的意思，B端产品经理首先就要理解这个职位的重要性，要设计出更适合这个项目需求的产品方案，B最终产品经理在日常工作中...

查看详情 >

AI公司面临着激烈的竞争压力，必须保持当前创新的步伐。根据估算，全球AI市场在2023年已达到1966.3亿美元，预计到2030年将增至1.81万亿美元。

OpenAI表示，推理模型能够“解决比以前更难的问题”，并代表了生成式AI发展的一个重大进步。但并不是每个人都确信推理模型是未来发展的最佳路径。

卡内基梅隆大学的机器学习副教授阿米特·塔尔沃卡（Ameet Talwalkar）表示，他对首批推理模型感到“相当印象深刻”。但他也同时提到，他“会质疑那些坚定声称知道推理模型会将行业带向何方的人”。

塔尔沃卡说：“AI公司有财务动机去描绘他们技术未来版本的光明前景。我们面临的风险是，过于狭隘地关注单一范式，这就是为什么更广泛的AI研究社区必须避免盲目相信这些公司所宣扬的炒作和市场营销，而是应该聚焦于切实的结果。”

推理模型的两个主要缺点是：一是成本高，二是能耗大。

以OpenAI的API为例，使用其推理模型o1，OpenAI收费每分析约75万字为15美元，每生成约75万字为60美元。这是OpenAI最新的“非推理”模型GPT-4o的3到4倍费用。

o1可以在OpenAI的AI驱动聊天平台ChatGPT上免费使用，但有使用限制。然而，OpenAI本月早些时候推出了一个更高级的o1版本——o1 Pro模式，年费高达2400美元。

加利福尼亚大学洛杉矶分校计算机科学教授盖伊·范登布罗克（Guy Van Den Broeck）告诉 TechCrunch：“大型语言模型推理的总体成本肯定不会下降。”

推理模型成本如此高的一个原因是，它们在运行时需要大量的计算资源。与大多数AI不同，o1和其他推理模型在生成内容时会进行自我检查，这帮助它们避免了通常困扰其他模型的陷阱。然而，这种自我验证也意味着它们往往需要更长的时间来得出结论。

OpenAI预计，未来的推理模型将“思考”数小时、数天甚至数周。尽管使用成本会更高，OpenAI承认，但这些推理模型可能带来的突破性成果，从新型电池到新型癌症药物很可能是值得的。

然而，今天的推理模型在价值上并不那么显而易见。非营利组织Ai2的研究员兼机器学习工程师Costa Huang指出，o1并不是一个非常可靠的计算器。社交媒体上的简单搜索也能找到许多o1 Pro模式的错误。

“这些推理模型是专门化的，可能在一般领域表现不佳，”Costa Huang告诉《TechCrunch》。“一些限制会比其他限制更早被克服。”

盖伊·范登布罗克认为，推理模型并没有真正进行推理，因此它们能成功解决的任务类型也有限。他表示：“真正的推理适用于所有问题，而不仅仅是那些在模型训练数据中可能出现的问题。这个挑战仍然是我们必须克服的主要问题。”

考虑到市场上强烈的动力推动推理模型的发展，我们可以合理推测它们会随着时间的推移不断改进。毕竟，不仅仅是OpenAI、DeepSeek和阿里巴巴在投资这一新兴的AI研究领域，风险投资家和来自相关行业的创始人也在聚集，共同展望一个由推理AI主导的未来。

然而，塔尔沃卡担心，大型实验室可能会“把控”这些进展。

“大型实验室出于竞争原因保持保密是可以理解的，但这种不透明性严重妨碍了研究社区与这些想法的互动，”他说。“随着越来越多的人朝这个方向努力，我预计[推理模型]将迅速发展。不过，虽然有些想法将来自学术界，鉴于此领域的经济激励，我预计大多数（如果不是全部）模型将由 OpenAI 等大型工业实验室提供。”（TechCrunch）

本文由人人都是产品经理作者【AI新智能】，微信公众号：【AI新智能】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App