GPT-4.5问世，情商爆表的AI，你见过吗？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

GPT-4.5问世，情商爆表的AI，你见过吗？

科技旋涡

2025-03-01

0 评论 1773 浏览 0 收藏

产品经理在不同的职业阶段，需要侧重不同的方面，从基础技能、业务深度、专业领域到战略规划和管理能力。

OpenAI发布了最新大模型GPT-4.5，标志着AI技术的又一重大突破。本文解析了GPT-4.5的核心能力提升，包括其在写作、编程、多语言支持以及减少幻觉现象方面的显著进步，同时也探讨了其在推理能力上的局限性。

北京时间2月28日凌晨，OpenAI举行直播活动，发布其最新大模型GPT-4.5，作为预览研究逐步向用户开放。

因为在今年年初AI产业发生的惊天巨变，所以要准确形容这款被OpenAI藏了许久的大模型颇具挑战。OpenAI在新闻稿中表示，这是公司有史以来最大、最好的聊天模型，在计算效率上较GPT-4提升超过10倍。

早期测试反馈显示，与GPT-4.5的互动体验更加自然流畅，其知识库覆盖范围更广，对用户意图的理解也更为深刻。此外，GPT-4.5在“情商”方面的表现也颇为亮眼，有助于改进写作、编程技能以及解决实际问题的能力，同时有效减少了“幻觉”现象的发生，提升了整体的可靠性。

那么，这个更具“情商”的GPT-4.5到底展现出什么样的实力?

一、GPT-4.5能力更强吗?

在直播活动中，OpenAI强调，GPT 4.5展现出更强的审美直觉与创造力，在写作和设计方面表现尤为出色。但他们也承认，作为一个非思维链模型，GPT 4.5已经不具备争夺“宇宙最强大模型”的实力了。

在介绍文档中，OpenAI表示，有两个提升人工智能能力的互补范式。

做到这三点挑战，产品经理只会不断升值

好的产品经理是很稀缺的，懂用户、懂商业、懂数据的产品经理走出互联网，依然是抢手货。相反，如果只做简单传话、低效执行、浅层思考的产品经理，恐怕走不过未来3-5年的洪流。

查看详情 >

一个是拓展推理，它能教会模型在反应之前先进行思考并产生思维链，从而解决复杂的STEM(Science科学、Technology技术、Engineering编程、Mathmatics数学)问题或逻辑问题。另一个是无监督学习，它能提高世界模型的准确性和直觉性。

其中，无监督学习，简单来说可以理解为让模型自己去知识的海洋里徜徉，自己学习到更多，从而变得更聪明，而非依赖人工标注。

在过去做法中，模型会结合人类反馈来改善响应与交互方式。彭博社援引知情人士称，去年OpenAI推出的Orion模型并未达到公司期望，在尝试回答未经训练的编码问题时就表现不佳。

OpenAI介绍，通过监督学习，GPT-4.5提高了其识别、建立联系和创造性洞察的能力，而无需推理。

根据OpenAI官方文档，GPT-4.5在SimpleQA中表现颇为亮眼。

SimpleQA是包含4000个事实性问题的数据集，用于测量模型在回答问题时的准确率。其中包含准确率和幻觉率两个维度。

在附录部分，OpenAI才放出GPT-4.5的基准测试分数。在反映科学、数学、多语言、编码的GPQA、AIME’24、MMMLU、SWE-Lancer基准测试上，GPT-4.5得分分别为71.4%、36.7%、85.1%、32.6%，超过GPT-4o的53.6%、9.3%、81.5%、23.3%，但部分得分低于o3-mini。