击败99.9%的程序员?OpenAI o3突然发布

0 评论 220 浏览 0 收藏 3 分钟

在人工智能的浪潮中,OpenAI的最新力作o3模型系列以其卓越的性能和接近实现AGI(通用人工智能)的潜力,再次掀起了科技界的热议。o3模型不仅在图形逻辑推理基准上取得了破纪录的高分,更在全球知名的编码竞赛平台Codeforces上展现了超越前代o1的惊人实力。

一、从o1到o3,OpenAI的飞跃科技旋涡

经历了拖拖拉拉的12天技术分享直播活动,OPenAI终于在最后一天放出了大招。日前,OpenAI发布了下一代的推理模型o3,这是今年早些时候发布的o1推理模型的升级版本。

更准确地说,o3是一个模型系列——就像o1一样,同时有o3和o3-mini两个版本,后者是一款更小的精简版模型,针对特定任务进行了微调。

OpenAI声称,至少在某些条件下,o3模型可以接近实现AGI。

所谓AGI,即“通用人工智能”(artificial general intelligence)的缩写,泛指能完成人类所能完成的任何任务的人工智能。OpenAI对此有着自己的定义:“在最具经济价值的工作上胜过人类的高度自主系统”。

那o3有多强大呢?按照OpenAI的说法,o3模型在ARC-AGI图形逻辑推理基准上获得了破纪录的分数,低计算场景中,o3得分为75.7%,而在高计算测试中,它达到了87.5%——超过了标志着达到人类水平的门槛85%。

最值得关注的是,在全球著名的编码竞赛平台odeforces评分中,o3取得了2727的评分,而o1评分仅为1891。

猎豹移动&猎户星空董事长傅盛表示,伴随着OpenAI o3的发布,人人都是程序员的时代马上就要到来了,你再也不要因为不会Python、不会C++就不敢写程序,只要说出你的需求,大语言模型帮你写程序。

作者|贾桂鹏
本文由人人都是产品经理作者【科技旋涡】,微信公众号:【科技旋涡】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!