Claude接管人类电脑编程，程序员沸腾！OpenAI反击，智能体大战一触即发

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

Claude接管人类电脑编程，程序员沸腾！OpenAI反击，智能体大战一触即发

新智元

2024-10-28

0 评论 512 浏览 0 收藏

16 分钟

AI接管人类电脑，未来已来！Claude自主操控电脑，从编程到科研无所不能，代表着万能API。另一边，OpenAI内部加急研发多智能体AI，已经有了雏形。

AI像人一样操作电脑，已然成为下一个前沿。

两天前，Anthropic进化版Claude 3.5 Sonnet首次实现自主操控电脑屏幕、移动光标、完成任务，惊艳了所有人。

当时，Anthropic开发者关系负责人称，「『计算机使用』是万能的API，它代表着全新人机交互范式的第一步」。

拿到测试资格的网友们，疯狂体验了这项「超能力」。

甚至，就连初创公司CEO对此赞不绝口，AI智能体已经来临，你现在可以建立AI军队为你工作。

在Anthropic加速布局智能体未来同时，OpenAI似乎也感受到了紧迫感。外媒最新爆料称，OpenAI内部正开发新品来自动化复杂的软件编程任务。

恰在昨天，OpenAI研究科学家、德扑之父在TED活动中表示，「自己对构建o1失去信心，正在OpenAI组建多智能体团队」。

这意味着，一场全新的竞赛即将开始，AI不再仅仅是对话生成，而应该去执行和操作。

01 Claude接管人类电脑，科研求职编码一键通

那些上手Claude计算机使用能力的开发者们，根本停不下来创作。

从复杂的编码任务到深入研究，再到收集「零散」的信息，许多令人惊叹的典型案例诞生了。

毕竟是自家首发的，Anthropic开发者关系负责人Alex Albert先了打个样。

他先用Claude计算机和bash工具，在线下载一个随机数据集，然后安装sklearn，在数据集上训练一个简单的分类器。

最后，在网页上就得到了分类器结果。

这些过程，不到5分钟的时间就完成了。其中用到的提示，他也贡献出来了：

Go to https://data.gov, find an interesting recent dataset, and download it. Install sklearn with bash tool write a .py file to split the data into train and test and make a classifier for it. (you may need to inspect the data and/or iterate if this goes poorly at first, but don’t get discouraged!). Come up with some way to visualize the results of your classifier in the browser.

一位开发者已经开始让Claude帮自己自主做科研了。

验证「你是不是人」，Claude可以代劳了。

想要Claude控制你的电脑，只需要：

pip install open-interpreteri
nterpreter –os

搜索YouTube视频，并跳过广告。

Claude一顿操作猛如虎，以后视频内置广告，通通交给它了。

打工人求职申请表填写，Claude也能胜任。这不，下面这位开发者小哥已经让AI自动申请Anthropic职位了。

进化版（左）和旧版（右）Claude 3.5 Sonnet在「我的世界」中构建的样子，令人印象深刻。

新升级后的Claude 3.5 Sonnet将如何影响「多智能体社会」的进步？

智能体研究初创公司Altera Al给出了答案，新模型是对长时间自主性的最大升级。我们的25个智能体在「我的世界」中合作，在20分钟内收集了超过40%的不同物品。

2. 分析工具

顺便提一句，Claude今天还重磅推出了可以编写和运行代码「分析工具」，为1024开发者们送上大福利。

目前，这一功能已在Claude中上线。

假设让Claude绘制销售渠道进展的直观图，它能自主分析数据写代码，并给出要求的可视化图。

然后，你可以在Artifacts中，可以详细查看细分项的数据。

二、AI智能体竞赛打响，Anthropic抢跑

虽然计算机使用工具并不完美，但它代表了Anthropic在AI中的一种愿景：

让Claude像人一样，看懂屏幕自主操作现有软件，完成各种复杂的任务。

这项能力背后的工作原理是：Claude先对屏幕截图，确定需要采取的行动，然后执行这些行行动。然后，再次截图决定下一步应该做什么。

畅想一下，如果智能体能够直接查看屏幕内容而无需依赖辅助功能，或查看底层代码的AI软件，可能会开启大量新机遇。

比如，当你搭建网站时，如果按钮中的文字意外超出按钮边界，AI智能直接看到后修复了这个问题，就省去了查看底层代码倒推步骤。

再举个栗子，当前网站制作者，已经非常巧妙地隐藏网站上广告的HTML代码。

这使得基于AI的广告拦截软件更难分析代码，并确定需要删除什么来去除广告。

但是，能够直接看到广告本身的「计算机使用智能体」会发现这项任务容易得多。

不过，这项技术带来弊端首先是「截图操作」成本太高，而且AI往往会假设它的操作已经成功执行。

「当它获取新的截图时，它已经不知道自己在操作流程中处于哪个阶段了」

另一方面，就是隐私问题了。

此前，已经有公司禁止员工使用ChatGPT、GitHub Copilot等编程工具，害怕不小心向模型开发商泄露专有信息或代码。

03 OpenAI急了，加码AI年底上新

在劲敌Anthropic连连发布重压下，OpenAI其实早已开启了新的布局。

还记得几天前，Sam Altman突然冒泡，「下个月是ChatGPT的第二个生日，我们应该送它什么生日礼物呢」？

当时，一大波网友写下自己的愿望清单。就在刚刚，有一条被传疯了的报道称，OpenAI计划在12月，解禁新一代大模型，代号为Orion。根据爆料，Orion将使用o1合成的数据进行训练，并会在ChatGPT两周年前后发布。但与GPT-4o和o1不同的是，它最初不会通过ChatGPT上线，而是先授予与OpenAI密切合作的公司访问权限（比如微软），方便他们构建自己的产品和功能。不过，网友们的「美梦」还没做多久，Altman就站出来辟谣了：通通都是fake news！