如果您愿意每月支付 200 美元,ChatGPT 将升级为私人助理

2025-01-23 22:42:03 UTC
如果您愿意每月支付 200 美元,ChatGPT 将升级为私人助理

OpenAI 的最新工具将其聊天机器人变成了一个虚拟助手,可以预订机票、订购披萨和处理琐碎的任务。

本周四,OpenAI 推出了一项名为 "操作员"(Operator)的新功能,可以让 ChatGPT 控制一个虚拟浏览器来执行现实世界中的任务,比如订餐或订机票。但到目前为止,它还只针对富人。

该工具目前只面向美国的专业用户(200 美元/月),是该公司首次涉足自主网页浏览领域。

它凸显了分级金融体系的出现,即支付更多费用的用户可以获得最好的人工智能功能。与此同时,付费较低的用户只能使用功能有限、性能较差的机型,可以说并不民主。

该系统通过 operator.chatgpt.com 运作,用户可以让 ChatGPT 处理各种在线杂务。

从 OpenAI 插件商店到 Rabbit 推出的大型行动模型,过去也有过类似的尝试。不过,它们对应用程序接口(API)的依赖使得设置起来既不方便又具有挑战性。

这套系统的不同之处在于它的工作方式。Operator 不像它的前辈那样依赖 API,而是控制一个基于云的浏览器,像人类一样点击按钮和填写表格。

操作员每次行动时,都会截图向你展示它在做什么。

例如,如果你需要预订一张比赛门票,人工智能就会打开自己的浏览器,进入一个特定的网站,查找相关比赛,并在要求你确认付款之前找到最佳选择。

它还会用可视化的方式向你展示它的决策过程。如果出现意外,还有一个 "控制 "按钮可以让人类抓住方向盘。

为了在其他公司失败的地方取得成功,OpenAI 不得不建立自己的人工智能模型,以便直观地理解网络浏览器显示的信息,并通过键盘和鼠标输入来控制操作。这个由 GPT-4o 支持的新模型被命名为计算机用户代理(CUA)。

这不仅仅是跟随脚本。人工智能可以阅读和理解网站布局,适应不同的设计,甚至处理意外弹出窗口或错误信息。

该系统还展示了一些令人印象深刻的派对技巧。把你乱七八糟的手写购物单的照片递给它,它不仅能用 GPT-Vision 读取,还能从你喜欢的杂货店里订购所有东西。

OpenAI 已与多家公司合作,以确保其平台上的流畅操作。

在预约乘车或订餐时,人工智能可以顺利地浏览 Uber 和 DoorDash 等服务,因为它已经预先配置了对这些服务界面的理解。

不过,对于不支持的网站,系统仍会尝试使用浏览器控制功能来完成任务。这就是 Operator 优于其他替代方案的地方。

与往常一样,OpenAI 分享了一些基准:它击败了其他最先进的模型,在 OSWorld(处理标准操作系统的熟练度)上的得分为 38.1%,而最好的竞争对手仅为 22%;在 WebArena(处理电子商务网站)上的得分为 58.1%,而竞争对手仅为 36.2%。

尽管如此,该团队强调,Operator 仍然是一个研究预览版,因此预计会出现错误和 bug。

一个潜在的症结可能会让注重安全的用户停顿一下:你需要信任 Operator,将你的登录凭证交给它。

云浏览器需要访问你的账户才能完成任何操作,而由于它与本地浏览器不兼容,因此使用远程网络浏览器登录,相信OpenAI不存储敏感数据的小指承诺,可能会让人觉得有点不妥。

该功能将很快在更大范围内推出,Plus 用户将是下一个受益者。开发者也不会被排除在外--OpenAI 计划在未来几周内通过其 API 发布 Operator,这有可能催生新一代人工智能自动化工具。

OpenAI 表示,除了云网页浏览控制外,还将有更多实例出现。该团队在演示过程中表示,他们还在努力扩大人工智能代理的范围,使其超越目前的通用助手。

编辑:Sebastian Sinclair 和 Josh Quittner

Source: decrypt.co

Related News

More News

© 2025 DeFi.io