OpenAI 推出新的 "01 "模型,性能优于 ChatGPT-4o

2024-09-13 01:00:18 UTC
OpenAI 推出新的 "01 "模型,性能优于 ChatGPT-4o

这家人工智能开发商称,它正在为其产品名称 "重设计数器",因为其最新的一组模型在测试中表现出色。

OpenAI 推出了一个新的模型系列,并于周四在其付费的 ChatGPT Plus 订阅层级上提供,声称其在性能和推理能力方面有重大改进。

"我们推出了OpenAI o1,这是一个新的大型语言模型,经过强化学习训练,可以执行复杂的推理,"OpenAI在一篇官方博客文章中说,"o1在回答之前会思考。"人工智能行业的观察家们预计这家顶级人工智能开发商将部署一个新的 "草莓 "模型已有数周时间,不过正在开发的不同模型之间的区别并未公开披露。

OpenAI 将这个新的模型家族描述为一次大飞跃,以至于他们改变了惯用的命名方式,打破了 ChatGPT-3、ChatGPT-3.5 和 ChatGPT-4o 系列的命名方式。

"对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平,"OpenAI 说。"有鉴于此,我们将计数器重置回1,并将该系列命名为OpenAI o1。"

该公司指出,这些新模型运行的关键在于,它们在行动之前会 "慢慢 "思考,并使用 "思维链 "推理,使它们在执行复杂任务时极为有效。

值得注意的是,根据 Open AI 分享的人工智能测试基准--特别是 OpenAI 对被认为具有博士级复杂性的挑战进行的比较,即使是新产品系列中最小的型号,也在几个关键领域超过了顶级的 GPT-4o。

新发布的模型强调 OpenAI 所称的 "深思熟虑的推理",即系统需要更多的时间在内部研究其反应。这一过程旨在产生更深思熟虑、更连贯的答案,尤其是在推理繁重的任务中。

OpenAI 还公布了内部测试结果,显示其在编码、微积分和数据分析等任务中的表现优于 GPT-4o。不过,该公司透露,OpenAI 01 在创意写作等创造性任务方面的改进并不明显。(我们自己的主观测试表明,OpenAI 产品在这些领域落后于克劳德人工智能)。尽管如此,其新模型的结果还是得到了人类评估者的一致好评。

如前所述,新模型的功能是在推理过程中实施思维链人工智能流程。简而言之,这意味着该模型在提供最终结果(即用户最终看到的结果)之前,会使用分段方法逐步推理问题。

"o1模型系列采用大规模强化学习训练,利用思维链进行推理,"OpenAI在o1系列的系统卡中说道。"对模型进行训练,使其在回答问题前融入思维链,这有可能带来巨大的好处--同时也会增加因智能提高而产生的潜在风险。"

这种宽泛的断言为技术观察家们争论模型架构的真正新颖性留下了空间。OpenAI 并未澄清这一过程与基于标记的生成过程有何不同:是实际的推理资源分配,还是隐藏的思维链命令,又或者是两种技术的混合?

之前一个名为 Reflection 的开源人工智能模型曾尝试过类似的重推理的方法,但因缺乏透明度而受到批评。该模型使用标签来区分推理步骤,因此其开发者认为该模型比传统模型的输出有所改进。

在思维链过程中嵌入更多准则,不仅能使模型更加准确,还能减少越狱技术的使用,因为它有更多的时间和步骤来捕捉潜在的有害结果。

越狱社区在寻找绕过人工智能安全控制的方法方面似乎一如既往地高效,OpenAI 01 发布几分钟后,就有报道称首次成功越狱。

目前还不清楚这种慎重推理方法能否有效地扩展到需要快速响应时间的实时应用中。OpenAI 表示,它同时打算扩展模型的功能,包括网络搜索功能和改进的多模态交互。

随着时间的推移,该模型还将进行调整,以满足 OpenAI 在安全性、越狱预防和自主性方面的最低标准。

该模型原定于今天推出,但可能会分阶段发布,因为一些用户报告说,他们还不能对该模型进行测试。

根据 OpenAI 的公告,最小版本最终将免费提供,API 访问将比 OpenAI o1-preview 便宜 80%。但也别高兴得太早:目前每周只有 30 条信息可用于测试这种新模式的 01-preview 和 50 条 o1-mini,因此请明智选择您的提示信息。

Source: decrypt.co

Related News

More News

© 2025 DeFi.io