这个免费的 "推理 "人工智能模型打败了 OpenAI 的 o1--无需支付 20 美元月费

2025-01-14 20:50:44 UTC
这个免费的 "推理 "人工智能模型打败了 OpenAI 的 o1--无需支付 20 美元月费

先进的人工智能并不需要高昂的费用:加州大学伯克利分校的研究人员刚刚发布了一个开源的人工智能推理模型,其性能不亚于每月 20 美元的 ChatGPT 版本。

Novasky 团队是一个 "由加州大学伯克利分校天空计算实验室的学生和顾问领导的合作项目",他们完成了几个月前看似不可能完成的任务:他们创建了一个高性能人工智能推理模型,训练成本不到 450 美元。

传统的人工智能推理模型只是预测句子中的下一个单词,与之不同的是,所谓的 "推理模型 "旨在理解问题,分析解决问题的不同方法,并执行最佳解决方案。这就增加了这些模型的训练和配置难度,因为它们必须在整个问题解决过程中进行 "推理",而不仅仅是根据训练数据集预测最佳响应。

这就是为什么订阅运行最新 o3 推理模型的 ChatGPT Pro 每月需要 200 美元的原因--OpenAI 认为这些模型的训练和运行成本很高。

新的 Novasky 模型被称为 Sky-T1,与 OpenAI 的第一个推理模型 o1(又名草莓)相当,后者于 2024 年 9 月发布,用户每月需支付 20 美元。相比之下,Sky-T1 是一个能够在家用电脑上本地运行的 320 亿参数模型--只要你有一个强大的 24GB GPU,比如 RTX 4090 或更老的 3090 Ti。而且还是免费的。

我们说的可不是什么缩水版。Sky-T1-32B-Preview 在 AIME2024 数学问题上的准确率达到 43.3%,超过 OpenAI o1 的 40%。在 LiveCodeBench-Medium 中,它的得分是 56.8%,而 o1-preview 只有 54.9%。在其他基准测试中,该模型也保持了强劲的性能,在 Math500 问题上的得分高达 82.4%,而 o1-preview 为 81.4%。

这个时机再有趣不过了。最近,人工智能推理竞赛日趋白热化,OpenAI 的 o3 在通用智能基准测试中的表现超过了人类,引发了关于我们看到的是早期 AGI 还是人工通用智能的争论。与此同时,中国的 Deepseek v3 也在去年掀起了波澜,其性能超过了 OpenAI 的 o1,但使用的资源更少,而且还是开源的。

但伯克利的方法与众不同。该团队并不追求原始功率,而是专注于以尽可能低的成本向大众提供一个强大的推理模型,建立一个易于微调的模型,并在本地计算机上运行,而无需昂贵的公司硬件。

"值得注意的是,Sky-T1-32B-Preview 的训练费用不到 450 美元,这表明以低廉的价格高效地复制高级推理能力是可能的。Novasky 在其官方博客文章中说:"所有代码都是开源的。

目前,OpenAI 并不免费提供其推理模型,不过它确实免费提供了一个不太复杂的模型。

以低于 500 美元的价格对特定领域的推理模型进行微调的前景对开发者来说尤其具有吸引力,因为这种专用模型有可能在目标领域超越功能更强大的通用模型。这种经济高效的专业化为科学领域的重点应用开辟了新的可能性。

该团队使用 Nvidia H100 GPU,按照他们所谓的 "配方",仅用 19 个小时就完成了模型训练。训练数据看起来就像是人工智能挑战赛中的精选集。

"我们的最终数据包含来自 APPs 和 TACO 的 5K 编码数据,以及来自 NuminaMATH 数据集的 AIME、MATH 和 Olympiads 子集的 10K 数学数据。此外,我们还保留了来自 STILL-2 的 1k 科学和谜题数据。

数据集的多样性足以帮助模型灵活地思考不同类型的问题。诺瓦斯基使用另一个开源推理人工智能模型 QwQ-32B-Preview 生成数据,并对 Qwen2.5-32B-Instruct 开源 LLM 进行微调。结果产生了一个具有推理能力的强大新模型,这就是后来的 Sky-T1。

团队工作的一个重要发现是:人工智能模型还是越大越好。他们对较小的 70 亿和 140 亿参数版本进行了实验,结果显示只取得了适度的收益。结果表明,320 亿个参数才是最佳选择--足够大的参数可以避免重复输出,但又不至于庞大到不切实际。

如果你想拥有自己的模型版本,并击败 OpenAI o1,可以在 Hugging Face 上下载 Sky-T1。如果你的 GPU 性能不够强大,但仍想尝试一下,也有从 8 位一直降到 2 位的量化版本,这样你就可以用精度换速度,在你的土豆电脑上测试下一个最好的东西。

不过要注意:开发者警告说,"不建议用于大多数用途"。

编辑:安德鲁-海沃德

Source: decrypt.co

Related News

More News

© 2025 DeFi.io