OpenAI 的未来是什么?草莓计划、猎户座和 GPT 下一步

2024-09-04 00:57:59 UTC
OpenAI 的未来是什么?草莓计划、猎户座和 GPT 下一步

我们对挑战 OpenAI 能力极限的秘密人工智能项目的了解。

OpenAI 即将发布两个突破性的模型,它们可能会重新定义机器学习的格局。这两个项目的代号分别为 "草莓"(Strawberry)和 "猎户座"(Orion),旨在推动人工智能能力超越现有极限,尤其是在推理、解决问题和语言处理方面,让我们离人工通用智能(AGI)更近一步。

草莓"(Strawberry)以前被称为 "Q*"或 "Q-Star",它似乎不仅仅是一个聊天机器人,它的重点是展示人工智能推理能力的重大飞跃。熟悉该项目的消息人士告诉路透社或《The Information》等不同媒体,它在解决复杂数学问题和加强逻辑分析方面表现出了非凡的能力。

与此同时,Orion 被定位为 OpenAI 的下一个旗舰语言模型,有可能接替 GPT-4。它的设计目标是在语言理解和生成方面超越前者,并增加处理多模态输入的能力,包括文本、图像和视频。

这两个项目都受到了美国国家安全官员的关注,凸显了其潜在的战略重要性。尽管收入大幅增长,OpenAI 仍在继续筹集资金,这可能是由于开发和培训这些先进模型的成本很高。

尽管网上的各种猜测层出不穷,但 OpenAI 官方并未就草莓计划发表任何言论。不过,据说泄露的信息都集中在其复杂的推理能力上。

与提供快速反应的传统模型不同,据说草莓采用了研究人员所说的 "第二系统思维",能够花时间斟酌和推理问题,而不是预测更长的代币集来完成反应。据路透社报道,这种方法已经取得了令人印象深刻的成果,该模型在 MATH 基准--一系列高级数学问题--上的得分率超过了 90%。

草莓计划的另一项关键创新是其生成高质量合成训练数据的能力。这解决了整个人工智能开发过程中的一个关键挑战:用于训练模型的多样化、高质量数据的稀缺性。如果这是真的,Strawberry 不仅能增强自身能力,还能为 Orion 等更先进的模型铺平道路。

考虑到 OpenAI 已经收集了大量数据,而且现在用户中存在着不愿将自己的数据提供给人工智能训练者的隐私保护运动,这一功能可能会对未来人工智能模型的质量起到重要作用--就像现在有些用户使用稳定扩散生成的图像来训练自己的自定义模型一样。

不过,草莓的刻意处理方法可能会给实时应用带来挑战。据报道,OpenAI 的研究人员正在努力 "提炼 "草莓的能力--基本上降低其质量,以便消费者能以较低的计算成本进行大量推断。

即便如此,将草莓的技术整合到 ChatGPT 等面向消费者的产品中,可能会大大促进 OpenAI 训练新模型的方式。不过,OpenAI 有可能将草莓作为训练新模型的基础,而不是广泛提供给消费者。

猎户座项目(Project Orion)是 OpenAI 雄心勃勃的 GPT-4o 后继项目,旨在为语言人工智能设定新标准。OpenAI 日本公司首席执行官长崎忠雄(Tadao Nagasaki)最近的一次演讲表明,该项目可以命名为 GPT Next。利用 "草莓计划 "的先进技术,Orion 将在自然语言处理领域大显身手,同时向多模态功能扩展。

OpenAI 声称,这种飞跃不会是渐进式的。

"据IT Media 报道,长崎在日本举行的 KDDI SUMMIT 2024 上说:"即将推出的人工智能模型可能被称为'GPT Next',从过去的表现来看,它将比其前身进化近 100 倍。因此,我们希望尽快支持创建一个人工智能一体化的世界。"

用草莓产生的数据训练 Orion 将代表 OpenAI 的技术优势。不过,使用这一技术时应谨慎。研究人员已经证明,在过多的合成数据上训练后,模型会开始退化,因此找到草莓能让 Orion 变得强大而又不影响其准确性的最佳点,似乎是 OpenAI 保持竞争力的关键。

Orion 的原生多模态能力也是一项重大进步。据The Information 报道,该模型正在开发中,可以无缝集成文本、图像甚至视频输入和输出,为 ChatGPT 用户开辟了新的可能性,并使该公司与谷歌的 Gemini 直接竞争--后者可以处理长达 2 小时的视频输入。

这就是用户在使用 ChatGPT 或 OpenAI 的 API Playground 时将与之互动的模型。

开发 Orion 符合 OpenAI 更广泛的战略,即在日益拥挤的人工智能环境中保持竞争优势。随着 Meta 的 LLaMA-3.1 等开源模型,以及 Claude 或 Gemini 等先进模型的快速发展,Orion 基本上是 OpenAI 保持领先地位的努力方向。

Source: decrypt.co

Related News

More News

© 2025 DeFi.io