埃隆-马斯克说他的新人工智能聊天机器人 "聪明得吓人"--而且几周内就能到货

2025-02-13 20:08:09 UTC
埃隆-马斯克说他的新人工智能聊天机器人 "聪明得吓人"--而且几周内就能到货

埃隆-马斯克(Elon Musk)声称,Grok-3 已经找到了 "你根本无法预料 "的解决方案,而且该人工智能聊天机器人具有未经审查的 "不正常模式"。

埃隆-马斯克(Elon Musk)宣布,其公司的新一代人工智能聊天机器人Grok离发布可能只有几周时间了,他形容Grok "聪明得吓人",并声称Grok在测试中的表现已经超过了其他所有人工智能模型。

这位 xAI 首席执行官是在 2 月 13 日于迪拜举行的世界政府峰会上说这番话的。

"马斯克说:"有时候,我觉得 Grok-3 聪明得有点吓人。"它能想出你根本想不到的解决方案--你知道,不是显而易见的解决方案。"

聊天机器人开发人员为 Grok-3 采用了独特的训练方法。Grok-3 没有像 ChatGPT 那样使用真实世界的数据,而是依赖于合成数据,并采用自我纠正机制来保持逻辑一致性。马斯克称,Grok-3 的准确度非常高,即使遇到不正确的信息,系统也会对数据进行反思,并删除与现实不符的内容。

训练 Grok-3 的计算需求非常庞大。据专家计算,它需要 2 亿个 GPU 小时,这让其中国竞争对手 DeepSeek-V3 的 270 万个小时相形见绌。它在 xAI 的 Colossus 超级集群上运行,该集群拥有 10 万个英伟达 H100 GPU,计算能力是其前身的十倍。马斯克称,即使不进行微调,基本模型的性能也优于Grok-2。

Grok-3 与马斯克的社交媒体平台 X 相集成,使其能够实时搜索社交媒体应用程序,而不是依赖于浏览网页。该系统可以从 X 中获取实时数据,并具有该公司所谓的 "Unhinged 模式"--根据 xAI 自己的常见问题解答,"Unhinged 模式""旨在引起反感、不恰当和攻击性"。

不过,该系统还没有完全准备好进入黄金时间。马斯克把剩下的工作比作装修房子:"最后的 5%,你要做干墙、油漆和装饰--尽管工作量不大,但它改变了房子。"

不过,它可能会比 OpenAI 的 GPT-4.5 更早发布,至少山姆-奥特曼(Sam Altman)说,GPT-4.5 可能会在几周或几个月后发布。

"可能(Grok-3)会在一两周内发布,"埃隆说。他没有说明新版本是公开发布,还是像当初发布 Grok-2 那样需要订阅。

人工智能领域的竞争已经加剧。虽然 ChatGPT 在 2024 年主导了市场份额,但中国的开源模型 DeepSeek-V3 却成为了有力的竞争者,尽管使用的资源要少得多,但性能却超过了 GPT-4o 和 Meta 的 Llama 3.1。

Grok 最初由 X Premium 提供,这大大限制了其可用性。后来,它向马斯克社交媒体平台的所有用户免费发布,现在又推出了一个新的独立网站,供其他所有人使用。

主要的人工智能公司正在将重点转向推理模型,开发能够思考具体问题的人工智能模型,并在经过漫长而广泛的思维推理链之后找到解决问题的方法。

早在 Reflection 70b 发布时,马特-舒默(Matt Schumer)就首次探索了这一想法。该模型经过训练,融入了 "思维链 "推理方法,尽管只是 Llama 70b 的微调版,但应该能在复杂任务中击败 Claude 3.5 Sonnet。

但就在几周后,OpenAI 发布了 "OpenAI o1 "推理模型,有效地应用了相同的概念。该模型标志着人工智能模型在逻辑能力方面的新标准,被视为 OpenAI 主导人工智能行业的护城河。

但 DeepSeek 的发布颠覆了这个世界。一个由中国研究人员组成的团队以极低的成本建立了一个比 o1 更好的模型,而且还将其开源。

从那时起,OpenAI 宣布其未来的模型将合并成一个万金油式的人工智能,抛开传统的 GPT 架构,首先专注于深度推理。

xAI 似乎正在追随市场的脚步。

"Grok-3具有非常强大的推理能力,"埃隆-马斯克说。

他没有透露有关该模型结构的更多信息。当前版本的Grok-2在LLM竞技场中排名第18位,远低于GPT、Claude、Gemini、Qwen或DeepSeek等竞争对手。

展望未来,xAI 计划将其计算基础设施扩展到 100 万 GPU,用于未来具有 "数万亿参数 "的模型。马斯克表示,其最终目标是通过日益复杂的模型向人工通用智能迈进。

编辑:安德鲁-海沃德

Source: decrypt.co

Related News

More News

© 2025 DeFi.io