继 2024 年创下历史新高之后,英伟达(Nvidia)将在 2025 年拉开大幕,推出一系列产品,巩固其在人工智能开发和游戏领域的主导地位。
首席执行官黄仁勋(Jensen Huang)在拉斯维加斯举行的 CES 上展示了从个人 AI 超级计算机到下一代游戏卡的新硬件和软件产品。
Nvidia 的最大亮点是DIGITS 项目是一个价值 3000 美元的个人人工智能超级计算机,它将 petaflop 的计算能力装进了一个桌面大小的盒子里。
这台机器围绕新的--到目前为止还是秘密的--GB10 Grace Blackwell 超级芯片打造,可以处理多达 2000 亿个参数的人工智能模型,同时从标准插座中汲取电力。
对于更繁重的工作负载,用户可以连接两个单元来处理多达 4050 亿个参数的模型。
在此背景下,最大的 Llama 3.2 模型(Meta 公司最先进的开源 LLM)拥有 4050 亿个参数,无法在消费级硬件上运行。
到目前为止,它需要大约 8 个 Nvidia A100/H100 超级芯片,每个芯片的成本约为 3 万美元,仅处理硬件的总成本就超过 24 万美元。
而两台 Nvidia 的新型消费级 AI 超级计算机只需 6000 美元,就能运行相同的量化模型。
"人工智能将成为各行各业各种应用的主流。通过Project DIGITS,格雷斯-布莱克韦尔(Grace Blackwell)超级芯片将来到数百万开发者身边,"Nvidia首席执行官黄仁勋(Jensen Huang)在一篇官方博文中表示。"将人工智能超级计算机放在每一位数据科学家、人工智能研究人员和学生的办公桌上,让他们有能力参与并塑造人工智能时代。"
对于那些喜欢技术细节的人来说,GB10 芯片是与联发科合作取得的一项重大工程成就。
该片上系统将Nvidia最新的GPU架构与20个通过NVLink-C2C互连的高能效ARM内核结合在一起。
每个 DIGITS 单元都拥有 128GB 的统一内存和高达 4TB 的 NVMe 存储。同样,根据上下文,迄今为止最强大的 GPU 每个都拥有约 24GB 的 VRAM(运行 AI 模型所需的内存),而 H100 超级芯片的起始 VRAM 容量为 80GB。
各家公司都在急于部署人工智能代理,Nvidia 也深知这一点,这也许就是它开发出 Nemotron 的原因:Nvidia NIIM 用于视频摘要和理解,Nvidia Cosmos 赋予 Nemotron 视觉能力--理解视觉指令的能力。
到目前为止,LLM 还只是基于文本的。不过,这些模型在以下指令方面表现出色:聊天、函数调用、编码和数学任务。
这些模型可通过 Hugging Face 和 Nvidia 网站获得,企业可通过公司的 AI Enterprise 软件平台访问。
同样,在 LLM 竞技场上,Nvidia 的 Llama Nemotron 70b 比 Meta 开发的原始 Llama 405b 排名更高。它还击败了不同版本的 Claude、Gemini Advanced、Grok-2 mini 和 GPT-4o。
Nvidia 的代理推动现在也与基础设施有关。该公司宣布与 LangChain、LlamaIndex 和 CrewAI 等主要代理技术提供商合作,在 Nvidia AI Enterprise 上构建蓝图。
这些可随时部署的模板可解决特定任务,使开发人员更容易构建高度专业化的代理。
一个新的 PDF-to-podcast 蓝图旨在与谷歌的 NotebookLM 竞争,而另一个蓝图则有助于构建视频搜索和摘要代理。开发人员可以通过新的 Nvidia Launchables 平台测试这些蓝图,该平台可实现一键式原型开发和部署。
Nvidia 将游戏方面的发布留到了最后,推出了备受期待的 GeForce RTX 5000 系列。旗舰产品 RTX 5090 拥有 920 亿个晶体管,每秒可进行 3,352 万亿次人工智能运算,是当前 RTX 4090 性能的两倍。整个系列采用第五代张量核心和第四代 RT 核心。
新显卡引入了 DLSS 4,通过使用 AI 生成每次渲染的多个帧,可将帧速率提升 8 倍。黄仁勋(Jensen Huang)说:"Blackwell,人工智能的引擎,已经为PC游戏玩家、开发者和创意人士带来了福音。""Blackwell融合了人工智能驱动的神经渲染和光线追踪技术,是自25年前我们推出可编程着色技术以来最重要的计算机图形创新。"
新显卡还采用了变压器模型来实现超分辨率,有望带来高度逼真的图形和更高的性能,而且价格也不便宜:RTX 5070 售价 549 美元,5070 Ti 售价 749 美元,5080 售价 999 美元,5090 售价 1999 美元。
如果你没有那么多钱,但又想玩游戏,也不用担心。
AMD 今天还发布了 Radeon RX 9070 系列。这些显卡基于全新的 RDNA 4 架构,采用 4 纳米制造工艺,配备专用的人工智能加速器,可与 Nvidia 的张量核心竞争。
虽然完整规格仍处于保密状态,但 AMD 最新的 Ryzen AI 芯片在峰值性能下已达到 50 TOPS。
遗憾的是,凭借其 CUDA 技术(Nvidia 的专有 AI 架构),Nvidia 仍然是 AI 应用的王者。
为了解决这一问题,AMD 已与惠普和华硕达成系统集成合作,到 2025 年,将有 100 多个企业平台品牌使用 AMD Pro 技术。
Radeon 显卡预计将于 2025 年第一季度投放市场,这将给 Nvidia 在游戏和 AI 加速领域带来一场有趣的战斗。
编辑:Sebastian Sinclair
© 2025 DeFi.io