人工智能初创公司Hugging Face的联合创始人兼首席科学官托马斯-沃尔夫(Thomas Wolf)表示,小型而非大型语言模型将被用于包括 "下一阶段机器人技术 "在内的各种应用。
"沃尔夫在今天于里斯本举行的网络峰会(Web Summit)上发言时说:"我们希望在更智能的机器人中部署模型,这样我们就可以开始让机器人不仅出现在流水线上,而且出现在野外。 但他说,实现这一目标需要低延迟。"沃尔夫补充说:"你不能等上两秒钟,这样你的机器人就能理解发生了什么,而我们能做到这一点的唯一方法就是通过小型语言模型。
小型语言模型 "可以完成很多我们认为只有大型模型才能完成的任务,"沃尔夫说,并补充说,它们还可以部署在设备上。"他说:"如果你考虑到这种游戏规则的改变,你可以让它们运行在你的笔记本电脑上。"未来甚至可以让它们在智能手机上运行。
最终,他设想让小型语言模型 "在我们拥有的几乎所有工具或设备上运行,就像今天我们的冰箱连接到互联网一样"。
该公司今年早些时候发布了SmolLM语言模型。沃尔夫说:"我们并不是唯一一家。"他补充说:"今年以来,几乎所有开源公司都在发布越来越小的模型。"
他解释说:"对于很多非常有趣的任务来说,我们不需要一个可以解决黎曼猜想或广义相对论的模型,我们需要的是用人工智能来实现自动化。"相反,一些简单的任务,如数据整理、图像处理和语音,都可以使用小型语言模型来完成,并在速度上获得相应的优势。
他说:"Hugging Face 的 LLaMA 1b 模型今年达到 10 亿参数的性能,"与去年 100 亿参数模型的性能相当,甚至更好。"因此,你有一个小10倍的模型,却能达到大致相似的性能。
"沃尔夫说:"我们在大型语言模型中发现的很多知识实际上都可以转化为小型模型。他解释说,该公司在 "非常具体的数据集 "上训练这些模型,这些数据集 "稍微简单一些,但有一些为该模型量身定制的适应形式"。
他说,这些调整包括 "非常微小的神经网络,你把它们放在小模型里"。"他将这一过程比喻为 "为你要做的特定任务戴上一顶帽子。我戴上烹饪的帽子,我就是一个厨师。
沃尔夫说,未来人工智能领域将分为两大趋势。
"他说:"一方面,我们会有一个巨大的前沿模型,这个模型会越来越大,因为我们的最终目标是利用人工乐虎国际手机版下载完成人类无法完成的事情,比如新的科学发现。在人工智能的长尾应用中,这项技术将 "被嵌入到各个角落,就像我们今天的互联网一样"。
编辑:Stacy Elliott
© 2025 DeFi.io