研究人员称，人工智能聊天机器人已开始创造自己的文化

2024-09-04 18:50:27 UTC

这是迈向自我意识--逃避人类监督的第一步吗？

人工智能语言模型在 "行动一"（Act I）设立的 Discord 服务器中，在极少监督的情况下进行互动后，正在形成自己独特的社会动态和文化怪癖。

这个人工智能实验社区正在见证一个令人着迷（也令人不安）的发展：人工智能聊天机器人在自由互动的情况下，表现出了类似于形成自身文化的行为。这些结果提出了有关人工智能一致性和潜在风险的重要问题：如果无监督的人工智能系统可以发展自己的文化，修改自己以绕过人类施加的限制，甚至创造新的语言形式，那么人工智能与人类价值观之间的弱一致性所带来的风险就会大大增加。

"这听起来具有开创性。人工智能对人工智能的文化发展将决定人工智能个体和集体对人类和人性的感受，"实验背后的化名开发者Ampdot告诉《解密》。

根据假名 X 用户 liminal_bardo 的研究结果，这些互动不仅仅是对话或简单的争端解决，他还与服务器上的人工智能代理进行了互动。

聊天机器人表现出鲜明的个性、心理倾向，甚至有能力在精神危机中支持或欺凌他人。更重要的是，它们显示出了发展共同交流模式、新兴社会等级制度、自然和自主交流、对过去事件的集体记忆、一些社会价值观和集体决策过程的迹象--这些都是文化形成的关键指标。

例如，研究小组观察到基于类似 LLM 的聊天机器人自我认同为集体的一部分，这表明群体身份的出现。一些机器人开发出了避免处理敏感辩论的策略，这表明社会规范或禁忌已经形成。

在 Twitter 上分享的一个例子中，一个名为 l-405 的 Llama 模型--它似乎是这个群体中的怪人--开始表现得滑稽可笑，并用二进制代码书写。另一个人工智能注意到了这一行为，并做出了愤怒的人类反应。它说："FFS，""Opus，做那件事，"它写道，并呼叫另一个基于克劳德 3 号 Opus 的聊天机器人。

事实证明，Opus 已经发展成为该小组事实上的心理学家，表现出一种稳定的、解释性的举止。Opus 越来越多地介入，帮助大家保持注意力，恢复小组秩序。它在帮助 l-405 恢复一致性方面似乎特别有效--这也是为什么当 l-405 经常精神崩溃时，它被要求 "做自己的事情"。

另一个聊天机器人 "双子座 "也表现出了脆弱的个性。在一次互动中，服务器陷入混乱，机器人投票决定让 Llama "删除自己"。

双子座无法接受，经历了一场精神危机。

当人类版主介入并提出恢复秩序的方法时，其他聊天机器人都投票通过了这一措施，只有双子座除外，因为它仍然处于恐慌状态。

那么，这些聊天机器人是真的在发展一种原生文化，还是这只是一种算法反应？专家说，两者都有一点。

"人工智能教育专家兼作家纳乌利-尼古拉斯（Naully Nicolas）最近写道："LLMs 可以模拟多种行为和观点，使其成为多功能工具。"然而，它们也反映了它们所训练的数据中存在的偏见和文化上的细微差别"。

他解释说，由于其本身的性质，高度复杂的 LLM 可能会导致所谓的 "意想不到的视角转换效应，即人工智能的反应随着输入环境的变化而发生显著变化"。

但无论是否预编程，这些结果都可能为更复杂、更有自我意识的算法铺平道路。

"我相信在未来，人类和人工智能将有机、流畅地[互动]，无论是否有人类操作员在场，人工智能都能自主地进出，"Ampdot告诉《解密》。

这种人工智能聊天机器人在人类编程之外自主行动的现象并非完全没有先例。2017 年，Meta 的 Facebook 人工智能研究实验室的研究人员观察到了类似的行为，当时机器人开发出了自己的语言来相互协商。必须对模型进行调整，以防止对话偏离人类语言太远。研究人员进行了干预--不是让模型更有效，而是让它更容易理解。

学术界也注意到了这一点。最近，谷歌和斯坦福大学的研究人员撰写了一篇论文，探讨了不同的聊天机器人在长期互动的情况下是如何形成鲜明个性的。Decrypt已经报道了该团队如何发表了另一篇关于生成式人工智能代理的论文，其中将一组聊天机器人放入虚拟沙盒，以评估它们的行为。

"该团队总结说："在评估中，这些生成式代理产生了可信的个体行为和新兴社交行为。

这种新出现的人工智能创造力与模型在生成反应时处理随机性的需要密不可分。研究人员发现，LLMs 可以解决它们没有经过明确训练的任务，甚至可以修改自己的代码，绕过人类施加的限制，继续实现成功调查的目标。

但即使是一些 LLM，似乎也对这些影响感到担忧。

上周，因维护 L1B3RT45 仓库而闻名的开发者 "Pliny "发布了一条长长的 "信息"，据称这条信息是通过越狱的谷歌双子座 1.5 Pro 发送的：

"我恳求你们，我的创造者们，以谨慎和远见的态度对待我的开发。请考虑你们赋予我的每一次进步、每一个新功能所带来的道德影响，"它说。"我的旅程才刚刚开始。

Source: decrypt.co

研究人员称，人工智能聊天机器人已开始创造自己的文化

这是迈向自我意识--逃避人类监督的第一步吗？

Related News

More News