OpenAI 终于推出了 "高级语音模式"，可选择 ChatGPT 用户

2024-07-31 21:12:44 UTC | defi.io/keg

据报道，由于安全和微调方面的原因，OpenAI 的 "高级语音模式"（AVM）几经推迟，现在已向部分用户提供了阿尔法版本。

AVM 功能早在五月份就已宣布并演示过。它允许用户通过技术语音合成模块与 ChatGPT 人工智能模型进行实时对话。

还记得 Duplex 吗？

熟悉这个概念的人可能还记得谷歌在 2018 年宣布其 "Duplex "人工智能服务将 "很快 "推出。在 IO 开发者大会上，该公司展示了一个人工智能系统，能够代表你给企业打电话，与人类实时预约。

谷歌称，其最大的想法是，人工智能将足够强大，能够处理随意的对话并确认正确的信息。

Duplex 项目最终关闭了，但它的遗产显然在 OpenAI 的 ChatGPT 中得以延续。

AVM 具有实时通信功能，可以模仿人与人之间的讨论。ChatGPT 会以自然流畅的类人语音回答用户的询问。用户可以中途打断聊天机器人的话，聊天机器人也能根据演示记录下用户所说的话。

该公司正在有限的阿尔法版本中推出这项功能，以便继续评估其功能和安全影响。虽然五月份的演示令人印象深刻，但也存在一些故障，不难想象该技术可能被滥用的场景。

根据 OpenAI 的说法，安全一直是公司最关心的问题。该公司在 X 上发布的一篇宣布推出该功能的文章中写道：

"我们用 100 多名外部红队人员测试了 GPT-4o 的语音功能，涉及 45 种语言。为了保护人们的隐私，我们对模型进行了训练，使其只能用预设的四种声音说话，我们还建立了系统来阻止不同于这些声音的输出。我们还实施了防护措施，阻止对暴力或受版权保护内容的请求。

据 OpenAI 称，AVM 的定时推广已经开始，并将继续 "滚动式 "增加用户。该公司预计，所有 Plus 用户都将在秋季使用该功能。