据报道,由于安全和微调方面的原因,OpenAI 的 "高级语音模式"(AVM)几经推迟,现在已向部分用户提供了阿尔法版本。
AVM 功能早在五月份就已宣布并演示过。它允许用户通过技术语音合成模块与 ChatGPT 人工智能模型进行实时对话。
熟悉这个概念的人可能还记得谷歌在 2018 年宣布其 "Duplex "人工智能服务将 "很快 "推出。在 IO 开发者大会上,该公司展示了一个人工智能系统,能够代表你给企业打电话,与人类实时预约。
谷歌称,其最大的想法是,人工智能将足够强大,能够处理随意的对话并确认正确的信息。
Duplex 项目最终关闭了,但它的遗产显然在 OpenAI 的 ChatGPT 中得以延续。
AVM 具有实时通信功能,可以模仿人与人之间的讨论。ChatGPT 会以自然流畅的类人语音回答用户的询问。用户可以中途打断聊天机器人的话,聊天机器人也能根据演示记录下用户所说的话。
该公司正在有限的阿尔法版本中推出这项功能,以便继续评估其功能和安全影响。虽然五月份的演示令人印象深刻,但也存在一些故障,不难想象该技术可能被滥用的场景。
根据 OpenAI 的说法,安全一直是公司最关心的问题。该公司在 X 上发布的一篇宣布推出该功能的文章中写道:
"我们用 100 多名外部红队人员测试了 GPT-4o 的语音功能,涉及 45 种语言。为了保护人们的隐私,我们对模型进行了训练,使其只能用预设的四种声音说话,我们还建立了系统来阻止不同于这些声音的输出。我们还实施了防护措施,阻止对暴力或受版权保护内容的请求。
据 OpenAI 称,AVM 的定时推广已经开始,并将继续 "滚动式 "增加用户。该公司预计,所有 Plus 用户都将在秋季使用该功能。
© 2025 DeFi.io