ChatGPT 现在可以实时观看并与您互动

2024-12-13 17:19:50 UTC
ChatGPT 现在可以实时观看并与您互动

在等待了七个月之后,OpenAI 终于推出了 ChatGPT 的视频功能,与此同时,谷歌也推出了 Project Astra,Meta 也推出了自己的人工智能助手。

OpenAI 周四正式发布了 ChatGPT 承诺已久的视频功能,用户可以用手机对准物体进行实时人工智能分析。

在此之前,你可以输入文字、图表、语音或静态照片与 GPT 进行互动。本周四晚些时候发布的这项功能允许 GPT 实时观察你,并通过对话提供反馈。例如,在我的测试中,这个模式能够解决数学问题、提供食物食谱、讲故事,甚至还能变成我女儿的新闺蜜,在做煎饼时与她互动,通过不同的游戏给出建议并鼓励她学习。

就在发布前一天,谷歌展示了自己的人工智能助手,它采用了最新的双子座 2.0 技术,支持摄像头。Meta 也一直在玩这个沙盒,它自己的人工智能可以通过手机摄像头观看和聊天。

不过,ChatGPT 的新技巧并非人人都能使用。只有 Plus、Team 和 Pro 订阅用户才能使用 OpenAI 所谓的 "带视觉的高级语音模式"。Plus 订阅费为每月 20 美元,Pro 级订阅费为 200 美元。

"OpenAI 首席产品官凯文-威尔(Kevin Weil)周四在一段视频中说:"我们很高兴地宣布,我们将把视频引入高级语音模式,这样你就可以在与 ChatGPT 的对话中引入实时视频和实时屏幕共享。

该视频流是 "12 Days of OpenAI "活动的一部分,该活动将在连续多日内发布 12 个不同的公告。到目前为止,OpenAI 已经推出了面向所有用户的 o1 模式,发布了每月 200 美元的 ChatGPT Pro 计划,为定制模型引入了强化微调功能,发布了生成式视频应用 Sora,更新了画布功能,并通过科技巨头的苹果智能(Apple Intelligence)功能将 ChatGPT 发布到了苹果设备上。

该公司在周四的现场直播中展示了它的功能。我们的想法是,用户可以在与高级语音相同的界面上激活视频模式,并开始与聊天机器人进行实时互动。聊天机器人拥有出色的视觉理解能力,能够以较低的延迟提供相关反馈,让对话感觉自然。

实现这一目标并非一帆风顺。四月底,OpenAI 首次承诺 "在几周内 "实现这些功能,但由于在高级语音模式下未经女演员斯嘉丽-约翰逊(Scarlett Johansson)许可模仿其声音而引发争议,该功能被推迟。由于视频模式依赖于高级语音模式,这显然延缓了该功能的推出。

竞争对手谷歌也没有闲着。阿斯特拉项目(Project Astra)本周刚刚在安卓系统的 "可信测试者 "手中上线,承诺提供类似的功能:人工智能会说多种语言,可以使用谷歌的搜索和地图,并能记住长达 10 分钟的对话。

不过,这项功能目前还没有广泛使用,预计明年初会在更大范围内推出。谷歌还为其人工智能模型制定了更雄心勃勃的计划,让它们能够实时执行任务,展示视听互动之外的代理行为。

Meta 也在争取在下一个人工智能互动时代占有一席之地。其助手 Meta AI 于今年 9 月亮相。它展示了与 OpenAI 和谷歌新助手类似的能力,提供低延迟响应和实时视频理解。

不过,Meta 公司正致力于利用增强现实技术来推动其人工智能产品的发展,其 "低调 "的智能眼镜能够通过镜框中内置的小型摄像头来实现这些互动。Meta 称其为 "猎户座计划"(Project Orion)。

当前的 ChatGPT Plus 用户可以通过点击聊天栏旁边的语音图标,然后点击视频按钮来尝试新的视频功能。屏幕共享需要通过三点(又称 "汉堡包")菜单进行额外点击。

对于渴望尝试新视频功能的企业和教育 ChatGPT 用户来说,一月是个神奇的月份。至于欧盟用户?他们现在只能袖手旁观了。

编辑:安德鲁-海沃德

Source: decrypt.co

Related News

More News

© 2025 DeFi.io