人工智能公司 Synthesia 推出数字视频头像--看看它们如何工作

2024-08-08 23:30:26 UTC | defi.io/pbn
人工智能公司 Synthesia 推出数字视频头像--看看它们如何工作

创建个人头像可以简化视频创作,也可以只是为了好玩--但有防止滥用的防护栏。以下是我们的看法。

你是否曾经想要一个数字双胞胎?或者害怕重新录制一系列视频?就像科幻故事情节一样,总部位于伦敦的合成媒体生成开发商Synthesia推出了一项服务,让客户能够创建自己的数字视频,用于社交媒体和营销活动。

Synthesia 在周三的一次直播中首次宣布推出个人头像(Personal Avatars)。Synthesia 声称,这些头像只需用网络摄像头或手机拍摄两分钟的视频就能生成--不过我发现创建这些头像需要更长的时间。

该公司称,其个人人工智能头像可以用来制作员工培训视频、产品说明、销售和营销材料,或与客户互动。对企业来说,这样做的好处是,可以使用同一个人工智能头像制作这些不同的视频,而无需重新录制演员或员工的全新真人视频。

不过,这也有一定的局限性,下面我将详细介绍。

Synthesia 意识到,创建高保真真人复制品的能力可能会被滥用于恶意或欺骗目的。Synthesia 告诉Decrypt,它通过遵循三个原则来防止自己的技术被用于创建人工智能生成的深度假人:同意、控制和协作。

"Synthesia公司事务和政策主管亚历山德鲁-沃伊卡(Alexandru Voica)说:"未经他人明确同意,我们绝不会创建人工智能化身。"我们的平台为用户提供了一个安全的环境,确保他们的数据安全,他们可以控制自己的头像,并通过在创建时对内容进行审核,最大限度地减少滥用。"

Voica 指出,在头像生成开始之前,用户会被要求同意 Synthesia 有限公司及其供应商收集、使用、存储和披露他们的视频和音频记录,"以验证提交的个人头像"。

Voica 表示,Synthesia 还与业界同行、政策制定者等合作,为负责任地使用人工智能制定最佳实践。

"未经同意的深度伪造是网上有害内容的最大来源,"Voica 说。"由于 Synthesia 头像在未经其所代表的人类明确同意的情况下无法制作,因此我们不从事未经同意的深度伪造业务,这极大地限制了我们的平台和个人头像被滥用的可能性。

当被问及 Synthesia 是否不允许使用个人头像或一般的头像时,Voica 说,公司使用先进的技术过滤器和人工内容审核来确保 Synthesia 不被用于为创建不恰当或有害的内容提供便利。

"Voica 告诉Decrypt:"当有人试图制作视频时,该内容将在生成之前通过我们的内容审核工作流程。"如果发现违反了我们的政策,就永远不会创建视频。屡犯或严重违规者还可能导致其账户被禁用。"

要开始使用,用户必须创建一个 Synthesia 帐户。个人头像分为 "入门级"、"创建级 "和 "企业级"。入门级 "和 "创作者 "账户的年度订购费分别为每月 18 美元和 59 美元。寻求企业许可的企业必须联系 Synthesia 确定价格。

我的 MacBook Pro 比我的 Windows 11 PC 运行得更好,两者都使用了 Brave 浏览器。准备就绪后,Synthesia 会询问你是想直接从平台录制还是上传视频。我选择了录制。

根据 Synthesia 的介绍,个人化身是通过一种名为自动对齐的先进循环技术创建的,这种技术可以确定化身何时在说话,并使肢体动作反应更灵敏。个人化身可用的语言包括英语、德语、法语、西班牙语、阿拉伯语、克罗地亚语、菲律宾语、希腊语、印地语、意大利语、罗马尼亚语、俄语、土耳其语和乌克兰语。

在录音前,Synthesia 建议使用安静、光线充足的环境,在段落之间暂停,不要遮住脸部,使用自然的肢体语言,态度积极,面带微笑。

根据我的使用经验,该工具还建议确保摄像头不要离得太近,这样你在画面中就会显得较小。如果你决定上传视频而不是使用录音机,请使用麦克风以提高音频质量。

Synthesia 会给你一个脚本让你朗诵,朗诵大约需要三分钟。根据头像生成器提供的信息,需要一到五分钟的音频和视频才能完成整个过程。

对于可能对公司或内容创作者的品牌产生重大影响的东西来说,这个过程相对简单。

虽然上传、录制和阅读脚本的过程不到 5 分钟,但 Synthesia 表示,实际生成个人头像的时间可能长达 24 小时。我的第一个视频大约花了 10 个小时制作完成。之后,我提供的新脚本的后续视频只用了大约 5 分钟。

这是我从 Synthesia 获得的 "个人头像"。您觉得怎么样?

无论是 YouTube、Instagram 还是 TikTok,成品视频的大小都可以根据要上传到的平台的需要进行更改。我发现,使用带有个人头像的新脚本生成新视频大约需要五分钟。

但是,如果不生成新的 "个人头像",就无法更改背景、服装或外观,如上所述,这可能需要一天的时间。

虽然 "个人头像 "给人留下了深刻印象,但看到一个动画版的自己还是很奇怪,这就是 "不可思议谷"。所谓 "不可思议谷",是指逼真的人像几乎与真实的人过于接近,使人感到更加不安。

尽管如此,这些视频化身还是给人留下了深刻印象,如果观众不仔细观察,还真有可能以假乱真。

编辑:Ryan Ozawa

Source: decrypt.co

Related News

More News

© 2025 DeFi.io