Notebookcheck Logo

OpenAI 通过 15 秒语音样本预览了语音引擎令人信服地克隆人声的能力

OpenAI 展示了语音引擎的功能,它可以用 15 秒钟的样本克隆一个人的声音。(人工智能图像 Dall-E 3)
OpenAI 展示了语音引擎的功能,它可以用 15 秒钟的样本克隆一个人的声音。(人工智能图像 Dall-E 3)
OpenAI 已经预览了其语音引擎技术的能力,该技术可以通过 15 秒钟的语音样本令人信服地克隆一个人的声音。该引擎还能在翻译语音时将一个人的口音转换成其他口语,非正式地说出新的文本,并让有语音障碍或疾病的人恢复清晰的语音。
AI Software Security

OpenAI 已预览了其语音引擎技术的当前状态,该技术可以使用 15 秒的语音样本作为输入,令人信服地克隆一个人的声音。该技术还能在翻译语音时将一个人的口音转换成其他口语,即使目标语言使用的是非正式或俚语。对于有嗓音障碍或患有咽喉炎等导致说话不清楚的疾病的人,语音引擎可以用清晰的声音重复所说的话。

人工智能技术已经发展到可以识别元音、单词和其他语音部分,并能理解句子大意的程度。克隆语音人工智能能识别一个人说话时的独特特征,如口音、情感、时机和重点,然后利用这些特征以令人信服的克隆方式说出文字。

OpenAI 在其博客页面上展示了以下令人信服的例子:

  • 语音克隆
  • 克隆语音口音进行语音翻译
  • 非正式或俚语发言
  • 为哑巴说话
  • 当患有语言疾病时,用一个人原本清晰的声音说话

尽管市场上有许多其他的人工智能语音克隆和语音适配服务,但出于对滥用的担忧,OpenAI 目前不会向公众发布语音引擎。在美国大选期间,这种技术已被用于制造 "假总统拜登 "的电话。假拜登总统 "电话,并在全球范围内从公司和 人手中骗取钱财。人的钱财。.不幸的是,一旦潘多拉魔盒被打开,就像生成人工智能图像技术被用于制造假冒教皇图像一样,就没有回头路了。就无法回头了。

对此感到担忧的读者应该与家人和亲朋好友建立安全对话,以验证他们的身份,阅读如何识别诈骗电话。在金融服务提供商那里禁用语音识别验证,并考虑使用变声器来防止在接听陌生来电时被复制声音。

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 03 > OpenAI 通过 15 秒语音样本预览了语音引擎令人信服地克隆人声的能力
David Chien, 2024-03-30 (Update: 2024-03-30)