Notebookcheck Logo

Nvidia 的 Fugatto 1 可以合成音频,创造新的声音

Nvidia 的 Fugatto 1 可以合成音频,创造新的声音(图片来源:Fugatto Github)
Nvidia 的 Fugatto 1 可以合成音频,创造新的声音(图片来源:Fugatto Github)
英伟达(Nvidia)公司发布了一种新的生成式人工智能模型,它可以合成音频,创造出独特的声音。该公司表示,该模型将面向娱乐行业,用于音乐、电影和视频游戏。
AI

英伟达(Nvidia)展示了一种新的生成式人工智能模型,它可以通过简单的文本指令和上下文音频输入合成音频,从而创造出独特的声音。Nvidia 将 Fugatto 1 设想为 "创作者的工具,使他们能够快速将自己的声音幻想和未曾听过的声音变为现实--它是想象力的工具,而不是创造力的替代品"。

在其研究论文中该团队在其研究论文中说,根据文本训练的大型语言模型(LLMs)可以学会从输入中推断指令,但纯粹根据音频训练的大型语言模型却做不到这一点。音频没有数据显示它是如何产生的。

Nvidia 的 Fugatto 1 使用了一个专门的数据集,该数据集从各种声音中提取数据,并使用一种名为 ComposeableART 的方法来理解和控制指令。这样,模型就能创建一个新兴数据集,帮助模型组合不同的声音,甚至是未经过训练的声音。

Nvidia 已在Fugatto 的 Github 页面上展示了该模型的几个应用实例。的 Github 页面上展示了该模型的几个应用实例,例如,它可以将狗叫声与电子舞曲合成在一起,还可以将打字机打出的每一个字母都低声吟唱出来,甚至还可以将萨克斯风吹出 "喵喵 "或 "汪汪 "的声音。

到目前为止,Nvidia 还没有公开发布该模型的计划。

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 11 > Nvidia 的 Fugatto 1 可以合成音频,创造新的声音
Rohith Bhaskar, 2024-11-26 (Update: 2024-11-26)