Nvidia 的 Fugatto 1 可以合成音频，创造新的声音

Nvidia 的 Fugatto 1 可以合成音频，创造新的声音（图片来源：Fugatto Github）

英伟达（Nvidia）公司发布了一种新的生成式人工智能模型，它可以合成音频，创造出独特的声音。该公司表示，该模型将面向娱乐行业，用于音乐、电影和视频游戏。

Rohith Bhaskar (translated by Ninh Duy), Published 11/26/2024 🇺🇸 🇵🇹 ...

英伟达（Nvidia）展示了一种新的生成式人工智能模型，它可以通过简单的文本指令和上下文音频输入合成音频，从而创造出独特的声音。Nvidia 将 Fugatto 1 设想为 "创作者的工具，使他们能够快速将自己的声音幻想和未曾听过的声音变为现实--它是想象力的工具，而不是创造力的替代品"。

在其研究论文中该团队在其研究论文中说，根据文本训练的大型语言模型（LLMs）可以学会从输入中推断指令，但纯粹根据音频训练的大型语言模型却做不到这一点。音频没有数据显示它是如何产生的。

Nvidia 的 Fugatto 1 使用了一个专门的数据集，该数据集从各种声音中提取数据，并使用一种名为 ComposeableART 的方法来理解和控制指令。这样，模型就能创建一个新兴数据集，帮助模型组合不同的声音，甚至是未经过训练的声音。

Nvidia 已在Fugatto 的 Github 页面上展示了该模型的几个应用实例。的 Github 页面上展示了该模型的几个应用实例，例如，它可以将狗叫声与电子舞曲合成在一起，还可以将打字机打出的每一个字母都低声吟唱出来，甚至还可以将萨克斯风吹出 "喵喵 "或 "汪汪 "的声音。

到目前为止，Nvidia 还没有公开发布该模型的计划。

Editor of the original article: Rohith Bhaskar - Tech Writer - 230 articles published on Notebookcheck since 2024

contact me via: LinkedIn

Translator: Ninh Ngoc Duy - Editorial Assistant - 525066 articles published on Notebookcheck since 2008

Please share our article, every link counts!

> Notebookcheck中文版（NBC中国） > 新闻 > 新闻档案 > 新闻档案 2024 11 > Nvidia 的 Fugatto 1 可以合成音频，创造新的声音

Rohith Bhaskar, 2024-11-26 (Update: 2024-11-26)