Nvidia 的 Fugatto 1 可以合成音频,创造新的声音
英伟达(Nvidia)展示了一种新的生成式人工智能模型,它可以通过简单的文本指令和上下文音频输入合成音频,从而创造出独特的声音。Nvidia 将 Fugatto 1 设想为 "创作者的工具,使他们能够快速将自己的声音幻想和未曾听过的声音变为现实--它是想象力的工具,而不是创造力的替代品"。
在其研究论文中该团队在其研究论文中说,根据文本训练的大型语言模型(LLMs)可以学会从输入中推断指令,但纯粹根据音频训练的大型语言模型却做不到这一点。音频没有数据显示它是如何产生的。
Nvidia 的 Fugatto 1 使用了一个专门的数据集,该数据集从各种声音中提取数据,并使用一种名为 ComposeableART 的方法来理解和控制指令。这样,模型就能创建一个新兴数据集,帮助模型组合不同的声音,甚至是未经过训练的声音。
Nvidia 已在Fugatto 的 Github 页面上展示了该模型的几个应用实例。的 Github 页面上展示了该模型的几个应用实例,例如,它可以将狗叫声与电子舞曲合成在一起,还可以将打字机打出的每一个字母都低声吟唱出来,甚至还可以将萨克斯风吹出 "喵喵 "或 "汪汪 "的声音。
到目前为止,Nvidia 还没有公开发布该模型的计划。
» Notebookcheck多媒体笔记本电脑Top 10排名
» Notebookcheck游戏笔记本电脑Top 10排名
» Notebookcheck低价办公/商务笔记本电脑Top 10排名
» Notebookcheck高端办公/商务笔记本电脑Top 10排名
» Notebookcheck工作站笔记本电脑Top 10排名
» Notebookcheck亚笔记本电脑Top 10排名
» Notebookcheck超级本产品Top 10排名
» Notebookcheck变形本产品Top 10排名
» Notebookcheck平板电脑Top 10排名
» Notebookcheck智能手机Top 10排名
» Notebookcheck评测过最出色的笔记本电脑屏幕
» Notebookcheck售价500欧元以下笔记本电脑Top 10排名
» Notebookcheck售价300欧元以下笔记本电脑Top 10排名