Notebookcheck Logo

开源人工智能视频生成器 Pyramid Flow 现已上线

使用 Pyramid Flow 制作的文字视频短片剧照(图片来源:Pyramid Flow on GitHub)
使用 Pyramid Flow 制作的文字视频短片剧照(图片来源:Pyramid Flow on GitHub)
Pyramid Flow 来自中国,是一个开源的人工智能模型,能够创建虚拟高分辨率(768p)视频。据其背后的团队称,该模型能在不到一分钟的时间内生成 5 秒钟的 384p 视频。Pyramid Flow 采用 MIT 许可,并在开源数据集上进行了训练。
AI Open Source Software Cyberlaw

已经在 YouTube 教程视频中流行起来。Pyramid Flow 是一个新的人工智能模型,它是在开源数据集(总计约 1000 万个视频)上训练出来的。Pyramid Flow 是一个由北京大学、旷视科技(Kuaishou Technology)和北京邮电大学的人工智能研究人员组成的团队的成果,它本身是开源的。它采用MIT 许可条款。它可以生成虚拟的高分辨率(768p)视频内容,而在处理 384p 的视频时,它显然会大显身手。据其创建者称,它能在一分钟内生成一个 5 秒钟的视频(显然使用的是未公开硬件配置的 A100 GPU)。

在某些情况下,Pyramid Flow 表现出色。但在处理某些文本提示时,效果就差强人意了。就像许多生成式人工智能应用软件一样,使用这样的工具也有一定的随机性。好的一面是,该模型的方法所使用的计算能力远远低于竞争对手,而且由于其代码是开源的,有兴趣的人可以在本地或云端应用中使用它,而不必为许可证问题费心。

不过,创建 Pyramid Flow 的人工智能研究人员列出了用于训练 Pyramid Flow 的所有数据集,但却没有提及可能出现的版权问题。虽然一些内容创作者声称,使用开源材料制作的虚拟视频侵犯了版权所有者的权利,但 Pyramid Flow 可以在不涉及任何第三方的情况下对这类内容进行微调。

那些从开源角度对人工智能感兴趣的人可以从亚马逊上购买 J.D. TjonWolf 所著的《开源人工智能:数据研究的未来》,售价为 9.99 美元(Kindle)或 12.99 美元(平装本)。

资料来源

金字塔流(在 GitHub 上,via Tech Xplore)

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 10 > 开源人工智能视频生成器 Pyramid Flow 现已上线
Codrut Nistor, 2024-10-15 (Update: 2024-10-15)