Notebookcheck Logo

盛树科技发布全新人工智能视频生成器,对标 OpenAI 的 Sora

盛树科技发布 Vidu 1.5--一种可根据文字提示生成逼真视频的人工智能模型(图片来源:Vidu)
盛树科技发布 Vidu 1.5--一种可根据文字提示生成逼真视频的人工智能模型(图片来源:Vidu)
盛树科技(Shengshu Technology)发布了全新的 Vidu 1.5 多模态人工智能(Multimodal AI),可根据图像和文字提示生成逼真的视频。得益于多实体一致性能力,该人工智能模型可将人物、物体和环境拼接到一个生成的视频中。该模型现已通过 Vidu 的官方网站向所有人开放。
AI

盛树科技(Shengshu Technology)发布了其最新的人工智能模型 Vidu 1.5。该公司的目标是进军文本到视频和图像到视频生成领域,为市场带来新的竞争者,与 OpenAI Sora、等公司竞争。对于不了解盛书科技的人来说,这是一家去年成立于 2023 年 3 月的新兴人工智能公司。

该公司的新人工智能模型与 OpenAI 的 Sora 基本相似,只是做了一些调整。Vidu 1.5 能够根据图像和文字提示生成长度不超过 8 秒的视频。该人工智能模型使用其内部的多实体一致性功能,在根据用户提示生成视频的同时,还能无缝拼接人、物体和环境。

此外,Vidu 还有一项名为 "多角度一致性 "的功能,允许用户使用任何输入的图片生成视频,或者上传三张单一主题的照片。人工智能 人工智能 公司进一步指出,人工智能模型利用先进的控制功能,在生成的输出中添加更好的动作和细节背景。根据模型制造商的说法,你可以在 30 秒内生成一段 8 秒钟的视频。

Vidu 还在其官方网站上列出了一些由 Vidu 1.5 模型生成的人工智能视频,感觉非常逼真。但问题是,你只能制作 8 秒钟的视频,而它的直接竞争对手 Sora 可以制作长达一分钟的视频。

说到视频分辨率,Vidu 1.5 可以制作最高 1080p 分辨率的视频。Vidu 1.5 也有不完美的地方。例如,一些人工智能生成的视频缺乏细微细节,还显示出一些不真实的动作,如在汽车场景中,火焰从汽车中间穿过。虽然这些都不是主要缺陷,甚至在仔细观察后才会发现。

Vidu 1.5 多模态人工智能采用免费模式。免费版可以生成 4 秒钟的速度分辨率视频片段,而高级版则需要 9.99 美元/月,可以生成分辨率高达 1080p 的 8 秒钟视频。Vidu 1.5 现已通过其官方网站向所有人开放。

在亚马逊购买 iPhone 16 Pro Max

由 Vidu 1.5 生成的汽车在火热道路上行驶的视频图像(图片来源:Vidu)
由 Vidu 1.5 生成的汽车在火热道路上行驶的视频图像(图片来源:Vidu)
Vidu 1.5 生成的小女孩逼真视频中的图像(图片来源:Vidu)
Vidu 1.5 生成的小女孩逼真视频中的图像(图片来源:Vidu)
Vidu 1.5 用户界面(图片来源:Vidu)
Vidu 1.5 用户界面(图片来源:Vidu)
 

资料来源

Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 11 > 盛树科技发布全新人工智能视频生成器,对标 OpenAI 的 Sora
Abhinav Fating, 2024-11-14 (Update: 2024-11-14)