盛树科技发布全新人工智能视频生成器，对标 OpenAI 的 Sora

盛树科技发布 Vidu 1.5--一种可根据文字提示生成逼真视频的人工智能模型（图片来源：Vidu）

盛树科技（Shengshu Technology）发布了全新的 Vidu 1.5 多模态人工智能（Multimodal AI），可根据图像和文字提示生成逼真的视频。得益于多实体一致性能力，该人工智能模型可将人物、物体和环境拼接到一个生成的视频中。该模型现已通过 Vidu 的官方网站向所有人开放。

Abhinav Fating (translated by Ninh Duy), Published 11/14/2024 🇺🇸 🇫🇷 ...

盛树科技（Shengshu Technology）发布了其最新的人工智能模型 Vidu 1.5。该公司的目标是进军文本到视频和图像到视频生成领域，为市场带来新的竞争者，与 OpenAI Sora、等公司竞争。对于不了解盛书科技的人来说，这是一家去年成立于 2023 年 3 月的新兴人工智能公司。

该公司的新人工智能模型与 OpenAI 的 Sora 基本相似，只是做了一些调整。Vidu 1.5 能够根据图像和文字提示生成长度不超过 8 秒的视频。该人工智能模型使用其内部的多实体一致性功能，在根据用户提示生成视频的同时，还能无缝拼接人、物体和环境。

此外，Vidu 还有一项名为 "多角度一致性 "的功能，允许用户使用任何输入的图片生成视频，或者上传三张单一主题的照片。人工智能人工智能公司进一步指出，人工智能模型利用先进的控制功能，在生成的输出中添加更好的动作和细节背景。根据模型制造商的说法，你可以在 30 秒内生成一段 8 秒钟的视频。

Vidu 还在其官方网站上列出了一些由 Vidu 1.5 模型生成的人工智能视频，感觉非常逼真。但问题是，你只能制作 8 秒钟的视频，而它的直接竞争对手 Sora 可以制作长达一分钟的视频。

说到视频分辨率，Vidu 1.5 可以制作最高 1080p 分辨率的视频。Vidu 1.5 也有不完美的地方。例如，一些人工智能生成的视频缺乏细微细节，还显示出一些不真实的动作，如在汽车场景中，火焰从汽车中间穿过。虽然这些都不是主要缺陷，甚至在仔细观察后才会发现。

Vidu 1.5 多模态人工智能采用免费模式。免费版可以生成 4 秒钟的速度分辨率视频片段，而高级版则需要 9.99 美元/月，可以生成分辨率高达 1080p 的 8 秒钟视频。Vidu 1.5 现已通过其官方网站向所有人开放。

Editor of the original article: Abhinav Fating - News Editor - 176 articles published on Notebookcheck since 2024

Translator: Ninh Ngoc Duy - Editorial Assistant - 522633 articles published on Notebookcheck since 2008

Please share our article, every link counts!

> Notebookcheck中文版（NBC中国） > 新闻 > 新闻档案 > 新闻档案 2024 11 > 盛树科技发布全新人工智能视频生成器，对标 OpenAI 的 Sora

Abhinav Fating, 2024-11-14 (Update: 2024-11-14)