OpenAI 推出可根据文字提示生成逼真视频的人工智能模型 Sora

OpenAI 推出 Sora，提供逼真的文本到视频生成功能（来源：OpenAI）

OpenAI 的最新项目 Sora 将文字提示无缝转化为栩栩如生的视频，为人工智能创新开辟了新天地。尽管存在一些小瑕疵，但 Sora 能够生成引人入胜的场景，从老式越野车在山间集结到动画怪兽，都展示了它在视觉叙事方面的潜力。目前，只有少数人可以使用该模型，他们正在对其安全性和风险进行测试，一些视觉艺术家和创作者也在对其进行早期反馈。

Sambit Saha (translated by Ninh Duy), Published 02/16/2024 🇺🇸 🇪🇸 ...

OpenAI一直是消费人工智能领域的开拓者，为文本和图像生成带来了革命性的变化，这要归功于DALL-E和ChatGPT.现在，该公司又推出了最新产品Sora。该公司的目标是进军文本到视频生成领域，试图进一步推动人工智能创造力的发展。

Sora 能够制作长达一分钟的视频，并配有 "多个角色"、"细微动作 "和 "详细背景 "等复杂场景，所有这些都由用户提示驱动。结果令人惊叹地栩栩如生，展示了人工智能在视觉叙事方面不可否认的潜力。

在 OpenAI 提供的几个演示中，Sora 毫不费力地将提示变成了现实。从一辆老式越野车在山间穿梭，到一只毛茸茸的怪兽坐在融化的蜡烛旁的奇异场景，所生成的视频都与所提供的指令极为吻合。

不过，《Sora》也并非没有瑕疵。在某些情况下，会出现细微的不一致或不真实的动作，突出了需要改进的地方，例如在一个场景中，一只猫向它沉睡的主人要早餐。虽然整个场景的渲染令人信服，但敏锐的观察者可能会注意到，当主人从睡梦中醒来时，一些细微的动作偏离了现实。然而，与模型制作令人惊叹的视觉叙事的整体能力相比，这些缺陷就显得微不足道了。

其中一个突出的例子是在融化的蜡烛旁描绘了一个毛茸茸的怪物。结果看起来真是绚丽多彩，就像皮克斯电影中的场景一样。这些错综复杂的细节，如怪物皮毛的纹理，本来是很难渲染的，但 Sora 在处理复杂视觉元素方面的能力却得到了充分展示。

目前，"红队 "成员可以访问 Sora，他们的任务是评估其潜在风险和影响。此外，OpenAI 还在与视觉艺术家、设计师和电影制作人合作，收集反馈意见，以提高模型对内容创作者的整体实用性。随着 Sora 的不断完善和评估，它有望实现视频创作的民主化，为故事讲述者和创作者提供一个强大的工具，帮助他们实现自己的愿景。

在亚马逊购买三星Galaxy Book3 笔记本电脑