dark mode

Nvidia 的 DiffUHaul 人工智能工具可移动图像中的物体

Nvidia 的 DiffUHaul AI 模型可以移动图像中的物体（图片来源：Omri Avrahami on YouTube）

Nvidia 公司的研究人员开发了一种新的人工智能工具，可以重新定位图像中的物体。该工具可以在不影响背景的情况下改变图像中物体的位置。

Rohith Bhaskar (translated by Ninh Duy), Published 12/03/2024 🇺🇸 🇮🇹 ...

AI

来自 Nvidia 的研究人员在上发表了一篇论文。该工具可以在不改变图像大小或背景的情况下理解并移动图像中的物体。论文称，该工具 "利用本地化文本到图像模型的空间理解能力，完成物体拖动任务"。

目前的文本到图像模型由于缺乏 "空间推理 "能力，在处理复杂的图像编辑任务时举步维艰。DiffuHaul 通过在模型中加入空间推理来解决这个问题，让模型在图像中追踪对象，"无缝 "地重新定位它们，而不改变其他任何东西。

为了实现这一目标，该工具在去噪步骤中对物体进行遮挡，帮助它了解物体的位置，并将其从背景中分离出来。然后，它对原始图像和生成图像之间的差值进行插值，在不触及背景的情况下将物体放置在新的位置。然后，将原始图像中更精细的细节和特征移到新图像中，以保持一致性。

▶ load Youtube video

DiffUHaul 基于BlobGEN。模型，该模型利用空间理解能力，根据复杂的提示合成图像。论文称，该工具无需训练，这意味着它是在没有任何数据集的情况下创建的，并且开箱即用。

资料来源

DiffUHaul 研究论文

Related Articles

8 GB GDDR7 VRAM 可能会让GeForce RTX 5060 在分辨率超过 1080p 时受到影响。(图片来源：Notebookcheck - 已编辑）

据传，Nvidia GeForce RTX 5060 Ti 包含 16GB GDDR7 VRAM；GeForce RTX 5060 仅有 8GB 12/17/2024

来自 Mixi 的 Romi Lacatan 会话式人工智能机器人在 CES 2025 创新奖活动中获奖。(图片来源：Mixi）

Mixi Romi Lacatan 人工智能对话机器人入选 CES 创新奖 12/17/2024

Nvidia 正式开始宣传其 CES 2025 主题演讲（图片来源：Nvidia）

英伟达正式预告 2025 年 CES 将推出 RTX 50 系列 12/13/2024

巫师 4》在游戏奖颁奖典礼上发布（图片来源：YouTube）

下一代 Nvidia GPU 与《巫师 4》同时发布 12/13/2024

夺宝奇兵：大本营》今日正式发售（图片来源：Nvidia）

Nvidia 赠送以《夺宝奇兵》和《大圆环》为主题的GeForce RTX 4090 显卡 12/07/2024

英伟达（Nvidia）可能已提前推出其 Rubin 架构，以搭上人工智能热潮的顺风车。(图片来源：Notebookcheck - 已编辑）

新款 Nvidia Rubin GPU 的推出时间将大大早于预期 12/05/2024

欧盟向 Nvidia 客户发出调查问卷，调查 Run:ai 交易（图片来源：Nvidia）

欧盟向英伟达客户发出调查问卷，调查 Run:ai 交易 12/04/2024

将人工智能与核能相结合的 Meta（图片来源：AI-generated）

Meta 为人工智能雄心寻找核合作伙伴 12/04/2024

World Labs 的新型人工智能系统可通过二维图像制作互动式三维世界（图片来源：World Labs）

世界实验室（World Labs）的新型人工智能系统可通过二维图像制作交互式三维世界 12/04/2024

ACCC 希望挑战谷歌在搜索和人工智能领域的主导地位（图片来源：Dall-E 3 生成）

澳大利亚竞争与消费者委员会希望挑战谷歌在搜索和人工智能领域的主导地位 12/04/2024

Evaxion 将发布人工智能驱动的癌症疫苗概念 12/04/2024

夺宝奇兵：大本营》PC 版将成为今年推出的要求较高的游戏之一（图片来源：Steam）

夺宝奇兵：大本营》PC 系统要求曝光：Nvidia GeForce RTX 4070 必须具备 1080p 60 FPS 的光线追踪体验 12/04/2024

看来 Nvidia 的 AIB 可能会在年底前开始接收GeForce RTX 50 显卡。(图片来源：Nvidia - 已编辑）

Inno3D 代表似乎确认 Nvidia GeForce RTX 5090 发布时间提前 11/30/2024

台积电的 2 纳米节点预计将于明年投入量产（图片来源：台积电）

英特尔、AMD、Apple 、英伟达（Nvidia）和联发科（MediaTek）将采用台积电最先进的 2 纳米节点；高通（Qualcomm）明显缺席 11/28/2024

Nvidia 正在赠送另一款定制的高端显卡（图片来源：Nvidia）

通过 Nvidia 的最新赠品活动，《S.T.A.L.K.E.R 2：切尔诺贝利之心》主题GeForce RTX 4090 有机会获得 11/27/2024

GeForce RTX 4090 Ti 拥有巨大的四插槽冷却解决方案。(图片来源：u/This_Explanation_514）

Redditor 在 "垃圾电脑仓 "中发现 Nvidia GeForce RTX 4090 Ti 11/27/2024

Nvidia 的 Fugatto 1 可以合成音频，创造新的声音（图片来源：Fugatto Github）

Nvidia 的 Fugatto 1 可以合成音频，创造新的声音 11/26/2024

英伟达总部（图片来源：英伟达）

Nvidia公司的Hopper和Blackwell平台销售促进了第三季度收入的增长 11/23/2024

Nvidia 可能会在 2025 年的 CES 上带来三款消费级显卡。(图片来源：Notebookcheck - 已编辑）

新泄露的信息描述了 Nvidia GeForce RTX 5070、RTX 5070 Ti、RTX 5080 和 RTX 5090 的发布日期 11/23/2024

OnePlus 通过免费礼品和赠品预告即将发布的全球旗舰机...

Stellantis 首席执行官因公司在 2024 年陷入困境而辞职...

Rohith Bhaskar

Editor of the original article: Rohith Bhaskar - Tech Writer - 226 articles published on Notebookcheck since 2024

contact me via: LinkedIn

Ninh Duy

Translator: Ninh Ngoc Duy - Editorial Assistant - 521685 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> Notebookcheck中文版（NBC中国） > 新闻 > 新闻档案 > 新闻档案 2024 12 > Nvidia 的 DiffUHaul 人工智能工具可移动图像中的物体

Rohith Bhaskar, 2024-12- 3 (Update: 2024-12- 3)