Notebookcheck Logo

Apple 发布开源人工智能图像编辑工具 MGIE

MGIE 输入和输出示例。(来源:ArXiv)
MGIE 输入和输出示例。(来源:ArXiv)
Apple最新的人工智能模型被誉为 "革命性的",因为它能够根据使用多模态大型语言模型(MLLM)处理的提示执行 "Photoshop 风格的修改 "等任务。因此,它被称为 MLLM 引导的图像编辑(MGIE),并被评为可以在像素级别 "操作 "图像。
AI Launch Software Science

人工智能可用于图像编辑和 生成然而,这种应用 机器学习人工智能可用于图像编辑和生成;然而,这种机器学习应用很难将人类指令与实际目标和相应输出相匹配,因为人类指令可能会受到技术、意图或理想化外观变化的影响。然而、 Apple's新的 MGIE 模型已经被认为能够 "彻底改变 "这项技术。

它改进了对指令的 "解释",并提供了完整的语境,如 "意识到""改变背景并添加星球大战 背景"这样的提示可能需要添加"光剑或宇宙飞船",这要归功于 MLLMs 的集成。 MLLMs因此,与竞争对手 InsPix2Pix 或其前身相比,它在定性分析和人工评估方面可能会取得更好的结果 LLM-引导图像编辑 (LGIE)。

它还能利用 MLLM 进行 "推理",使食物图片"更健康"的要求可能包括增加一些蔬菜。MGIE 可在"Photoshop"的级别上实现这一功能,还能以像素级的准确度和精确度进行定点或一般 "照片优化"。

Apple 与加州大学圣塔芭芭拉分校(UCSB)的一个团队合作,在 2024 年学习表征国际会议(ICLR 2024)上展示了这一最新的人工智能研究成果,该团队还发表了一篇基于相同工作的论文,目前可在 arXiv上查阅。.

购买 Apple MacBook Air亚马逊上的星光焕新至尊机型 M2

Apple 开发了一种新的人工智能图像编辑模型。(来源:ArXiv)
Apple 开发了一种新的人工智能图像编辑模型。(来源:ArXiv)

资料来源

Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 02 > Apple 发布开源人工智能图像编辑工具 MGIE
Deirdre O'Donnell, 2024-02- 9 (Update: 2024-02- 9)