Notebookcheck Logo

斯坦福计算成像实验室的工程师们开发出轻便、人工智能驱动的全息 AR 眼镜原型

斯坦福大学工程师开发出由人工智能驱动的轻量级全息 AR 眼镜。(来源:斯坦福大学)
斯坦福大学工程师开发出由人工智能驱动的轻量级全息 AR 眼镜。(来源:斯坦福大学)
斯坦福大学计算成像实验室的工程师们开发出了一种轻便的 AR 眼镜原型。这项创新的关键在于一个由人工智能驱动的显示屏,它能通过薄薄的光学波导投射 3D 图像,而无需使用笨重的镜片。这为商用全息 AR 眼镜打开了大门,这种眼镜比现有的头戴式眼镜更轻。
Virtual Reality (VR) / Augmented Reality (AR) Wearable Concept / Prototype

斯坦福大学计算成像实验室的工程师们开发出了一种轻型 AR 眼镜原型,为未来生产比现有耳机轻得多的全息 AR 眼镜打开了大门。这一创新的关键在于一个人工智能驱动的显示屏,它可以通过薄光学波导内的两个元表面投射 3D 图像,而无需使用笨重的透镜。

传统的 AR/VR/XR 头显通常使用聚焦镜片将微型 LED 或 OLED 显示图像投射到佩戴者的眼睛中。遗憾的是,镜片所需的深度导致设计笨重,例如Google Cardboard 中的智能手机设备或 Apple Vision Pro耳机,重量超过 21 盎司(600 克)。

更薄的设计有时会使用光学波导(可以把它想象成潜望镜)将显示屏和镜片从眼前移到头侧,但用户只能看到二维图像和文本。斯坦福大学的工程师将人工智能技术与元面波导相结合,在投射三维全息图像的同时,降低了 AR 头显的重量和体积。

第一项创新是取消了笨重的聚焦透镜。取而代之的是,蚀刻在波导中的超精细元表面通过弯曲和对齐光线对投射图像进行 "编码 "和 "解码"。可以粗略地把它想象成按照设定的节奏在水池的一端泼水,当波浪到达另一端时,你可以读取波浪来重现原来的节奏。斯坦福眼镜在显示屏前方使用一个元表面,在眼睛前方使用另一个元表面。

第二个是波导传播模型,用于模拟光线如何在波导中反弹,从而准确地创建全息图像。三维全息图像在很大程度上取决于光传输的准确性,即使波导表面有纳米级的变化,也会极大地改变所看到的全息图像。在这里,使用修改后的UNet 架构的深度学习卷积神经网络对通过波导发送的红光、绿光和蓝光进行训练,以补偿系统中的光学像差。粗略地说,这就好比射箭瞄准靶心,但箭只射中了右边的一点点--现在你知道要通过向左边瞄准一点点来进行补偿了。

第三种是使用人工智能神经网络来创建全息图像。48 GB 英伟达 RTX A6000用于对Holoeye Leto-3 投射的各种相位模式进行人工智能训练。仅相位 SLM 显示模块投射的各种相位模式进行训练。随着时间的推移,人工智能学会了哪些模式可以在四个距离(1 米、1.5 米、3 米和无限远)创建特定图像。

综合来看,为这款耳机提供动力的人工智能模型输出的 3D 图像明显优于其他产品。虽然斯坦福大学的 AR 眼镜只是一个原型,但读者现在仍然可以通过亚马逊上的这款轻便耳机享受增强世界。

人工智能学会纠正系统中的光学偏差和其他错误,从而生成漂亮的 3D 图像。(资料来源:斯坦福大学)
人工智能学会纠正系统中的光学偏差和其他错误,从而生成漂亮的 3D 图像。(资料来源:斯坦福大学)
斯坦福大学的 AR 眼镜利用元表面波导和神经网络打造出一款轻薄的耳机。(资料来源:斯坦福大学)
斯坦福大学的 AR 眼镜利用元表面波导和神经网络打造出一款轻薄的耳机。(资料来源:斯坦福大学)
人工智能要经过许多相位图像的训练,才能知道如何投射 3D 图像。(资料来源:斯坦福大学)
人工智能要经过许多相位图像的训练,才能知道如何投射 3D 图像。(资料来源:斯坦福大学)
Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 05 > 斯坦福计算成像实验室的工程师们开发出轻便、人工智能驱动的全息 AR 眼镜原型
David Chien, 2024-05-27 (Update: 2024-05-27)