Notebookcheck Logo

谷歌新的双子座 2.0 模型与实验性人工智能代理来了

双子座 2.0 开启了谷歌所谓的 "代理时代"。(图片来源:谷歌)
双子座 2.0 开启了谷歌所谓的 "代理时代"。(图片来源:谷歌)
谷歌正在大肆宣传其全新的双子座 2.0 模型。第一个模型 Gemini 2.0 Flash 已经上线,同时还推出了新的人工智能代理体验,如 Project Astra 和 Project Mariner。
AI Software

谷歌将为 2024 年画上一个圆满的句号。本周三,这家山景城巨头宣布了一系列人工智能新闻,包括发布具有先进多模态功能的全新语言模型 Gemini 2.0。新模型开创了谷歌所谓的 "代理时代",虚拟人工智能代理将能代表你执行任务。

最初,谷歌只发布了 Gemini 2.0 系列中的一个模型:双子座 2.0 闪存实验版Gemini 2.0 是一个超快、轻量级的模型,支持多模态输入和输出。它能原生生成与文本和多语言音频混合的图像,并能无缝接入谷歌搜索、代码执行和其他工具。这些功能目前正处于预览阶段,供开发人员和测试人员使用。尽管 2.0 Flash 的体积很小,但它在事实、推理、编码、数学等多个领域的表现都优于 Gemini 1.5 Pro,而且速度是后者的两倍。普通用户从今天起就可以在网页上试用聊天优化版的双子座 2.0 Flash,它很快就会登陆双子座手机应用。

谷歌还展示了几款使用 Gemini 2.0 打造的令人印象深刻的体验。首先是 Project Astra(阿斯特拉项目)的升级版,这是谷歌在 2024 年 5 月首次展示的实验性虚拟人工智能代理。有了 Gemini 2.0,它现在可以用多种语言进行对话;使用谷歌搜索、Lens 和地图等工具;记住你过去与它对话的内容,并以人类对话的延迟来理解语言。Project Astra 可在智能手机和眼镜上运行,但目前仅限于一小群值得信赖的测试者。有兴趣在自己的Android 手机上试用原型机的人可以在这里加入等待名单。演示了多模态实时应用程序接口(Multimodal Live API)。与 Project Astra 有些类似,可以让您使用视频、语音和屏幕共享与聊天机器人进行实时互动。

接下来是Project Mariner。这是一个实验性的 Chrome 浏览器扩展,可以浏览互联网并为你完成任务。该扩展目前只对美国的部分测试者开放,它利用 Gemini 2.0 的多模态功能"理解和推理浏览器屏幕上的信息,包括像素和文本、代码、图像和表单等网络元素"。谷歌承认该技术仍处于起步阶段,并不总是可靠的。但不可否认的是,即使是目前的原型,它也给人留下了深刻的印象,你可以在YouTube 演示中亲眼目睹。.

谷歌还发布了由 Gemini 2.0 支持的人工智能代码代理 Jules。它可以直接集成到你的 GitHub 工作流中,该公司称它可以处理 bug 修复和重复耗时的任务,"而你可以专注于你真正想要构建的东西"。

新发布的大部分功能目前仅限于早期测试者和应用开发者使用。谷歌表示,计划在明年初将 Gemini 2.0 集成到其产品组合中,包括搜索、工作空间、地图等。到那时,我们就能更好地了解这些新的多模态功能和改进是如何转化为实际使用案例的。目前还没有关于 Gemini 2.0 Ultra 和 Pro 型号的消息。

资料来源

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 12 > 谷歌新的双子座 2.0 模型与实验性人工智能代理来了
Kristen Spradlin, 2024-12-12 (Update: 2024-12-12)