Notebookcheck Logo

IBM 推出面向企业的 Granite 3.0 开源人工智能模型

面向企业的 IBM Granite 3.0 开源人工智能模型现已推出(图片来源:IBM)
面向企业的 IBM Granite 3.0 开源人工智能模型现已推出(图片来源:IBM)
IBM Granite 3.0 系列人工智能模型采用 Apache 2.0 许可条款,以企业客户为目标,提供顶级性能以及(据称)市场上最全面的风险和危害检测功能。感兴趣的人可以从 Hugging Face 下载这些模型。
AI Open Source Software Business

今天早些时候,IBM 发布了迄今为止最先进的人工智能模型系列,将 Granite 的版本号提升至 3.0。早在 2023 年 9 月,IBM 就推出了Granite 基础模型。现在,他们正在将该系列转向开源模式,同时改进其他各个方面。所有 Granite 3.0 模型(稍后会提到)都受 Apache 2.0 许可证条款的保护,企业客户和广大社区都可以利用它们。

磐研 3.0 的三个分支及其成员如下:

  • 通用/语言:Granite 3.0 8B Instruct、Granite 3.0 2B Instruct、Granite 3.0 8B Base、Granite 3.0 2B Base
  • 护栏与安全:花岗岩卫士 3.0 8B、花岗岩卫士 3.0 2B
  • 专家混合物花岗岩 3.0 3B-A800M 指导, 花岗岩 3.0 1B-A400M 指导, 花岗岩 3.0 3B-A800M 基础, 花岗岩 3.0 1B-A400M 基础

与使用公共数据训练的竞争对手不同,IBM 的 Granite 模型使用企业数据,可以轻松集成到各种工作流程和业务环境中,与大型前沿模型相比,成本最多可降低 23 倍。据 IBM 称,这些新模型的训练涉及 12 万亿个词组,数据来自 12 种不同的自然语言和 116 种不同的编程语言。

Guardian 3.0 是该系列的亮点之一,它具有市场领先的风险和危害检测功能,在社会偏见、仇恨、毒性、亵渎、暴力、越狱等常见属性的基础上,还考虑了接地性、上下文相关性和答案相关性。

想入门 IBM Granite 3.0(或升级到新代码)的人可以去 Hugging Face 获取。虽然部分模型将与 Nvidia 的 NIM 微服务和 Google Cloud Vertex AI Model Garden 集成,但新 Granite 3.0 8B 和 2B 语言模型的指令变体以及 Granite Guardian 3.0 8B 和 2B 模型可通过IBM watsonx平台提供商业使用。

8 月底,Clifford A. Pickover 出版了《人工智能》一书:图解历史》:从中世纪机器人到神经网络》一书的 Kindle 版售价为 8.99 美元,平装本售价为 17.26 美元。

资料来源

IBM 推出 Granite 3.0:为企业构建高性能人工智能模型

- 根据 Apache 2.0 许可发布的全新 Granite 3.0 8B 和 2B 模型在许多学术和企业基准测试中表现出强劲的性能,能够超越或匹配类似规模的模型

- 全新 Granite Guardian 3.0 模型提供了 IBM 最全面的护栏功能,以推进安全可信的人工智能发展

- 全新 Granite 3.0 Mixture-of-Experts 模型实现了极其高效的推理和低延迟,适用于基于 CPU 的部署和边缘计算

- 新的花岗岩时间序列模型在零/少量预测方面实现了最先进的性能,其性能超过了 10 倍以上的模型

- IBM 推出下一代由 Granite 驱动的用于通用编码的 watsonx 代码助手;在 watsonx.ai 中首次推出用于构建和部署人工智能应用程序和代理的新工具

- 宣布Granite将成为Consulting Advantage的默认模式,Consulting Advantage是一个由人工智能驱动的交付平台,IBM的160,000名顾问使用该平台更快地为客户提供新的解决方案

纽约州阿蒙克 2024年10月21日电/美通社/ -- 今天在 IBM(纽约证券交易所代码:NYSE: IBM)年度 TechXchange 大会上宣布推出迄今为止最先进的人工智能模型系列、 Granite 3.0.IBM 的第三代 Granite 旗舰语言模型在许多学术和行业基准测试中均优于或媲美领先模型提供商的同类模型,展现出强大的性能、透明度和安全性。

根据公司对开源人工智能的承诺,Granite 模型在 Apache 2.0 许可下发布,使其在为企业客户和整个社区提供性能、灵活性和自主性方面独树一帜。

IBM Granite 3.0 系列包括

  • 通用/语言:Granite 3.08BInstructGranite 3.02BInstruct、Granite 3.08BBase、Granite 3.02BBase
  • 护栏与安全花岗岩卫士 3.08B花岗岩卫士 3.02B
  • 专家混合物花岗岩 3.03B-A800M 指导花岗岩 3.01B-A400M 指导、花岗岩 3.03B-A800M 底座花岗岩 3.01B-A400M 底座

全新的 Granite 3.08B2B语言模型是专为企业人工智能设计的 "主力 "模型,可为检索增强生成(RAG)、分类、摘要、实体提取和工具使用等任务提供强大的性能。这些结构紧凑、用途广泛的模型可根据企业数据进行微调,并在不同的业务环境或工作流程中无缝集成。

虽然许多大型语言模型(LLM)都是在公开数据的基础上进行训练的,但绝大多数企业数据仍未得到开发。通过将小型花岗岩模型与企业数据相结合,特别是使用革命性的对齐技术 InstructLab- IBM 和 RedHat 于今年 5 月联合推出的 InstructLab - IBM 相信,企业能够以极小的成本实现与大型模型相媲美的特定任务性能(基于在几个早期概念验证中观察到的比大型前沿模型低 3 到 23 倍的成本范围1)。

Granite 3.0 的发布重申了 IBM 在人工智能产品中建立透明度、安全性和信任度的承诺。磐研 Granite 3.0 技术报告负责任使用指南介绍了用于训练这些模型的数据集、过滤、清理和整理步骤的详情,以及模型在主要学术和企业基准中的综合表现结果。

重要的是,IBM 为 watsonx.ai 上的所有 Granite 模型提供知识产权赔偿,因此企业客户可以更放心地将其数据与模型合并。

提高标准:磐研3.0基准

Granite 3.0语言模型在原始性能方面也取得了可喜的成果。

在 Hugging Face 的 OpenLLM Leaderboard 所定义的标准学术基准上,Granite 3.08BInstruct 模型的整体性能平均领先于 Meta 和 Mistral 的同类开源模型。在 IBM 最先进的 AttaQ 安全基准测试中,与 Meta 和 Mistral 的模型相比,Granite 3.08BInstruct 模型在所有测得的安全维度上都处于领先地位2。

在 RAG、工具使用和网络安全领域任务等核心企业任务方面,与 Mistral 和 Meta 的同类开源模型相比,磐研 3.08BInstruct 模型的平均性能遥遥领先3

花岗岩 3.0 模型采用新颖的两阶段训练方法,利用旨在优化数据质量、数据选择和训练参数的数千次实验结果,对来自 12 种不同自然语言和 116 种不同编程语言的超过 12 万亿个词块进行了训练。预计到今年年底,3.08B2B语言模型将支持扩展的128K上下文窗口和多模式文档理解功能。

为了在性能和推理成本之间实现出色的平衡,IBM 推出了 Granite 混合专家(MoE)架构模型 Granite 3.01B-A400M 和 Granite 3.03B - A800M,这些模型体积更小、重量更轻,可用于低延迟应用以及基于 CPU 的部署。

IBM 还发布了预训练 Granite 时间序列模型的更新版本,其第一版已于今年早些时候发布。这些新模型的训练数据量增加了三倍,在所有三个主要时间序列基准测试中均表现出色,超过了谷歌、阿里巴巴和其他公司的十倍大模型。更新后的模型还提供了更大的建模灵活性,支持外部变量和滚动预测

Granite Guardian 3.0 简介:开创下一个负责任的人工智能时代

作为此次发布的一部分,IBM 还推出了全新的 Granite Guardian 模型系列,允许应用开发人员通过检查用户提示和 LLM 响应的各种风险来实施安全防护。Granite Guardian 3.08B2B模型提供了目前市场上最全面的风险和危害检测功能。

除了社会偏见、仇恨、毒性、亵渎、暴力、越狱等危害维度外,这些模型还提供了一系列独特的 RAG 特定检查,如基础性、上下文相关性和答案相关性。 在对 19 项安全和 RAG 基准进行的广泛测试中,Granite Guardian 3.08B模型在危害检测方面的总体准确率平均高于 Meta 公司的所有三代 Llama Guard 模型。它在幻觉检测方面的平均整体表现也与专门的幻觉检测模型 WeCheck 和 MiniCheck 相当5。

虽然花岗岩守护模型是从相应的花岗岩语言模型中衍生出来的,但它们可用于与任何开放或专有的人工智能模型一起实施守护。

磐研 3.0 模型的可用性

整套磐研 3.0 模型和更新的时间序列模型可在 HuggingFace 上下载,采用 Apache 2.0 许可。全新 Granite 3.08B2B语言模型的指导变体以及 Granite Guardian 3.08B和 2B 模型目前可在 IBM 的 watsonx 平台上用于商业用途。部分 Granite 3.0 模型还将作为英伟达 NIM 微服务提供,并通过谷歌云的 Vertex AI Model Garden 与 HuggingFace 集成提供。

为了帮助开发人员提供选择和易用性,并支持本地边缘部署,Ollama 和 Replicate 上也提供了一套经过精心挑选的 Granite 3.0 模型。

最新一代 Granite 模型扩展了 IBM 强大的 LLM 开源目录。IBM 与 生态系统合作伙伴合作,如 AWS、Docker、Domo、Qualcomm Technologies, Inc. Qualcomm® AI Hub以及 Salesforce、 SAP等合作伙伴,将各种磐研模型集成到这些合作伙伴的产品中,或在其平台上提供磐研模型,为全球企业提供更多选择。

从助理到代理:实现企业人工智能的未来

IBM 正在通过一系列技术推进企业人工智能的发展--从模型和助手,到专门针对企业的独特数据和用例调整和部署人工智能所需的工具。IBM 还在为未来的人工智能代理铺平道路,这些代理可以在动态业务环境中进行自我指导、反思和执行复杂任务。

IBM 不断发展其人工智能助手技术组合--从帮助企业通过低代码工具和自动化构建自己的助手的 watsonx Orchestrate,到针对特定任务和领域(如客户服务、人力资源、销售和营销)的各种预构建助手。世界各地的企业已经使用watsonx Assistant帮助他们构建人工智能助手,用于回答客户或员工提出的常规问题、实现主机和传统IT应用的现代化、帮助学生探索潜在的职业道路,或为购房者提供数字按揭支持等任务。

今天,IBM 还发布了即将发布的 新一代watsonx代码助手Granite 的代码功能现在还可以通过 Visual Studio Code 扩展访问、 Granite.Code.

IBM 还计划发布 新工具,帮助开发人员IBM 还计划发布新工具,帮助开发人员通过 watsonx.ai 更高效地构建、定制和部署人工智能,包括代理框架、与现有环境的集成以及 RAG 和代理等常见用例的低代码自动化

IBM 专注于开发人工智能代理技术,这些技术能够实现更大的自主性、复杂的推理和多步骤问题解决。Granite 3.08B模型的初始版本支持关键的代理功能,如高级推理和高度结构化的聊天模板,以及用于实施工具使用工作流的提示风格。 IBM 还计划在 IBM watsonx Orchestrate 中引入新的人工智能代理聊天功能,该功能使用代理能力来协调人工智能助理、技能和自动化,帮助用户提高整个团队的工作效率。8IBM 计划在 2025 年继续在其产品组合中构建代理能力,包括针对特定领域和用例的预构建代理。

扩展人工智能驱动的交付平台,利用人工智能为 IBM 咨询顾问增效

IBM 还 宣布人工智能驱动的交付平台的重大扩展、 IBM Consulting Advantage.该多模型平台包含人工智能代理、应用和方法,如可重复的框架,可帮助 160,000 名 IBM 顾问以更低的成本更好、更快地为客户创造价值。

作为扩展的一部分,Granite 3.0 语言模型将成为 Consulting Advantage 的默认模型。利用 Granite 的性能和效率,IBM Consulting 将能够帮助 IBM 客户的生成式人工智能项目实现投资回报最大化。

扩展的另一个关键部分是推出 IBM Consulting Advantage for Cloud Transformation and Management 和 IBM Consulting Advantage for Business Operations。每项服务都包含特定领域的人工智能代理、应用和方法,并注入了 IBM 的最佳实践,因此 IBM 顾问可以帮助客户加快云计算和人工智能转型任务(如代码现代化和质量工程),或跨领域转型和执行运营(如财务、人力资源和采购)。

欲了解更多有关磐研和 IBM AI for Business 战略的信息,请访问 www.ibm.com/granite.

1成本计算基于开放模型 IBM watsonx 的每百万代币 API 成本定价和 GPT4 模型 openAI 的每百万代币成本定价(假设混合 80% 输入,20% 输出),用于客户概念验证。
2 IBM Research 技术论文:花岗岩 3.0 语言模型
3IBM Research 技术论文:花岗岩 3.0 语言模型
4微小时间混合器:用于增强多变量时间序列零点/少点预测的快速预训练模型
5在 Granite Guardian GitHub Repo 中发布评估结果
6计划于 2024 年第四季度推出
7 计划于 2024 年第四季度推出
8 计划于 2025 年第一季度推出

Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 10 > IBM 推出面向企业的 Granite 3.0 开源人工智能模型
Codrut Nistor, 2024-10-22 (Update: 2024-10-22)