Notebookcheck Logo

蚂蚁金服集团在中国芯片上训练人工智能模型,将成本降低 20

蚂蚁金服集团利用中国半导体成功训练人工智能模型,将成本降低 20%(图片来源:蚂蚁金服集团)
蚂蚁金服集团利用中国半导体成功训练人工智能模型,将成本降低 20%(图片来源:蚂蚁金服集团)
蚂蚁金服集团现在使用中国自主研发的芯片训练人工智能模型,与英伟达硬件相比,成本降低了 20%,同时取得了具有竞争力的成果。这标志着中国在美国出口管制下朝着技术自给自足的方向迈出了重要一步。
AI Business

马云的金融科技公司利用来自阿里巴巴和华为的国产芯片阿里巴巴和华为的国产芯片来训练人工智能模型,这些模型似乎可以与英伟达的 H800 GPU 相媲美。

据知情人士透露,蚂蚁金服集团已经找到了在中国制造的半导体上训练人工智能模型的方法,与传统方法相比,成本降低了约20%。

业内人士称,蚂蚁金服的成果与英伟达公司(Nvidia Corp. 由于美国的出口管制.尽管蚂蚁金服的部分人工智能工作仍在使用 Nvidia 硬件,但据报道,该公司目前在其最新机型中更加重视 AMD 处理器和中国替代品。

蚂蚁金服本月发表了一篇研究论文,声称其 Ling-Plus 和 Ling-Lite 型号甚至在某些基准测试中击败了 Meta Platforms Inc.如果这些研究结果属实,那么这些系统将大幅削减培训和推出人工智能服务的费用,从而代表中国人工智能的重大飞跃。

论文指出,使用高性能硬件训练1万亿个代币大约需要635万元人民币(约合88万美元)。但采用该公司的优化方法和低规格设备后,这一数字降至约510万元人民币(约合70万美元)。对于不熟悉的人来说,代币本质上是这些模型用于学习和产生输出的信息单位。

展望未来,蚂蚁金服打算将这些人工智能模型应用于医疗保健和金融领域。今年早些时候,蚂蚁金服收购了中国在线平台好大夫(Haodf.com),以加强其以医疗保健为重点的人工智能服务。蚂蚁金服还运营着一款名为 "知小宝 "的人工智能 "生活助手 "应用和一款名为 "麦小财 "的人工智能金融咨询工具。

这两个Ling模型都是开源的:Ling-Lite拥有168亿个参数,而Ling-Plus则有2900亿个参数。虽然这些数字很庞大,但仍小于其他一些主要的人工智能模型--专家估计GPT-4.5的参数约为1.8万亿个,而DeepSeek-R1则达到6710亿个。

蚂蚁金服承认在这条道路上遇到了一些坎坷,尤其是在训练过程中的稳定性方面。研究论文指出,硬件或模型设计的微小变化有时会引发错误率的大幅飙升。

资料来源

彭博社(英语)

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 03 > 蚂蚁金服集团在中国芯片上训练人工智能模型,将成本降低 20
Nathan Ali, 2025-03-25 (Update: 2025-03-25)