Notebookcheck Logo

埃隆-马斯克的 xAI 将 Colossus 100k H100 训练集群上线

Nvidia Hopper H100 GPU(图片来源:Nvidia)
Nvidia Hopper H100 GPU(图片来源:Nvidia)
经过 122 天的努力,xAI 的开发团队成功上线了迄今为止世界上最强大的人工智能训练系统。目前,该系统拥有 10 万个 H100 GPU,但马斯克声称这一数字将在几个月内翻一番。谷歌的最高GPU数量为9万,而OpenAI的顶级人工智能训练系统拥有8万GPU。
AI Nvidia GPU Science

Nvidia Hopper H100 GPU 于 2022 年 9 月底发布。 Nvidia Hopper H100 GPU目前正在为世界上最强大的人工智能训练系统提供动力。上周末,埃隆-马斯克(Elon Musk)的人工智能公司 xAI 凭借 Colossus 100k H100 训练系统领先于竞争对手,该系统从开始实施到上线需要 122 天的努力。顾名思义,它使用了不少于 100,000 个 H100 GPU。它的主要竞争对手是谷歌(9 万)、OpenAI(8 万)和 Meta(7 万)。微软和 Nvidia 分别以 60,000 和 50,000 个 GPU 名列前茅。

然而,对于埃隆-马斯克(Elon Musk)来说,这一成就还远远不够,他已经为 xAI 的未来制定了计划。这位科技天才希望尽快将 xAI 训练系统的能力提高一倍。马斯克在关于新的 Colossus AI 训练系统的帖子中提到,"它将在几个月内将规模扩大一倍,达到 200k(50k H200)",但并未提及这种快速扩张的目标。

早在 2023 年 xAI 成立之初,埃隆-马斯克就曾说过,这家公司的目标是 "了解宇宙的真正本质",而整个努力的结果会是什么,我们拭目以待。xAI 下一波扩张可能会使用的 H200 芯片已经有了后继者,即 Nvidia Blackwell。与 H200 相比,它的高端容量提高了 36.2%,总带宽提高了 66.7%。

目前,xAI 可以自由使用 Colossus 人工智能训练系统,但如果加州州长加文-纽森(Gavin Newsom)批准人工智能安全法案,情况可能会从下个月开始发生变化。想了解更多有关人工智能安全的信息,可以参考克里斯-阿特格卡(Chris Ategeka)的《保护人类》(Safeguarding Humanity)一书:人工智能安全综合指南》,平装本售价 19.99 美元。

资料来源

埃隆-马斯克(推特上)

Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 09 > 埃隆-马斯克的 xAI 将 Colossus 100k H100 训练集群上线
Codrut Nistor, 2024-09- 4 (Update: 2024-09- 4)