Notebookcheck Logo

阿里巴巴人工智能模型 Qwen 2.5 Max 战胜 Deepseek

人工智能模型 Qwen 2.5 战胜 Deepseek(图片来源:AI Generated)
人工智能模型 Qwen 2.5 战胜 Deepseek(图片来源:AI Generated)
就在 Deepseek 发布前夕,阿里巴巴最新版本的 Qwen 2.5 Max 提供了比所有其他人工智能模型都更好的测试结果,从刚刚起步的 Deepseek 手中夺走了宝座。
AI Benchmark Business Charts Launch Science Software

中国科技和电子商务巨头阿里巴巴集团控股有限公司(Alibaba Group Holding Ltd.)推出了 Qwen 2.5 Max,这是一款尖端的人工智能模型,该公司宣称其性能超过 Deepseek v3。

阿里巴巴称,在性能评估方面,Qwen 2.5 Max 超越了 Deepseek、OpenAI 和 Meta 等领先的人工智能模型。该模型在包括Arena-Hard、LiveBench、LiveCodeBench、MMLU和GPQA-Diamond在内的多项基准测试中均取得了优异成绩。值得注意的是,它在 MMLU 和 LiveCodeBench 上的得分设定了新的行业标准,彰显了其先进的能力。

Qwen 2.5 Max 指导模型的性能(图片来源:Qwen 团队)
Qwen 2.5 Max 指导模型的性能(图片来源:Qwen 团队)

Deepseek 的首次亮相在整个硅谷引起了震动,引发了科技股的大幅下跌,并促使竞争对手重新聚焦于展示其人工智能技术的进步。针对 Deepseek 的颠覆性登场,ByteDance 迅速宣布改进自己的人工智能模型,并吹嘘自己在 AIME 基准测试中超越了 OpenAI 的 o1。

Qwen 2.5 Max 的发布似乎具有战略意义,它可能反映了中国自己的技术部门为保持与外国竞争对手的竞争势头所面临的日益增长的压力。发布时间是 2025 年 1 月 29 日,农历新年的第一天,这是一个重要的节日,大多数中国企业都会在这一天暂时停止运营。尽管 Deepseek 引发了更激烈的竞争,但这一提前发布凸显了阿里巴巴保持其在人工智能创新领域领先地位的决心。

随着人工智能技术的飞速发展,阿里巴巴的最新成就标志着全球人工智能竞赛又向前迈进了一步。

Qwen 2.5 Max 基准测试(图片来源:Qwen 团队)
Qwen 2.5 Max 基准测试(图片来源:Qwen 团队)

资料来源

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 01 > 阿里巴巴人工智能模型 Qwen 2.5 Max 战胜 Deepseek
Santiago Nino, 2025-01-30 (Update: 2025-01-30)