DeepSeek 在首次发布三个月后发布改进版 V3 人工智能模型

DeepSeek-V3-0324 发布，性能和功能均有提升。(图片来源：DeepSeek）

DeepSeek-V3-0324 版本是在 2024 年 12 月发布 DeepSeek V3 版本三个月后发布的。这一升级版的性能和功能都得到了提高，例如可以创建吸引人的网页和撰写精美的中文报告。

David Chien (translated by Ninh Duy), Published 03/29/2025 🇺🇸 🇫🇷 ...

Launch AI Software Open Source

中国人工智能公司DeepSeek发布了DeepSeek-V3-0324，这是其最初于2024年12月推出的V3人工智能大语言模型（LLM）的升级版本。V3 模型因其更低的训练硬件要求、更短的训练时间、更低的 API 成本，以及与 OpenAI 的 GPT 模型等竞争人工智能相比更高的性能而震惊世界。

更新后的 V3 模型是一个非推理人工智能模型，这意味着它与 DeepSeek 的 R1 模型不同，会尝试快速回答问题，而不会花费额外的时间去思考棘手的问题。其 685 亿个参数的规模使其跻身于公开可用的最大 LLM 之列。最新模型可在 MIT 许可下使用。

DeepSeek-V3-0324 在人工智能基准测试中的得分比最初的 V3 高出 5.3% 到 19.8%。其性能可与其他顶级人工智能相媲美，如 GPT-4.5 和 Claude Sonnet 3.7。

更新后的模型还具有更强的能力。其中一项改进是，它能为网络游戏创建吸引人的网页和前端。另一项改进是能更好地搜索、书写和翻译中文。

读者若想体验完整的 685B DeepSeek-V3-0324 版，至少需要 700 GB 的可用存储空间和多个 Nvidia A100/H100 GPU。该模型的精简版和较小参数版可在单个 GPU（如 Nvidia 3090，亚马逊有售）上运行。