Notebookcheck Logo

DeepSeek 在首次发布三个月后发布改进版 V3 人工智能模型

DeepSeek-V3-0324 发布,性能和功能均有提升。(图片来源:DeepSeek)
DeepSeek-V3-0324 发布,性能和功能均有提升。(图片来源:DeepSeek)
DeepSeek-V3-0324 版本是在 2024 年 12 月发布 DeepSeek V3 版本三个月后发布的。这一升级版的性能和功能都得到了提高,例如可以创建吸引人的网页和撰写精美的中文报告。
Launch AI Software Open Source

中国人工智能公司DeepSeek发布了DeepSeek-V3-0324,这是其最初于2024年12月推出的V3人工智能大语言模型(LLM)的升级版本。V3 模型因其更低的训练硬件要求、更短的训练时间、更低的 API 成本,以及与 OpenAI 的 GPT 模型等竞争人工智能相比更高的性能而震惊世界。

更新后的 V3 模型是一个非推理人工智能模型,这意味着它与 DeepSeek 的 R1 模型不同,会尝试快速回答问题,而不会花费额外的时间去思考棘手的问题。其 685 亿个参数的规模使其跻身于公开可用的最大 LLM 之列。最新模型可在 MIT 许可下使用。

DeepSeek-V3-0324 在人工智能基准测试中的得分比最初的 V3 高出 5.3% 到 19.8%。其性能可与其他顶级人工智能相媲美,如 GPT-4.5 和 Claude Sonnet 3.7。

更新后的模型还具有更强的能力。其中一项改进是,它能为网络游戏创建吸引人的网页和前端。另一项改进是能更好地搜索、书写和翻译中文。

读者若想体验完整的 685B DeepSeek-V3-0324 版,至少需要 700 GB 的可用存储空间和多个 Nvidia A100/H100 GPU。该模型的精简版和较小参数版可在单个 GPU如 Nvidia 3090,亚马逊有售)上运行。

DeepSeek-V3-0324 AI 的性能比最初版本有所提高,AI 基准得分更高。(图片来源:DeepSeek)
DeepSeek-V3-0324 AI 的性能比最初版本有所提高,AI 基准得分更高。(图片来源:DeepSeek)

DeepSeek-V3-0324发布

推理性能大幅提升

更强的前端开发能力

更智能的工具使用能力

对于不复杂的推理任务,我们建议使用V3--只需关闭 "DeepThink "即可

应用程序接口用法保持不变

与DeepSeek-R1一样,模型现在以MIT许可发布!

开源权重:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 03 > DeepSeek 在首次发布三个月后发布改进版 V3 人工智能模型
David Chien, 2025-03-29 (Update: 2025-03-29)