DeepSeek V2.5

Deepseek V2.5
开发者	深度求索
首次发布	2024年9月15日，4个月前
前任	DeepSeek-V2
继任	Deepseek-V3
类型	大型语言模型; 基于转换器的生成式预训练模型; 基础模型;
许可协议	MIT
网站	www.deepseek.com

DeepSeek-V2.5是深度求索于2024年9月15日发布的人工智能大型语言模型，专门适用于通用、编码等任务。在自然语言理解、文本生成、情感分析、知识图谱构建等方面具有显著的性能提升。^[1]

功能

DeepSeek-V2.5基于深度学习技术。DeepSeek-V2.5在AlpacaEval 2.0中整体准确度为 50.5%，比 DeepSeek-V2-0628 (46.6%) 和 DeepSeek-Coder-V2-0724 (44.5%) 有所提升。在HumanEval Python中DeepSeek-V2.5 得分为 89，反映了其在编码能力方面的显著进步。在语言对齐方面，DeepSeek-V2.5在中文评估中优于GPT-4o mini和GPT-4o。但与OpenAI 的GPT-4o mini、Claude 3.5 Sonnet 和OpenAI 的GPT-4o 相比，性能较低。^[2]

使用

DeepSeek-V2.5使用MIT协议开源，意味着任何人都可以自由使用该模型，包括商业用途。用户可以在DeepSeek官方网站和App使用官方提供的服务。DeepSeek-V2.5上线时提供的 API 服务定价为价格为每 100 万个代币 0.14 美元，输出代币价格为每 100 万个代币 0.28 美元。^[3]

DeepSeek-V2.5-1210

DeepSeek-V2.5-1210 是 DeepSeek V2.5 模型的最后一个版本，使用了Post-Training ，发布于2024年12月10日，这版模型优化了文件上传功能，并且全新支援了联网搜索。根据MATH-500数据集的评估，模型的数学任务完成率从74.8% 提升至82.8%，而LiveCodebench 的得分也从29.2% 提高到34.38%。此外，内部评估也表明，模型在写作和推理能力上都有所提升，能够产生连贯且符合上下文的输出。^[4]

参见

深度求索

参考资料

^ DeepSeek V2 系列收官，联网搜索上线官网 | DeepSeek API Docs. api-docs.deepseek.com. [2025-01-29] （中文（中国大陆））.
^ Franzen, Carl. DeepSeek-V2.5 wins praise as the new, true open source AI model leader. VentureBeat. 2024-09-10 [2025-01-29] （美国英语）.
^ DeepSeek-V2.5: A Comprehensive Overview. www.linkedin.com. [2025-01-29] （中文）.
^ DeepSeek AI 发布新版 DeepSeek-V2.5-1210：数学、编程与写作能力大幅提升. www.aibase.com. [2025-01-29] （中文）.

外部链接

[1] DeepSeek V2 系列收官，联网搜索上线官网 | DeepSeek API Docs. api-docs.deepseek.com. [2025-01-29] （中文（中国大陆））.

[2] Franzen, Carl. DeepSeek-V2.5 wins praise as the new, true open source AI model leader. VentureBeat. 2024-09-10 [2025-01-29] （美国英语）.

[3] DeepSeek-V2.5: A Comprehensive Overview. www.linkedin.com. [2025-01-29] （中文）.

[4] DeepSeek AI 发布新版 DeepSeek-V2.5-1210：数学、编程与写作能力大幅提升. www.aibase.com. [2025-01-29] （中文）.

[1]

[2]

[3]

[4]