DeepSeek V2.5
此条目没有列出任何参考或来源。 (2025年1月29日) |
开发者 | 深度求索 |
---|---|
首次发布 | 2024年9月15日 |
前任 | DeepSeek-V2 |
继任 | Deepseek-V3 |
类型 | |
许可协议 | MIT |
网站 | www |
DeepSeek-V2.5是深度求索于2024年9月15日发布的人工智能大型语言模型,专门适用于通用、编码等任务。在自然语言理解、文本生成、情感分析、知识图谱构建等方面具有显著的性能提升。[1]
功能
[编辑]DeepSeek-V2.5基于深度学习技术。DeepSeek-V2.5在AlpacaEval 2.0中整体准确度为 50.5%,比 DeepSeek-V2-0628 (46.6%) 和 DeepSeek-Coder-V2-0724 (44.5%) 有所提升。在HumanEval Python中DeepSeek-V2.5 得分为 89,反映了其在编码能力方面的显著进步。在语言对齐方面,DeepSeek-V2.5在中文评估中优于GPT-4o mini和GPT-4o。但与OpenAI 的GPT-4o mini、Claude 3.5 Sonnet 和OpenAI 的GPT-4o 相比,性能较低。[2]
使用
[编辑]DeepSeek-V2.5使用MIT协议开源,意味着任何人都可以自由使用该模型,包括商业用途。用户可以在DeepSeek官方网站和App使用官方提供的服务。DeepSeek-V2.5上线时提供的 API 服务定价为价格为每 100 万个代币 0.14 美元,输出代币价格为每 100 万个代币 0.28 美元。[3]
DeepSeek-V2.5-1210
[编辑]DeepSeek-V2.5-1210 是 DeepSeek V2.5 模型的最后一个版本,使用了Post-Training ,发布于2024年12月10日,这版模型优化了文件上传功能,并且全新支援了联网搜索。根据MATH-500数据集的评估,模型的数学任务完成率从74.8% 提升至82.8%,而LiveCodebench 的得分也从29.2% 提高到34.38%。此外,内部评估也表明,模型在写作和推理能力上都有所提升,能够产生连贯且符合上下文的输出。[4]
参见
[编辑]参考资料
[编辑]- ^ DeepSeek V2 系列收官,联网搜索上线官网 | DeepSeek API Docs. api-docs.deepseek.com. [2025-01-29] (中文(中国大陆)).
- ^ Franzen, Carl. DeepSeek-V2.5 wins praise as the new, true open source AI model leader. VentureBeat. 2024-09-10 [2025-01-29] (美国英语).
- ^ DeepSeek-V2.5: A Comprehensive Overview. www.linkedin.com. [2025-01-29] (中文).
- ^ DeepSeek AI 发布新版 DeepSeek-V2.5-1210:数学、编程与写作能力大幅提升. www.aibase.com. [2025-01-29] (中文).