跳转到内容

DeepSeek V2.5

维基百科,自由的百科全书
Deepseek V2.5
开发者深度求索
首次发布2024年9月15日,​4个月前​(2024-09-15
前任DeepSeek-V2
继任Deepseek-V3
类型
许可协议MIT
网站www.deepseek.com

DeepSeek-V2.5深度求索于2024年9月15日发布的人工智能大型语言模型,专门适用于通用、编码等任务。在自然语言理解、文本生成、情感分析、知识图谱构建等方面具有显著的性能提升。[1]

功能

[编辑]

DeepSeek-V2.5基于深度学习技术。DeepSeek-V2.5在AlpacaEval 2.0中整体准确度为 50.5%,比 DeepSeek-V2-0628 (46.6%) 和 DeepSeek-Coder-V2-0724 (44.5%) 有所提升。在HumanEval Python中DeepSeek-V2.5 得分为 89,反映了其在编码能力方面的显著进步。在语言对齐方面,DeepSeek-V2.5在中文评估中优于GPT-4o mini和GPT-4o。但与OpenAI 的GPT-4o mini、Claude 3.5 Sonnet 和OpenAI 的GPT-4o 相比,性能较低。[2]

使用

[编辑]

DeepSeek-V2.5使用MIT协议开源,意味着任何人都可以自由使用该模型,包括商业用途。用户可以在DeepSeek官方网站和App使用官方提供的服务。DeepSeek-V2.5上线时提供的 API 服务定价为价格为每 100 万个代币 0.14 美元,输出代币价格为每 100 万个代币 0.28 美元。[3]

DeepSeek-V2.5-1210

[编辑]

DeepSeek-V2.5-1210 是 DeepSeek V2.5 模型的最后一个版本,使用了Post-Training ,发布于2024年12月10日,这版模型优化了文件上传功能,并且全新支援了联网搜索。根据MATH-500数据集的评估,模型的数学任务完成率从74.8% 提升至82.8%,而LiveCodebench 的得分也从29.2% 提高到34.38%。此外,内部评估也表明,模型在写作和推理能力上都有所提升,能够产生连贯且符合上下文的输出。[4]

参见

[编辑]

参考资料

[编辑]
  1. ^ DeepSeek V2 系列收官,联网搜索上线官网 | DeepSeek API Docs. api-docs.deepseek.com. [2025-01-29] (中文(中国大陆)). 
  2. ^ Franzen, Carl. DeepSeek-V2.5 wins praise as the new, true open source AI model leader. VentureBeat. 2024-09-10 [2025-01-29] (美国英语). 
  3. ^ DeepSeek-V2.5: A Comprehensive Overview. www.linkedin.com. [2025-01-29] (中文). 
  4. ^ DeepSeek AI 发布新版 DeepSeek-V2.5-1210:数学、编程与写作能力大幅提升. www.aibase.com. [2025-01-29] (中文). 

外部链接

[编辑]