跳转到内容

DeepSeek-R1-Lite

维基百科,自由的百科全书
Deepseek R1 Lite
开发者深度求索
首次发布2024年11月20日,​2个月前​(2024-11-20
前任DeepSeek V2.5
继任Deepseek-V3
类型
许可协议专有软件
网站www.deepseek.com

DeepSeek-R1-Lite深度求索于2024年11月20日发布的人工智能大型语言模型,是深度求索第一个推理模型。专门适用于数学、编码和逻辑等任务,性能对标OpenAI o1DeepSeek-R1-Lite是Deepseek R1的预览版,正式版为DeepSeek-R1[1]

功能

[编辑]

Deepseek R1 Lite深度求索第一个推理模型,Deepseek称该模型用了强化学习训练,并为用户展现了 o1 没有公开的完整思考过程。而该模型关键特点就是便宜,与OpenAI o1的价格相差极大。Deepseek R1 Lite在回答问题前会花更多时间思考,因此准确度会增强。Deepseek的测试结果表明,在数学竞赛上的得分与测验所允许思考的长度紧密相关,而模型思维炼长度增加展现了更高的效率。[1]

Deepseek R1 Lite在数学、代码和复杂逻辑推理上,获得媲美 o1-preview 的推理效果。在美国数学邀请赛中DeepSeek 称,该模型在美国邀请数学考试和 MATH 等既定基准上的表现超过了 OpenAI o1 Preview的水平,在国际数学奥林匹克正确率达到83%,它还在Codeforces编程竞赛中优于89%的参赛者,但在GPQA Diamond,LiveCodeBench和自然语言解迷中较为逊色。[2]

参见

[编辑]

参考资料

[编辑]
  1. ^ 1.0 1.1 DeepSeek推理模型预览版上线,解密o1推理过程 | DeepSeek API Docs. api-docs.deepseek.com. [2025-01-29] (中文(中国大陆)). 
  2. ^ Franzen, Carl. DeepSeek’s first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance. VentureBeat. 2024-11-20 [2025-01-29] (美国英语). 

外部链接

[编辑]