DeepSeek-R1
開發者 | 深度求索 |
---|---|
首次發佈 | 2025年1月20日 |
原始碼庫 | |
前任 | DeepSeek-R1-Lite |
類型 | |
許可協議 | MIT |
網站 | www |
DeepSeek-R1是深度求索(DeepSeek)於2025年1月20日發佈的人工智能大型語言模型,專門適用於數學、編碼和邏輯等任務,性能對標OpenAI o1[1]。
開發
[編輯]開發者 | 深度求索 |
---|---|
首次發佈 | 2024年11月20日 |
原始碼庫 | |
前任 | DeepSeek V2.5 |
繼任 | Deepseek-V3 |
類型 | |
許可協議 | 專有軟件 |
網站 | www |
DeepSeek-R1-Lite是深度求索於2024年11月20日發佈的人工智能大型語言模型,是深度求索第一個推理模型。專門適用於數學、編碼和邏輯等任務,性能對標OpenAI o1,DeepSeek-R1-Lite是Deepseek R1的預覽版。[2]DeepSeek稱該模型用了強化學習訓練,並為用戶展現了 o1 沒有公開的完整思考過程。而該模型關鍵特點就是便宜,與OpenAI o1的價格相差極大。Deepseek R1 Lite在回答問題前會花更多時間思考,因此準確度會增強。Deepseek的測試結果表明,在數學競賽上的得分與測驗所允許思考的長度緊密相關,而模型思維鍊長度增加展現了更高的效率。[2]
Deepseek-R1-Lite在數學、代碼和複雜邏輯推理上,獲得媲美 o1-preview 的推理效果。在美國數學邀請賽中DeepSeek 稱,該模型在美國邀請數學考試和 MATH 等既定基準上的表現超過了 OpenAI o1 Preview的水平,在國際數學奧林匹克正確率達到83%,它還在Codeforces編程競賽中優於89%的參賽者,但在GPQA Diamond,LiveCodeBench和自然語言解迷中較為遜色。[3]
DeepSeek-R1的論文中沒有公佈其訓練成本等細節。[4]不過此前的論文中,DeepSeek透露其訓練使用的是英偉達因為美國出口管制而針對中國市場特供的低配版GPU H800,訓練成本為557.6萬美元,遠低於類似西方公司的閉源模型。[1][5][6]外界預估R1的訓練成本也不會比DeepSeek-V3高多少,或在600萬美元上下。[7]
使用
[編輯]DeepSeek-R1使用MIT協議開源,意味着任何人都可以自由使用該模型,包括商業用途。用戶可以在DeepSeek官方網站和App使用官方提供的服務。
DeepSeek-R1上線時提供的API服務定價為每百萬輸入tokens 1元人民幣(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元,輸出API價格僅僅只有OpenAI o1的3%。[8]
外界反應
[編輯]1月27日,DeepSeek超越ChatGPT,登頂蘋果App Store美國區免費APP下載排行榜。[9]
DeepSeek-R1爆火,引發全球投資者大量拋售人工智能相關股票。1月27日,英偉達美股股價下跌近17%,單日市值蒸發5890億美元,為美國股市歷史上最大。[10][11]
DeepSeek-R1發佈後不久,Meta行政總裁馬克·扎克伯格就宣佈,Meta計劃在2025年投入超600億美元,加大對人工智能的投入。[7]據媒體1月27日報道,Meta成立了四個研究小組,專門研究DeepSeek的模型。[12]其中兩個小組研究其開發者如何降低訓練和運行DeepSeek的成本,第三個小組研究訓練模型可能使用了哪些數據,第四個小組研究基於DeepSeek模型屬性重構其LLaMA模型的新技術。[13]
OpenAI表示,其有證據表明DeepSeek使用OpenAI的專有模型來訓練自己的開源模型,這違反了OpenAI的服務條款。[14]
現狀與替代方案
[編輯]由於用戶量激增,DeepSeek R1曾面臨伺服器頻繁繁忙問題,主要歸因可能有多種,包括算力需求、帶寬限制及網絡攻擊。用戶可通過本地部署(如Ollama工具)、調用API或使用第三方平台。
參見
[編輯]參考資料
[編輯]- ^ 1.0 1.1 DeepSeek横空出世,美中AI竞争会迎来根本性改变吗?. 美國之音. 2025-01-28 [2025-01-28]. (原始內容存檔於2025-01-28) (中文).
- ^ 2.0 2.1 DeepSeek推理模型预览版上线,解密o1推理过程 | DeepSeek API Docs. api-docs.deepseek.com. [2025-01-29]. (原始內容存檔於2025-01-26) (中文(中國大陸)).
- ^ Franzen, Carl. DeepSeek’s first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance. VentureBeat. 2024-11-20 [2025-01-29]. (原始內容存檔於2024-11-22) (美國英語).
- ^ DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1 (PDF). [2025-02-01]. (原始內容存檔 (PDF)於2025-01-29).
- ^ DeepSeek-V3/DeepSeek_V3.pdf at main · deepseek-ai/DeepSeek-V3 (PDF). [2025-02-01]. (原始內容存檔 (PDF)於2025-02-01).
- ^ 孫銘蔚. 量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了“AI界拼多多”. 澎湃新聞. 2025-01-22 [2025-01-28]. (原始內容存檔於2025-01-26) (中文(中國大陸)).
- ^ 7.0 7.1 吳遇利. DeepSeek“恐惧感”支配硅谷!Meta被曝组建4个小组专门研究. 澎湃新聞. 2025-01-27 [2025-01-29]. (原始內容存檔於2025-01-30) (中文(中國大陸)).
- ^ 鄭遠方. “价格屠夫”DeepSeek的理想主义:开源、降本与AI普惠. 財聯社. 2025-01-28 [2025-01-28] (中文(中國大陸)).
- ^ 李瀟瀟, 胡含嫣. DeepSeek超越ChatGPT,登顶苹果美国区免费APP下载排行榜. 澎湃新聞. 2025-01-27 [2025-01-29]. (原始內容存檔於2025-01-27).
- ^ 日本放送協會. ナスダック大幅下落 中国企業ディープシーク 生成AI開発受け. NHKニュース. 2025-01-28 [2025-01-28]. (原始內容存檔於2025-01-30) (日語).
- ^ 何浩. 英伟达市值蒸发近6000亿美元,规模创美股史上最大,市值跌至全球第三. 華爾街見聞. 2025-01-28 [2025-01-28]. (原始內容存檔於2025-01-28) (中文(中國大陸)).
- ^ Meta Scrambles After Chinese AI Equals Its Own, Upending Silicon Valley. The Information. 2024-01-27 [2025-01-29]. (原始內容存檔於2025-01-30) (英語).
- ^ DeepSeek震撼硅谷 Meta组建四个研究小组专门破解. 財聯社. 2025-01-27 [2025-01-29].
- ^ OpenAI称有证据表明DeepSeek利用其模型训练竞争对手. RFI - 法國國際廣播電台. 2025-01-29 [2025-01-29] (中文(簡體)).
外部連結
[編輯]官方網頁
[編輯]- DeepSeek-R1-Lite 發佈 (頁面存檔備份,存於互聯網檔案館)
- DeepSeek-R1 發佈,性能對標 OpenAI o1 正式版 (頁面存檔備份,存於互聯網檔案館)
- deepseek-ai/DeepSeek-R1 (頁面存檔備份,存於互聯網檔案館)