5% 首頁 5%新聞 查看內容

DeepSeek V3.2 正式版

2025-12-2 15:25| 發佈者: 5pa| 評論: 0|來自: DeepSeek官網

摘要: AI 領域再掀波瀾!被譽為「開源之神」的 DeepSeek 周一 (1 日) 晚間正式發布 DeepSeek-V3.2 版本,這一全新模型在多項關鍵指標上實現了重大突破,性能全面超越 OpenAI 的 GPT-5 High,與谷歌最強的 Gemini-3.0 Pro ...
 

DeepSeek V3.2 正式版:強化Agent 能力,融入思考推理

兩個月前,我們發布了實驗性的DeepSeek-V3.2-Exp,並收到了許多熱心用戶回饋的對比測試結果。目前未發現V3.2-Exp 在任何特定場景中顯著差於V3.1-Terminus,驗證了DSA 稀疏注意力機制的有效性。也感謝廣大用戶一直以來的正面回饋與支持,為我們的持續創新註入了更多信心與動力。

今天,我們同時發布兩個正式版模型:DeepSeek-V3.2 和DeepSeek-V3.2-Speciale。官方網頁端、App 和API 均已更新為正式版DeepSeek-V3.2,歡迎使用。 Speciale 版本目前僅以臨時API 服務形式開放,以供社區評測與研究。

新模型技術報告已同步發布:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf


推理能力全球領先

  • DeepSeek-V3.2 的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用Agent 任務場景。在公開的推理類Benchmark 測試中,DeepSeek-V3.2 達到了GPT-5 的水平,僅略低於Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2 的輸出長度大幅降低,顯著減少了計算開銷與用戶等待時間。

  • DeepSeek-V3.2-Speciale 的目標是將開源模型的推理能力推向極致,探索模型能力的邊界。 V3.2-Speciale 是DeepSeek-V3.2 的長思考增強版,同時結合了DeepSeek-Math-V2 的定理證明能力。模型具備優異的指令跟隨、嚴謹的數學證明與邏輯驗證能力,在主流推理基準測試上的表現表現媲美Gemini-3.0-Pro(見下表)。更令人矚目的是,V3.2-Speciale 模型成功斬獲IMO 2025(國際數學奧林匹克)、CMO 2025(中國數學奧林匹克)、ICPC World Finals 2025(國際大學生程式設計競賽全球總決賽)及IOI 2025(國際資訊學奧林匹克)。其中,ICPC 與IOI 成績分別達到了人類選手第二名與第十名的水平。

Tips:在高度複雜任務上,Speciale 模型大幅優於標準版本,但消耗的Tokens 也顯著更多,成本更高。目前,DeepSeek-V3.2-Speciale 僅供研究使用,不支援工具調用,暫未針對日常對話與寫作任務進行專案最佳化。

表1:DeepSeek-V3.2 與其他模型在各類數學、程式碼與通用領域評測集上的得分(括號內為消耗Tokens 總量約數)

思考融入工具調用

  • 有別於過往版本在思考模式下無法調用工具的限制,DeepSeek-V3.2 是我們推出的首個將思考融入工具使用的模型,並且同時支持思考模式與非思考模式的工具調用。我們提出了一種大規模Agent 訓練資料合成方法,建構了大量「難解,易驗證」的強化學習任務(1800+ 環境,85,000+ 複雜指令),大幅提升了模型的泛化能力。

表2:DeepSeek-V3.2 與其他模型在各類智能體工具調用評測集的得分

  • 如上表所示,DeepSeek-V3.2 模式在智能體評測中達到了目前開源模式的最高水平,大幅縮小了開源模式與閉源模式的差距。值得說明的是,V3.2 並沒有針對這些測試集的工具進行特殊訓練,所以我們相信,V3.2 在真實應用場景中能夠展現出較強的泛化性。


範例為透過LobeChat 使用DeepSeek-V3.2 的深度思考+工具呼叫能力得到更詳細準確的回复

開源

  • DeepSeek-V3.2

** HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2

** ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

  • DeepSeek-V3.2-Speciale

** HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

** ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale


網頁端、APP 與API 更新

DeepSeek-V3.2 是我們目前正式提供服務的模型,官網網頁、APP、API 模型均已由DeepSeek-V3.2-Exp 升級為正式版DeepSeek-V3.2,使用方式不變。

同時,為了方便社區評測與研究,我們非正式部署了DeepSeek-V3.2-Speciale 的API 服務,API 使用者可以透過設定base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"存取該模型。此模型API 價格不變,只支援思考模式下的對話功能,不支援工具呼叫等功能,最大輸出長度預設為128K,支援時間截止至北京時間2025-12-15 23:59。


思考模式下的工具調用

本次API 更新支援了DeepSeek-V3.2 思考模式下的工具呼叫能力。目前在思考模式下,模型能夠經過多輪的思考+ 工具調用,最終給出更詳盡準確的答案。下圖為思考模式下進行工具呼叫的API 請求示意圖:

  • 在回答問題1 過程中(請求1.1 - 1.3),模型進行了多次思考+ 工具呼叫後給出答案。在這個過程中,使用者需回傳思維鏈內容(reasoning_content)給API,讓模型繼續思考。

  • 在下一個使用者問題開始時(請求2.1),需刪除先前的思維鏈,並保留其它內容傳送給API。

  • 更詳細的使用方法請參考API 文件:https://api-docs.deepseek.com/zh-cn/guides/thinking_mode

DeepSeek-V3.2 的思考模式也增加了對Claude Code 的支持,使用者可以透過將模型名稱改為deepseek-reasoner,或在Claude Code CLI 中按Tab 鍵開啟思考模式來使用。但要注意的是,思考模式未充分適配Cline、RooCode 等使用非標準工具呼叫的元件,我們建議使用者在使用此類元件時繼續使用非思考模式。


鮮花

握手

雷人

路過

雞蛋

最新評論

相關分類