DeepSeek V3.2 正式版

2025-12-2 15:25| 發佈者: 5pa| 評論: 2|來自: DeepSeek官網

摘要: AI 領域再掀波瀾！被譽為「開源之神」的 DeepSeek 周一 (1 日) 晚間正式發布 DeepSeek-V3.2 版本，這一全新模型在多項關鍵指標上實現了重大突破，性能全面超越 OpenAI 的 GPT-5 High，與谷歌最強的 Gemini-3.0 Pro ...

DeepSeek V3.2 正式版：強化Agent 能力，融入思考推理

兩個月前，我們發布了實驗性的DeepSeek-V3.2-Exp，並收到了許多熱心用戶回饋的對比測試結果。目前未發現V3.2-Exp 在任何特定場景中顯著差於V3.1-Terminus，驗證了DSA 稀疏注意力機制的有效性。也感謝廣大用戶一直以來的正面回饋與支持，為我們的持續創新註入了更多信心與動力。

今天，我們同時發布兩個正式版模型：DeepSeek-V3.2 和DeepSeek-V3.2-Speciale。官方網頁端、App 和API 均已更新為正式版DeepSeek-V3.2，歡迎使用。 Speciale 版本目前僅以臨時API 服務形式開放，以供社區評測與研究。

新模型技術報告已同步發布：https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf

推理能力全球領先

DeepSeek-V3.2 的目標是平衡推理能力與輸出長度，適合日常使用，例如問答場景和通用Agent 任務場景。在公開的推理類Benchmark 測試中，DeepSeek-V3.2 達到了GPT-5 的水平，僅略低於Gemini-3.0-Pro；相比Kimi-K2-Thinking，V3.2 的輸出長度大幅降低，顯著減少了計算開銷與用戶等待時間。
DeepSeek-V3.2-Speciale 的目標是將開源模型的推理能力推向極致，探索模型能力的邊界。 V3.2-Speciale 是DeepSeek-V3.2 的長思考增強版，同時結合了DeepSeek-Math-V2 的定理證明能力。模型具備優異的指令跟隨、嚴謹的數學證明與邏輯驗證能力，在主流推理基準測試上的表現表現媲美Gemini-3.0-Pro（見下表）。更令人矚目的是，V3.2-Speciale 模型成功斬獲IMO 2025（國際數學奧林匹克）、CMO 2025（中國數學奧林匹克）、ICPC World Finals 2025（國際大學生程式設計競賽全球總決賽）及IOI 2025（國際資訊學奧林匹克）。其中，ICPC 與IOI 成績分別達到了人類選手第二名與第十名的水平。

Tips：在高度複雜任務上，Speciale 模型大幅優於標準版本，但消耗的Tokens 也顯著更多，成本更高。目前，DeepSeek-V3.2-Speciale 僅供研究使用，不支援工具調用，暫未針對日常對話與寫作任務進行專案最佳化。

表1：DeepSeek-V3.2 與其他模型在各類數學、程式碼與通用領域評測集上的得分（括號內為消耗Tokens 總量約數）

思考融入工具調用

有別於過往版本在思考模式下無法調用工具的限制，DeepSeek-V3.2 是我們推出的首個將思考融入工具使用的模型，並且同時支持思考模式與非思考模式的工具調用。我們提出了一種大規模Agent 訓練資料合成方法，建構了大量「難解，易驗證」的強化學習任務（1800+ 環境，85,000+ 複雜指令），大幅提升了模型的泛化能力。

表2：DeepSeek-V3.2 與其他模型在各類智能體工具調用評測集的得分

如上表所示，DeepSeek-V3.2 模式在智能體評測中達到了目前開源模式的最高水平，大幅縮小了開源模式與閉源模式的差距。值得說明的是，V3.2 並沒有針對這些測試集的工具進行特殊訓練，所以我們相信，V3.2 在真實應用場景中能夠展現出較強的泛化性。

範例為透過LobeChat 使用DeepSeek-V3.2 的深度思考+工具呼叫能力得到更詳細準確的回复

開源

DeepSeek-V3.2

** HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2

** ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

DeepSeek-V3.2-Speciale

** HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

** ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

網頁端、APP 與API 更新

DeepSeek-V3.2 是我們目前正式提供服務的模型，官網網頁、APP、API 模型均已由DeepSeek-V3.2-Exp 升級為正式版DeepSeek-V3.2，使用方式不變。

同時，為了方便社區評測與研究，我們非正式部署了DeepSeek-V3.2-Speciale 的API 服務，API 使用者可以透過設定base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"存取該模型。此模型API 價格不變，只支援思考模式下的對話功能，不支援工具呼叫等功能，最大輸出長度預設為128K，支援時間截止至北京時間2025-12-15 23:59。

思考模式下的工具調用

本次API 更新支援了DeepSeek-V3.2 思考模式下的工具呼叫能力。目前在思考模式下，模型能夠經過多輪的思考+ 工具調用，最終給出更詳盡準確的答案。下圖為思考模式下進行工具呼叫的API 請求示意圖：

在回答問題1 過程中（請求1.1 - 1.3），模型進行了多次思考+ 工具呼叫後給出答案。在這個過程中，使用者需回傳思維鏈內容（reasoning_content）給API，讓模型繼續思考。
在下一個使用者問題開始時（請求2.1），需刪除先前的思維鏈，並保留其它內容傳送給API。
更詳細的使用方法請參考API 文件：https://api-docs.deepseek.com/zh-cn/guides/thinking_mode

DeepSeek-V3.2 的思考模式也增加了對Claude Code 的支持，使用者可以透過將模型名稱改為deepseek-reasoner，或在Claude Code CLI 中按Tab 鍵開啟思考模式來使用。但要注意的是，思考模式未充分適配Cline、RooCode 等使用非標準工具呼叫的元件，我們建議使用者在使用此類元件時繼續使用非思考模式。