DeepSeek R1型號進行了小版本升級,當前版本是DeepSeek-R1-0528。
這次更新中,DeepSeek R1通過利用增加的計算資源并在訓練后引入算法優化機制,顯著提高了其推理深度和推理能力。 該模型在包括數學、編程和一般邏輯在內的各種基準評估中都表現出了出色的表現。 它的整體性能現在接近領先模型,如O3和Gemini 2.5 Pro。
除了核心的推理能力,新版本在減少幻覺、增強函數調用支持以及提升“vibe coding”方面也有所優化
MIT許可
DeepSeek不僅在旗艦模型上發力,還考慮到了小型化模型的應用前景。他們將DeepSeek-R1-0528的“思考鏈”(chain-of-thought)能力蒸餾到了Qwen3 8B基礎模型上,成功打造出DeepSeek-R1-0528-Qwen3-8B
這款8B模型在AIME 2024測試中,超越了原版Qwen3 8B并且達到了與Qwen3-235B-thinking版本相媲美的性能,成為開源8B模型在該測試上的SOTA 。這對于推動小型化推理模型在學術研究和工業界的落地具有重要意義
例如,在AIME 2024上,DeepSeek-R1-0528-Qwen3-8B得分86.0,而Qwen3-8B為76.0,Qwen3-235B-A22B為85.7
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.