DeepSeek 深夜更新R1,最新版本R1-0528,目前模型卡還沒有更新,但是模型權重已經上傳到Hugging Face
另外LiveCodeBench編程排名第四,與OpenAI o3和o4mini非常接近
LiveCodeBench 是一個用于評估大語言模型(LLMs)在實時編程場景中性能的基準測試框架。它專注于測試模型在實際編程任務中的表現,例如代碼生成、調試、解釋和迭代開發等動態交互能力,而不僅僅是靜態的代碼補全或合成
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.