大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

DeepSeek-R1今天一次小更新,顛覆了大模型格局,網友:盡快放R2

0
分享至



超出所有人的期待。

千呼萬喚始出來,DeepSeek 迎來了推理模型更新。



昨晚,DeepSeek 官方宣布其 R1 推理模型升級到了最新版本(0528),并在今天凌晨公開了模型及權重。



HuggingFace 鏈接:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

模型文件上傳時間是凌晨 1 點,不知 DeepSeek 工程師們是不是加班到了最后一刻。也有網友表示,這回又在端午節假期前發新模型,簡直比放假通知還靠譜。



這次更新的升級版 R1 參數量高達 6850 億,體量巨大,雖然開源了出來,但大多數人只能圍觀。如果「滿血版」不進行蒸餾,是肯定無法在消費級硬件上本地運行的。

不過這種不說話直接放鏈接的態度還是引來了網友們的普遍歡迎。



根據 DeepSeek 的小范圍通知,更新后的 R1 版本采用 MIT 許可證,這意味著它可以用于商業用途,從版本號看來這是一個「小」升級,不過人們大量實測后發現,新版大模型的性能提升頗為明顯。

我們也能在新版 DeepSeek-R1 模型的配置文件中看到更多但并不出人意料的信息,包括采用了 DeepSeek-V3 作為基礎模型以及 MoE、隱藏層大小、量化等配置。



我們現在已經可以在 DeepSeek 的網頁端和 App 上直接用上這個最新版本的大模型。

有網友總結表示,新的 DeepSeek-R1-0528 可以進行更加深度的推理,輸出的文本更加自然,結構更有層次感,它展現出了獨特的推理風格,不僅速度很快,而且進行了充分的思考。與上周發布的 Claude4 類似,現在的 DeepSeek 也可以進行長時間的思考了,據說能持續 30-60 分鐘。



已經有一些網友實測時遇到了 DeepSeek 的長考,這 deep research 可夠深度的:



基準評分,成績大幅提升

DeepSeek R1 發布以來,大模型領域的格局已經發生了變化。原版 R1 的成績如今已不再領先,R1-0528 的出現修正了結果。

R1-0528 模型的第一個 Benchmark 成績是 LiveCodeBench,它超越了 O3-Mini,幾乎與 O3(High)的評分相當,在編程任務上相比上個版本有了顯著的提升。



要知道 DeepSeek 模型是完全開源的,App 目前為止也完全免費,這可以說是開源的勝利。

另外,其在 Extended NYT Connections 基準上的成績也已經出爐,相比于前一代 DeepSeek-R1,最新的 0528 版本的提升非常明顯,從 38.6 增至了 49.8,接近 Claude Opus 4 Thinking 16k;不過在該基準上,DeepSeek-R1-0528 仍舊沒有擠進 OpenAI o 系列模型占據的第一梯隊。



目前,ChatBot Arena 上也已經更新了新版本的 DeepSeek R1,讓我們看看大家充分測試過后它的排名能爬到多高。



網友實測:代碼能力大幅提升

雖然 DeepSeek-R1-0528 才剛出來不久,但已經有不少網友分享了自己的實測結果。

比如開發者 Haider 就通過一個編程挑戰賽(構建一個詞評分系統)挑戰了當前主流的前沿模型,結果發現,目前只有 o3 和新版 DeepSeek-R1 能夠完成這個挑戰。這不禁讓他感嘆:DeepSeek is so back...



也有網友通過一個小球撞墻實驗直觀地對比了 Claude-4-Sonnet 與 DeepSeek-R1-0528 的實際表現。可以看到,DeepSeek-R1 生成的代碼在模擬物理碰撞方面表現會更好一些。



Hyperbolic Labs CTO 和聯創 Yuchen Jin 也進行了簡單測試,發現 R1-0528 是目前唯一一個始終能正確回答「what is 9.9 - 9.11?」的模型。



下面是他錄制的演示視頻:


機器之心也做了一次簡單的嘗試,讓其用 Python 編寫了一個可以將 Word 文檔中的圖片提取到固定路徑的小程序。


可以看到,DeepSeek-R1 用一分多鐘完成了任務,那實際效果如何呢?很遺憾,出現了一個報錯:



這是一個簡單的句法錯誤,下面我們直接將其反饋給 R1-0528。結果出現了一個有趣的現象,對于這個簡單報錯,R1 模型思考的時間(212 秒)遠遠超過了之前寫出整個程序的時間。



查看其思考過程可知,新版本的 R1 與之前的版本一樣存在過度思考的問題,即反復思考和驗證原本很簡單的問題。

不過好在,修改后的程序成功完成了指定任務,就是這 UI 字體有點不協調:



我們還進行了另一些簡單測試。整體來說,我們感覺新版 DeepSeek-R1 相比前一版本確實提升不小,完成一個任務所需的對話輪次也少了許多。

最后,盡管 R1 這次提升很大,網友們還是期待 DeepSeek 盡快放出 R2。



一個小版本更新就如此驚艷,DeepSeek R2 會是什么樣子?這一次,我們是不是要等到國慶節?

文中視頻鏈接:https://mp.weixin.qq.com/s/14YOsEZ_Kr6MD-7qvm3Hgg

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
姚安娜被問怎么看待哈佛大學拒收國際生:還好畢業了

姚安娜被問怎么看待哈佛大學拒收國際生:還好畢業了

大象新聞
2025-05-27 08:03:29
4-2,37歲梅西飆世界波+驚艷挑射+無敵擺脫妙傳,率隊終結4輪不勝

4-2,37歲梅西飆世界波+驚艷挑射+無敵擺脫妙傳,率隊終結4輪不勝

側身凌空斬
2025-05-29 09:39:14
善惡終有報!58歲被淘汰的林志炫,是華語樂壇最大的悲哀與損失!

善惡終有報!58歲被淘汰的林志炫,是華語樂壇最大的悲哀與損失!

姩姩有娛呀
2025-05-28 09:07:12
沙特阿拉伯,越來越開放了|地球知識局

沙特阿拉伯,越來越開放了|地球知識局

地球知識局
2025-05-29 12:11:04
家中的床不可空置?觀音菩薩說:無人睡時,也要擺放這3樣物品

家中的床不可空置?觀音菩薩說:無人睡時,也要擺放這3樣物品

風起青萍之未
2025-05-27 17:23:24
快船3+1交易方案曝光,美媒模擬引發球迷熱議!

快船3+1交易方案曝光,美媒模擬引發球迷熱議!

范剬舍長
2025-05-29 00:13:12
老人撿石頭30年,喊著能賣大價錢,住院時湊不齊3000醫療費

老人撿石頭30年,喊著能賣大價錢,住院時湊不齊3000醫療費

全金貓眼
2025-05-05 19:00:03
A股:明天股市或將迎來強降雨

A股:明天股市或將迎來強降雨

生活中的栗子
2025-05-29 10:22:33
汽車屏幕都有彈窗廣告了?有車主控訴駕駛中險些釀禍!CEO致歉……

汽車屏幕都有彈窗廣告了?有車主控訴駕駛中險些釀禍!CEO致歉……

上觀新聞
2025-05-29 08:09:13
百度向李彥宏家的私人飛機支付費用,系配合業務所需而產生的開支

百度向李彥宏家的私人飛機支付費用,系配合業務所需而產生的開支

紅星資本局
2025-05-29 11:57:06
《報告》:延遲退休政策疊加銀行降息,激發年輕消費者對商業養老險的熱情

《報告》:延遲退休政策疊加銀行降息,激發年輕消費者對商業養老險的熱情

北京商報
2025-05-28 21:03:39
曝*汽南京公司全員解散:賠償N+4或回總部調崗不賠償

曝*汽南京公司全員解散:賠償N+4或回總部調崗不賠償

鷂石周說
2025-05-28 20:40:08
游客稱武陵山天池底部竟為304不銹鋼,網友驚呆!景區:確有此事

游客稱武陵山天池底部竟為304不銹鋼,網友驚呆!景區:確有此事

有趣的火烈鳥
2025-05-28 19:09:13
胡金秋:當年拒絕NBA球隊的邀請+拒絕選秀,現在回想起覺得很遺憾

胡金秋:當年拒絕NBA球隊的邀請+拒絕選秀,現在回想起覺得很遺憾

林小湜體育頻道
2025-05-28 21:15:33
哪吒汽車上海總部LOGO被連夜拆除

哪吒汽車上海總部LOGO被連夜拆除

金融界
2025-05-29 11:47:29
史曉燕認為朱媛媛因情緒病患癌,好友稱其生前總擔心辛柏青出軌!

史曉燕認為朱媛媛因情緒病患癌,好友稱其生前總擔心辛柏青出軌!

古希臘掌管月桂的神
2025-05-29 08:59:29
太心酸!一波未平一波又起,59歲劉純燕已經走上了另一條道路

太心酸!一波未平一波又起,59歲劉純燕已經走上了另一條道路

漣漪讀史
2025-05-14 09:06:33
9歲圍棋少年墜亡后續:孩子已火化,爺爺承認家暴,父親討要公道

9歲圍棋少年墜亡后續:孩子已火化,爺爺承認家暴,父親討要公道

悠閑歷史
2025-05-28 14:36:44
金靖真的越來越美越來越瘦!好似森林小精靈太養眼了!

金靖真的越來越美越來越瘦!好似森林小精靈太養眼了!

東方不敗然多多
2025-05-29 14:16:43
媒體人:多哈女單決賽并不公平,王曼昱已經9個月沒教練管了

媒體人:多哈女單決賽并不公平,王曼昱已經9個月沒教練管了

八斗小先生
2025-05-29 15:34:04
2025-05-29 18:40:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10555文章數 142327關注度
往期回顧 全部

科技要聞

英偉達財報炸裂 黃仁勛卻嘆退出中國太可惜

頭條要聞

國務院任免21名干部 剛卸任副省長的女官員進京履新

頭條要聞

國務院任免21名干部 剛卸任副省長的女官員進京履新

體育要聞

納達爾,法網,漫長告別

娛樂要聞

辛柏青沉默8天后,這些事還是發生了

財經要聞

若對等關稅叫停,特朗普還能怎么加關稅

汽車要聞

搭載Thor芯片 領克900城市NOA挑戰重慶

態度原創

房產
教育
數碼
健康
家居

房產要聞

榮耀封頂 | 天正·三亞灣壹號匠筑海居生活新圖景

教育要聞

【預告】6月5日 | 2025年廣東中職課堂教學數字化評價省級教研活動(廣州輕工職校)

數碼要聞

快睿推出首批均熱板下壓風冷 C5 ,純銅版本標稱解熱能力 180W

唇皰疹和口腔潰瘍是"同伙"嗎?

家居要聞

暖色復古 溫馨小資情調

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产成人午夜不卡在线视频| 人妻系列影片无码专区| 婷婷成人丁香五月综合激情| 亚洲色无码播放| 国产卡1卡2卡3麻豆精品免费| 无码人妻一区二区中文| 午夜131美女爱做视频| 免费精品99久久国产综合精品| 欧美日韩中文国产一区| 成人av无码国产在线一区| 天天躁夜夜躁狠狠躁2021a2| 各种少妇正面着bbw撒尿视频| 成av人片在线观看www| 午夜片无码区在线观看视频| 亚洲国产精品自产在线播放| 无码精品a∨在线观看十八禁软件| 人妻中出无码中字在线| 亚洲日韩乱码一区二区三区四区| 国产成人精品一区二区不卡| 强开小婷嫩苞又嫩又紧视频韩国| 久久久精品成人免费观看| 国产乱人伦真实精品视频| 国产精品无码一区二区在线观一| 国产国拍亚洲精品永久69| 免费看又黄又无码的网站| 亚洲成色av网站午夜影视| 13小箩利洗澡无码视频网站| 欧美精品videosex极品| 精品久久人妻av中文字幕| 一个本道久久综合久久88| 无码人妻少妇精品无码专区漫画| 天天躁日日躁狠狠躁性色av| 少妇被粗大的猛进出69影院| 欧美 日韩 国产 成人 在线观看| 国产精品无码无卡无需播放器| 少妇高潮喷水正在播放| 婷婷色婷婷开心五月| 97精品伊人久久大香线蕉| 精品乱码卡1卡2卡3免费开放| 亚洲午夜久久久精品影院| 国产成人a人亚洲精v品无码|