大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

不只是“小升級”!DeepSeek-R1新版獲海外盛贊,每經記者親測挑戰三大編程任務

0
分享至

5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平臺開源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級,用戶可通過官方網頁、App、小程序進行測試(打開深度思考),API接口和使用方式保持不變。

在此次更新中,模型代碼能力的提升最為顯著。知名代碼測試平臺LiveCodeBench顯示,更新后的R1性能可以媲美OpenAI o3模型的高版本。

除代碼能力外,R1新版本模型的文本理解與推理能力亦實現跨越式升級。其上下文長度拓展至128k,長文本提取的準確率也有顯著提升。

《每日經濟新聞》記者(以下簡稱“每經記者”)通過俄羅斯方塊游戲開發、太陽系模擬與交互展示,以及設計英偉達最新財報網頁這三項任務對R1新版本進行了實測,發現DeepSeek-R1-0528的編程能力確實強大,對物理世界的理解以及文本的提取都相當準確。

知名AI評論人Haider在社交媒體上評價稱,這是開源的一大勝利。

瑞士IT咨詢公司CTOL Digital Solutions首席執行官Max Zhang則表示,在這一“小”進步之后,我們確實可以期待更大突破(DeepSeek-R2)的到來。


圖片來源:Hugging Face

“小升級”實現“大跨越”:升級后的R1性能媲美o3模型高版本

DeepSeek延續了其一貫的低調風格,此次升級率先在微信群進行官宣,并輕描淡寫地將其定義為“小版本升級”。

然而,眾多開發者實測后發現,此次的“小”升級,并不小。升級后的DeepSeek-R1,模型能力可以說實現了跨越式提升。


圖片來源:DeepSeek官方微信群截圖

編碼能力方面,代碼測試平臺LiveCodeBench顯示,更新后的DeepSeek-R1性能接近OpenAI在4月中旬發布的o4-mini和o3模型高版本。

據測試者反饋,DeepSeek-R1-0528能夠一次性生成超千行無Bug代碼,且在HTML/CSS/JS動態交互實現(如天氣卡片動畫、數據可視化)中更加精準。


圖片來源:代碼測試平臺LiveCodeBench

除代碼能力外,新版本模型的文本理解與推理能力亦實現跨越式升級。其上下文長度拓展至128k,長文本提取的準確率也有顯著提升

在Extended NYT Connections基準測試中,相比于前一代DeepSeek-R1,最新的0528版本的提升非常明顯,得分從38.6%大幅升至49.8%。


圖片來源:X

目前,ChatBot Arena也已經“上架”了最新版本的DeepSeek-R1,但還沒有任何的測試結果。


圖片來源:X

記者實測編程能力

為了更全面地測試DeepSeek-R1-0528的編程能力,每經記者設計了三項不同難度和類型的編程任務,包括網頁游戲制作、物理世界模擬、財報可視化,來檢驗其在實際場景中的表現。

任務一:俄羅斯方塊游戲開發

作為一款經典的休閑游戲,俄羅斯方塊游戲的開發涉及圖形繪制、游戲邏輯處理、用戶交互等多個方面,能夠很好地考察模型對于綜合編程知識的掌握和運用能力。

每經記者首先向DeepSeek-R1提出需求:“請幫我開發一個網頁端俄羅斯方塊小游戲,要求包含游戲分數、彩色方塊及多個關卡。”

DeepSeek僅思考了7秒,就開始輸出代碼。然而,初步生成的游戲無法正常運作,雖有預設的分數與關卡顯示,但游戲區域內并沒有俄羅斯方塊。


圖片來源:由DeepSeek生成

隨后,記者調整提示詞,僅提了最基礎的要求,“請幫我寫個俄羅斯方塊游戲(網頁端),直接可以上手玩。”

簡潔的指令似乎對DeepSeek-R1-0528更加奏效。這次R1思考9秒,用時約3分30秒便生成了代碼。


圖片來源:由DeepSeek生成

從游戲頁面來看,色彩搭配鮮明且協調,不同顏色的方塊在深色背景下十分醒目,游戲區域布局合理,操作說明也清晰明了。

在游戲邏輯方面,方塊的下落、移動和旋轉都很流暢,沒有出現延遲或卡頓現象。

可以說,已經具備了一個成熟俄羅斯方塊游戲應有的功能和體驗。

任務二:太陽系模擬與交互展示

接下來,難度升級。對于大模型而言,對物理世界進行準確模擬長期以來都是一項極具挑戰性的任務。

此次,記者特意選取“行星軌道運動的物理模擬”這一任務,在考察其編碼能力的同時,也考察DeepSeek-R1-0528對物理世界的理解能力。

記者向R1提出要求——寫一個太陽系模擬網頁,并且網頁可交互展示。

因為任務更復雜,R1思考時間也相應變長,耗時54秒后開始輸出代碼。


圖片來源:由DeepSeek生成

可以看出,R1的整體完成度極高,完全可以作為中小學科普動畫的原型演示。

從界面呈現看,太陽居于中心,八大行星依照各自軌道有序排布,色彩搭配也符合人們對天體的認知。此外,行星的大小比例、相對位置都比較精準。

在交互功能方面,右側控制面板設計簡潔且功能豐富。

同時,頁面“行星信息”板塊還以簡潔明了的文字介紹了太陽及各大行星的關鍵特征,如太陽的質量、直徑,水星的公轉周期、表面溫度等,兼具科普性與趣味性。

任務三:設計英偉達最新財報網頁

最后,每經記者上傳了英偉達2026財年第一財季財報的文檔,要求R1根據財報中的內容,制作一個可交互的網頁。

財報中數據繁雜,文本較長,非常考察模型準確提取文本的能力。


圖片來源:由DeepSeek生成

DeepSeek-R1生成的網頁令人眼前一亮。在視覺呈現上,網頁采用了標志性的“英偉達綠”,顏色搭配協調。

數據方面,基本做到了準確無誤,很少出現“幻覺”情況。此外,模型還繪制了柱狀圖、餅圖等圖表,讓復雜的數據變得一目了然。

盡管可能還存在一些細微的提升空間。比如,在漲跌幅的顏色上,我們通常用紅色表示上漲,綠色表示下跌。但可能由于記者投喂的是美股公司財報(美股一般用綠色表示上漲,紅色表示下跌),R1用了與之對應的顏色來展示漲跌幅。

整體來看,R1已充分彰顯其在復雜任務處理上的卓越潛力。

“全球AI競賽關鍵節點”!DeepSeek-R1新版獲海外盛贊

DeepSeek最新發布的R1模型升級版在全球AI領域掀起熱議,多位國際主流科技大佬及行業高管紛紛發聲,盛贊其技術突破。

機器學習研究者kalomaze實測后贊嘆道,“DeepSeek太出色了。”

Hyperbolic Labs聯合創始人兼首席技術官Yuchen Jin表示,新版R1似乎是唯一能回答9.9減9.11等于幾的模型。

知名AI評論人Haider直呼,這是開源的一大勝利。“DeepSeek王者歸來了。新版本的DeepSeek-R1在編程方面簡直令人難以置信,這是我測試過的最佳模型。”

AI撰稿人喬治·霍普金(George Hopkin)表示,DeepSeek的R1模型更新后,推理和輸出能力大幅提升,標志著中國在全球AI競賽中的影響力日益增強

瑞士IT咨詢公司CTOL Digital Solutions首席執行官Max Zhang指出,DeepSeek的最新版R1模型,正悄然成為谷歌Gemini 2.5 Pro的強勁競爭對手。“這一發展不僅僅是技術進步,更是全球AI競賽中的一個關鍵節點。該模型憑借其雙倍輸出能力和增強的數學推理能力,展示了中國在AI領域的快速崛起。”

DeepSeek此次更新的亮眼表現,為DeepSeek的下一代模型R2注入更多想象空間。Max Zhang表示,在這一“小”進步之后,我們確實可以期待更大突破的到來。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
河南禁酒令大反轉!本以為是“硬核新規”,官方回應,網友:理解

河南禁酒令大反轉!本以為是“硬核新規”,官方回應,網友:理解

溫讀史
2025-06-14 09:56:47
上海專家發現:吃甜食的老人,健康指數是吃蔬菜的人的5倍不止?

上海專家發現:吃甜食的老人,健康指數是吃蔬菜的人的5倍不止?

華庭講美食
2025-06-14 13:52:03
袁立小號發文緬懷羅帥宇,連發兩條動態,看新聞難過到吃不下飯

袁立小號發文緬懷羅帥宇,連發兩條動態,看新聞難過到吃不下飯

趣文說娛
2025-06-14 11:13:03
局勢突變!中國深夜發出警告,俄羅斯聲明立即結束會談!

局勢突變!中國深夜發出警告,俄羅斯聲明立即結束會談!

一個有靈魂的作者
2025-06-14 22:17:44
國防大學的教授也是一個水貨

國防大學的教授也是一個水貨

回旋鏢
2025-06-14 15:59:57
跌太猛了!浙江余杭這個小區從214萬暴跌到80萬,跌幅超過60%…

跌太猛了!浙江余杭這個小區從214萬暴跌到80萬,跌幅超過60%…

火山詩話
2025-06-14 14:30:42
好消息:中國防空導彈再次擊落戰機!壞消息:被擊落的是中國戰機

好消息:中國防空導彈再次擊落戰機!壞消息:被擊落的是中國戰機

荷蘭豆愛健康
2025-06-12 18:47:39
伊朗不打倒神棍政權,國家將永無希望

伊朗不打倒神棍政權,國家將永無希望

廖保平
2025-06-14 09:19:25
南航“美女經理”:除了生理期就沒閑過,兩年半和上級開房410次

南航“美女經理”:除了生理期就沒閑過,兩年半和上級開房410次

就一點
2025-06-13 16:45:25
哈梅內伊聲明:要徹底摧毀以色列政權!伊朗向以方向發射約150枚導彈!伊軍稱擊落以戰機并逮捕飛行員

哈梅內伊聲明:要徹底摧毀以色列政權!伊朗向以方向發射約150枚導彈!伊軍稱擊落以戰機并逮捕飛行員

每日經濟新聞
2025-06-14 06:41:13
LABUBU真成“頂流”了!韓國線下店有人為它通宵排隊,有人為它吵架動手,為您揭秘其火爆原因

LABUBU真成“頂流”了!韓國線下店有人為它通宵排隊,有人為它吵架動手,為您揭秘其火爆原因

三湘都市報
2025-06-14 18:04:05
恥辱!香港運動員奪冠拒唱國歌,這樣的運動員不止一個

恥辱!香港運動員奪冠拒唱國歌,這樣的運動員不止一個

柳絮憶史
2025-06-14 07:10:03
聊聊步行者 VS 雷霆 G4

聊聊步行者 VS 雷霆 G4

靜易墨
2025-06-14 21:17:05
伊朗:打擊美軍基地 下一輪對以襲擊導彈數是20倍

伊朗:打擊美軍基地 下一輪對以襲擊導彈數是20倍

看看新聞Knews
2025-06-14 20:25:47
蘇超最新積分榜公布

蘇超最新積分榜公布

現代快報
2025-06-14 21:17:08
鳳凰傳奇曾毅回應手表爭議,堪稱災難性公關,被吐槽不如道歉……

鳳凰傳奇曾毅回應手表爭議,堪稱災難性公關,被吐槽不如道歉……

妮妮玩不夠
2025-06-14 07:47:04
中紀委怒批公務員也是人!正常生活不應問責處!

中紀委怒批公務員也是人!正常生活不應問責處!

霹靂炮
2025-06-13 23:49:27
羅帥宇的通報來了,真相終于大白

羅帥宇的通報來了,真相終于大白

大張的自留地
2025-06-14 08:39:21
慘不忍睹!女籃三人10中1,籃板也不會搶,球迷:趕快淘汰他仨

慘不忍睹!女籃三人10中1,籃板也不會搶,球迷:趕快淘汰他仨

南海浪花
2025-06-14 11:30:33
1-2!鄭欽文輸球內情曝光,賽后眼眶含淚,對手采訪說到了關鍵

1-2!鄭欽文輸球內情曝光,賽后眼眶含淚,對手采訪說到了關鍵

侃球熊弟
2025-06-15 00:02:53
2025-06-15 04:19:00
每日經濟新聞 incentive-icons
每日經濟新聞
中國主流財經全媒體平臺。
1265040文章數 2714935關注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業陪葬?

頭條要聞

以防長威脅哈梅內伊:若繼續發射導彈 德黑蘭將成火海

頭條要聞

以防長威脅哈梅內伊:若繼續發射導彈 德黑蘭將成火海

體育要聞

約戰天王山,步行者G4輸在了哪?

娛樂要聞

小S迎47歲生日,首個生日沒大S陪伴

財經要聞

樓市權威發聲

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

時尚
教育
藝術
房產
本地

中年女人少穿黑色和灰色,年輕色穿出減齡效果,看起來嫩十歲

教育要聞

江蘇最新消息:6月28日填報志愿!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

房產要聞

又一城購房補貼!買房就發錢,正在海南樓市瘋狂擴散!

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩av无码中文无码电影| 日日碰日日摸日日澡视频播放| 久久久久99精品成人片欧美一区| 亚洲精品久久久久久成人| 国产成人av乱码在线观看| 午夜嘿嘿嘿在线观看| 成人无码在线视频区| 在线中文字幕乱码英文字幕正常| 免费国产黄网站在线观看可以下载| 亚洲www啪成人一区二区| 鲁大师在线视频播放免费观看| 躁躁躁日日躁| 青春草在线视频观看| 免费毛儿一区二区十八岁| 亲胸揉屁股膜下刺激视频免费网站| 亚洲中文无码av在线| 成人一区二区三区视频在线观看| 内射后入在线观看一区| 亚洲va中文字幕无码毛片| 一区二区三区乱码在线 | 欧洲| 国产成人久久精品77777综合| 国产做爰全免费的视频| 国产大屁股喷水视频在线观看| 97伦伦午夜电影理伦片| 精品国内在视频线2019| 亚洲AV无码乱码精品| 777精品久无码人妻蜜桃| 久久久精品2020免费观看| 色老久久精品偷偷鲁| 亚洲中文字幕va福利| 东京热加勒比视频一区| 无码高潮又爽又黄a片日本动漫| 日本丰满少妇高潮呻吟| 亚洲高清国产av拍精品青青草原| mm1313亚洲国产精品无码试看| 精品国产午夜福利精品推荐| 无码一区二区三区中文字幕| 国产18禁黄网站免费观看| 特级无码毛片免费视频尤物| 久久久无码精品亚洲a片0000| 久久国产劲暴∨内射|