大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

梁文鋒和楊植麟再“撞車”

0
分享至



被追趕和超越,是創(chuàng)業(yè)者常面對的挑戰(zhàn)。

文|《中國企業(yè)家》記者 閆俊文

編輯|張曉迪

圖片來源|視覺中國

繼2月論文“撞車”之后,梁文鋒和楊植麟又在另一個大模型賽道上相遇了。

4月30日,DeepSeek上線新模型DeepSeek-Prover-V2,這是一個數(shù)學定理證明專用模型。

Prover-V2的參數(shù)規(guī)模進一步擴展到671B(6710億規(guī)模參數(shù)),相較于前一代V1.5版本的7B規(guī)模增加了近百倍,這讓其在數(shù)學測試集上的效率和正確率更高,比如,該模型的miniF2F測試通過率達到88.9%,它還解決了PutnamBench(普特南測試)的49道題。

巧合的是,4月中旬,月之暗面也曾推出一款用于形式化定理證明的大模型Kimina-Prover,這是Kimi團隊和Numina共同研發(fā)的大模型,該產(chǎn)品也開源了1.5B和7B參數(shù)的模型蒸餾版本。該模型的miniF2F測試通過率為80.7%,PutnamBench測試成績?yōu)?0道題。

兩者相比較,在miniF2F測試通過率以及普特南測試上,DeepSeek-Prover-V2的表現(xiàn)超過了Kimina-Prover預覽版。

值得注意的是,兩家公司在技術(shù)報告中都提到了強化學習。比如DeepSeek的題目為《DeepSeek-Prover-V2:通過子目標分解的強化學習推進形式數(shù)學推理》,而月之暗面的題目為《Kimina-Prover Preview:基于強化學習技術(shù)的大型形式推理模型》。

在2月的兩篇“撞車”論文中,梁文鋒和楊植麟都在作者行列,兩家公司都關(guān)注Transformer架構(gòu)最核心的注意力機制,即如何讓模型更好地處理長上下文。

作為中國大模型領(lǐng)域最受矚目的創(chuàng)業(yè)者,兩人也正在面臨不同的挑戰(zhàn)。

對于梁文鋒而言,在R1模型推出三個多月后,外界對DeepSeek“魔法”的癡迷程度正在下降,阿里巴巴的開源模型正在迅速趕上以及超過DeepSeek,外界熱切期待其發(fā)布R2或V4模型,以加強領(lǐng)先優(yōu)勢。

對于楊植麟和月之暗面,Kimi正在遭受來自字節(jié)跳動的豆包和騰訊元寶的挑戰(zhàn),它也需要保持持續(xù)創(chuàng)新。

編程與數(shù)學,實現(xiàn)AGI的兩條路徑

對于AGI的實現(xiàn)路徑,2024年,DeepSeek創(chuàng)始人梁文鋒在接受《暗涌》采訪時曾說,他們確實押注了三個方向:一是數(shù)學和代碼、二是多模態(tài)、三是自然語言本身。數(shù)學和代碼是AGI天然的試驗場,有點像圍棋,是一個封閉的、可驗證的系統(tǒng),有可能通過自我學習就能實現(xiàn)很高的智能。另一方面,多模態(tài)需要參與到人類真實世界里學習。他們對一切可能性都保持開放。

此次Prover-V2模型的推出,讓DeepSeek的各個模型矩陣保持了同步進化。

Prover系列模型于2024年3月開始被發(fā)布,2024年8月被更新為DeepSeek-Prover-V1.5(后簡稱為Prover-V1.5),2025年4月再被更新至DeepSeek-Prover-V2。

DeepSeek代碼系列模型Coder從2024年4月開始更新,6月升級為Coder-V2-0614,7月再次升級,9月,DeepSeek-V2-Chat和DeepSeek-Coder-V2合并,升級后的新模型為DeepSeek-V2.5,2024年12月,該模型更新至V3,今年3月,升級至V3-0324。



通用推理大模型,以1月20日發(fā)布的R1模型為代表,價格低廉,自然語言推理性能強勁,在數(shù)學、代碼、自然語言推理等任務(wù)上,性能比肩OpenAI o1正式版。

從Prover-V2的技術(shù)報告上看,其與DeepSeek的其他模型進化有關(guān)聯(lián),其中,DeepSeek-Prover-V2-671B是以DeepSeek-V3作為基礎(chǔ)模型來做微調(diào),如在冷啟動階段,DeepSeek-V3將復雜問題分解為一系列子目標,而后,已解決子目標的證明被合成到一個思維過程鏈中,結(jié)合DeepSeek-V3的逐步推理,為強化學習創(chuàng)建一個初始冷啟動。

算法工程師、知乎用戶“小小將”告訴《中國企業(yè)家》,推理模型在進行推理時,要進行復雜的思考,代碼與數(shù)學模型可以檢驗推理大模型能力進展,因為數(shù)學與代碼的結(jié)果是可驗證的。

他認為,Prover-V2的推出與新模型R2或V4的上線沒有必然聯(lián)系,它更像是一個獨立模型的更新。

他預測,R2模型更像是GPT-o1到o3的過程,比如在提高強化學習的能力方面,DeepSeek可以基于V3,提升后訓練效果,因此R2的研發(fā)周期可能會比較短。但V4就是一個大版本的更新,其研發(fā)周期有可能更長,因為預訓練的工程量以及訓練方法可能都會發(fā)生變化。

目前市場已經(jīng)對DeepSeek的新模型充滿了想象和期待。

市場上傳言,R2模型將基于華為昇騰系列GPU芯片而推出,但一位行業(yè)人士說,這個消息不太可靠,在英偉達H20芯片被限之后,昇騰系列芯片在市場上也是一卡難求,“對于昇騰來說,如果用于大模型研發(fā),可能魯棒性沒那么強”。

另有創(chuàng)業(yè)公司相關(guān)人士告訴《中國企業(yè)家》,華為昇騰芯片用于大模型的訓練,效果一般,原因在于生態(tài)系統(tǒng)沒那么完善,但用于大模型的推理與部署,是沒有問題的。

DeepSeek與Kimi還能保持領(lǐng)先嗎?

DeepSeek與月之暗面作為明星初創(chuàng)公司,正在遭受大公司的追趕和超越。

以月之暗面旗下的Kimi為例,據(jù)QuestMobile數(shù)據(jù),Kimi上線不足1年,在2024年11月,月活突破2000萬,僅次于豆包的5600萬。

QuestMobile數(shù)據(jù)顯示,截至2025年2月底,AI原生APP月活規(guī)模前三名從豆包、Kimi、文小言更迭為DeepSeek、豆包、騰訊元寶,規(guī)模分別是1.94億、1.16億、0.42億。

2月中旬,騰訊元寶宣布接入DeepSeek,隨后,在一個多月時間內(nèi),騰訊元寶利用超級產(chǎn)品微信引流加上瘋狂買量投流,在用戶數(shù)量上已經(jīng)超過了Kimi,成為排名第三的AI產(chǎn)品。據(jù)AppGrowing數(shù)據(jù),在今年一季度,騰訊元寶的投流費用為14億元,遠遠超過Kimi的1.5億元規(guī)模。



目前,Kimi最新的舉動是內(nèi)測社區(qū)功能,增加用戶粘性。

DeepSeek同樣也避免不了被大公司追趕甚至超越的挑戰(zhàn)。近期,阿里巴巴在大模型方面展現(xiàn)出了強勁的競爭力。

4月29日,阿里巴巴發(fā)布新一代通義千問模型Qwen3,該模型被稱作首個“混合推理模型”,是“快思考”和“慢思考”集成的一個模型,參數(shù)量僅為DeepSeek-R1的1/3,性能全面超越R1、OpenAI o1等同行產(chǎn)品。

此前,蔡崇信評價DeepSeek,它告訴了我們開源的價值。根據(jù)公開數(shù)據(jù),阿里通義已開源200余個模型,全球下載量超3億次,千問衍生模型數(shù)超10萬個,已超越美國Llama,成為全球第一開源模型。

一位AI創(chuàng)業(yè)者告訴《中國企業(yè)家》,DeepSeek受到了過多的關(guān)注,被賦予過多光環(huán),中國大模型產(chǎn)業(yè)需要兩三個世界領(lǐng)先的大模型,而不是一個,這時候應(yīng)鼓勵這個領(lǐng)域的競爭和創(chuàng)業(yè)。

另一個重要玩家是百度。4月25日,百度發(fā)布文心4.5 Turbo和深度思考模型X1 Turbo,這兩款模型性能更強大,成本更低,李彥宏更是數(shù)次提到DeepSeek,他說,DeepSeek也不是萬能的,它只能處理單一的文本,還不能理解聲音、圖片、視頻等多媒體內(nèi)容,同時幻覺率比較高,很多場合不能放心使用。

“DeepSeek最大的問題是慢和貴,中國市場上絕大多數(shù)大模型API的價格都更低,而且反應(yīng)速度更快。”李彥宏在發(fā)布會上說。

盡管如此,百度仍決定學習DeepSeek,今年2月,百度決定在6月30日開源文心大模型4.5系列。

越來越多的玩家參與大模型開源競賽,但只有技術(shù)最先進的玩家才能定義標準。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
宮魯鳴被嚇一跳,波黑主教練贊不絕口,賽后兩位教頭談到張子宇!

宮魯鳴被嚇一跳,波黑主教練贊不絕口,賽后兩位教頭談到張子宇!

老壥說體育
2025-06-14 09:27:59
上海中考作文題:幫助人,使達到目的!上海中考增至12.7萬人

上海中考作文題:幫助人,使達到目的!上海中考增至12.7萬人

大樹成長營
2025-06-14 10:55:11
攻勢迅猛的熱辣素人,擁有黃金比例的女神—Solazola

攻勢迅猛的熱辣素人,擁有黃金比例的女神—Solazola

吃瓜黨二號頭目
2025-06-14 12:06:45
被光影偏愛的天使(3533)

被光影偏愛的天使(3533)

小椰的奶奶
2025-06-05 14:39:46
為啥關(guān)燈蚊子嗡嗡叫,開了燈卻找不到?教你一招,一覺睡到天亮

為啥關(guān)燈蚊子嗡嗡叫,開了燈卻找不到?教你一招,一覺睡到天亮

三農(nóng)老歷
2025-06-08 09:26:54
1645元,小米剛公布這9000mAh新機,是來搗亂的吧

1645元,小米剛公布這9000mAh新機,是來搗亂的吧

劉奔跑
2025-06-13 23:21:58
邊境局勢突變:中方不再容忍,印軍越界恐遭受沉重打擊

邊境局勢突變:中方不再容忍,印軍越界恐遭受沉重打擊

荷蘭豆愛健康
2025-06-13 07:08:46
苗苗在上海別墅養(yǎng)雞種有機菜,一個月曬黑兩個度,鄭愷心疼壞了

苗苗在上海別墅養(yǎng)雞種有機菜,一個月曬黑兩個度,鄭愷心疼壞了

素衣讀史
2025-06-14 13:36:38
年輕人正逃離上海!這事真不怪誰,577萬老人,換你你也頂不住?

年輕人正逃離上海!這事真不怪誰,577萬老人,換你你也頂不住?

三農(nóng)老歷
2025-06-13 10:29:58
兒子剛走出高考考場,媽媽竟然對兒子大喊:我兩個老死不要往來了

兒子剛走出高考考場,媽媽竟然對兒子大喊:我兩個老死不要往來了

南南說娛
2025-06-11 09:36:38
總算讓印度怕了!中國撥款千億,在5400米海拔建起一座現(xiàn)代化小城

總算讓印度怕了!中國撥款千億,在5400米海拔建起一座現(xiàn)代化小城

百科密碼
2025-06-13 17:10:47
李媛媛墓地現(xiàn)狀曝光:雜草叢生太難找到,墓碑上的照片仍鮮亮!

李媛媛墓地現(xiàn)狀曝光:雜草叢生太難找到,墓碑上的照片仍鮮亮!

古希臘掌管月桂的神
2025-06-13 13:27:47
以色列官員:如果對伊朗的襲擊成功,在10天里對真主黨高級官員所做的,就相當于10分鐘內(nèi)對伊朗所做的

以色列官員:如果對伊朗的襲擊成功,在10天里對真主黨高級官員所做的,就相當于10分鐘內(nèi)對伊朗所做的

和訊網(wǎng)
2025-06-13 10:04:30
17歲森碟機場被偶遇,穿衛(wèi)衣短褲很樸素,雙腿粗壯活力滿滿

17歲森碟機場被偶遇,穿衛(wèi)衣短褲很樸素,雙腿粗壯活力滿滿

鑫鑫說說
2025-06-14 15:13:39
如果不是醫(yī)保局的通報,都不知道已經(jīng)爛成這樣了!

如果不是醫(yī)保局的通報,都不知道已經(jīng)爛成這樣了!

閑侃閑侃
2025-06-11 20:23:31
那爾那茜暴雷,吳京遭受質(zhì)疑,新電影《鏢人》上映恐受影響楊

那爾那茜暴雷,吳京遭受質(zhì)疑,新電影《鏢人》上映恐受影響楊

星光看娛樂
2025-06-14 14:57:01
巴薩可要想清楚,現(xiàn)在的尼科威廉姆斯,說不定就是庫蒂尼奧

巴薩可要想清楚,現(xiàn)在的尼科威廉姆斯,說不定就是庫蒂尼奧

老樂說球
2025-06-14 09:33:54
伊朗宣戰(zhàn),內(nèi)塔跑了,德黑蘭:所有一切都是被以色列逼的

伊朗宣戰(zhàn),內(nèi)塔跑了,德黑蘭:所有一切都是被以色列逼的

葡萄說娛
2025-06-13 11:20:33
援俄讓朝鮮看清了自己,再不做出改變,百萬朝軍將無立足之地

援俄讓朝鮮看清了自己,再不做出改變,百萬朝軍將無立足之地

跳跳歷史
2025-04-28 14:27:45
反轉(zhuǎn)!王楚欽避戰(zhàn)樊振東2天后,真相浮出,王勵勤讀懂,球迷錯怪

反轉(zhuǎn)!王楚欽避戰(zhàn)樊振東2天后,真相浮出,王勵勤讀懂,球迷錯怪

大秦壁虎白話體育
2025-06-13 14:40:15
2025-06-14 16:11:00
中國企業(yè)家雜志 incentive-icons
中國企業(yè)家雜志
本賬號由《中國企業(yè)家》雜志社有限責任公司運營
2581文章數(shù) 19683關(guān)注度
往期回顧 全部

財經(jīng)要聞

樓市權(quán)威發(fā)聲

頭條要聞

伊朗出手15分鐘內(nèi)3次導彈齊射 被指計劃打擊美軍基地

頭條要聞

伊朗出手15分鐘內(nèi)3次導彈齊射 被指計劃打擊美軍基地

體育要聞

32隊爭10億獎金,全新世俱杯來了!

娛樂要聞

鳳凰傳奇曾毅手表引爭議 含性暗示元素

科技要聞

一輛新車比特斯拉FSD都便宜,全行業(yè)陪葬?

汽車要聞

長城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

藝術(shù)
健康
游戲
本地
公開課

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

呼吸科專家破解呼吸道九大謠言!

《守望先鋒2》第17賽季6月25日開幕 6月17日詳情

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 一区二区三区精品视频日本| 国产精品内射视频免费| 伊人久久精品无码av一区| 亚洲欧美在线人成最新| 久9re热视频这里只有精品| 漂亮人妻被中出中文字幕| 99精品国产福利一区二区| 狠狠色综合久久丁香婷婷| 成年永久一区二区三区免费视频| 草小姑娘真爽视频网站| 不满足出轨的人妻中文字幕| 女人让男人桶爽30分钟| 国产精品99久久久久久宅男小说| 国产草莓视频无码a在线观看| 亚洲日韩乱码一区二区三区四区| 免费无码又爽又刺激高潮的漫画| 少妇把腿扒开让我添| av无码久久久久久不卡网站| 怡红院免费的全部视频| 中文字幕无码热在线视频| 亚洲人成图片小说网站| 精品水蜜桃久久久久久久| 夜夜爽久久精品国产三级| 亚洲欧洲日韩在线电影| 熟妇高潮喷沈阳45熟妇高潮喷| 免费人成视频x8x8入口| 久久无码字幕中文久久无码| 国产麻豆一精品一av一免费软件| 中文字幕人成无码免费视频| 欧美粗大无套gay| 日韩 亚洲 制服 欧美 综合| 深夜福利小视频在线观看| 婷婷六月在线精品免费视频观看| 久久久久影院美女国产主播| 专干老熟女视频在线观看| 天天躁狠狠躁狠狠躁夜夜躁| 在线亚洲精品国产二区图片欧美| 成人免费无码不卡毛片| 丰满少妇熟女高潮流白浆| 久久香蕉国产线看观看精品yw| 欧美孕妇变态重口另类|