大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek再開(kāi)源!大模型直覺(jué)+強(qiáng)化學(xué)習(xí)新方法:AI 數(shù)學(xué)證明迎來(lái)新突破

0
分享至


各位五一快樂(lè)!(順便星標(biāo)??一下本號(hào),最近很多朋友反應(yīng)不能及時(shí)看到內(nèi)容更新,只有關(guān)注并且??才會(huì)第一時(shí)間收到更新)

讓 AI 理解并進(jìn)行嚴(yán)格的數(shù)學(xué)推理,尤其是形式化證明(就是用像 Lean、Coq 這樣的證明輔助語(yǔ)言寫(xiě)的、機(jī)器可驗(yàn)證的證明),一直是個(gè)挑戰(zhàn)。這不僅需要邏輯能力,還需要某種程度的“數(shù)學(xué)直覺(jué)”來(lái)分解復(fù)雜問(wèn)題。

今天DeepSeek 正式開(kāi)源了他們最新的DeepSeek-Prover-V2模型,專(zhuān)門(mén)用于Lean 4形式化定理證明。這次不僅僅是一次模型的迭代(對(duì)DeepSeek-Prover-V1.5),更帶來(lái)了一種結(jié)合大語(yǔ)言模型(LLM)的直覺(jué)和強(qiáng)化學(xué)習(xí)(RL)嚴(yán)謹(jǐn)性的新思路


DeepSeek這次開(kāi)源了兩個(gè)模型版本

DeepSeek-Prover-V2-671B:基于 DeepSeek-Prover-V1.5-Base 構(gòu)建,上下文長(zhǎng)度擴(kuò)展到 32K tokens

DeepSeek-Prover-V2-7B:基于 DeepSeek-V3-Base 訓(xùn)練,還附有詳細(xì)的論文,論文題目《DeepSeek-Prover-V2:通過(guò)強(qiáng)化學(xué)習(xí)推進(jìn)子目標(biāo)分解的形式數(shù)學(xué)推理》

性能 SOTA:DeepSeek-Prover-V2-671B模型,在標(biāo)準(zhǔn)測(cè)試集MiniF2F-test上達(dá)到了88.9%的通過(guò)率,這是目前的最佳水平

挑戰(zhàn)難題:在更難的PutnamBench(基于普特南數(shù)學(xué)競(jìng)賽題)上,它成功解決了49 個(gè)問(wèn)題(總共 658 個(gè))。從圖表看,這個(gè)成績(jī)也顯著優(yōu)于之前的 BFS-Prover 7B、STP 7B 等模型


Hugging Face (模型下載):

https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B

https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-7B

論文鏈接:

https://github.com/deepseek-ai/DeepSeek-Prover-V2/blob/main/DeepSeek_Prover_V2.pdf


核心思路:兩步走,聯(lián)通直覺(jué)與形式

DeepSeek-Prover-V2 的訓(xùn)練方法很有意思,可以概括為兩個(gè)關(guān)鍵階段:

一,冷啟動(dòng)數(shù)據(jù)合成:用大模型“拆解”問(wèn)題

他們先利用DeepSeek-V3這個(gè)強(qiáng)大的基礎(chǔ)模型。通過(guò)精心設(shè)計(jì)的 Prompt,讓 V3 同時(shí)做兩件事:

  • ?分解定理:把一個(gè)復(fù)雜的證明目標(biāo),拆解成一系列更小的、更容易處理的子目標(biāo)(Subgoals),并給出高級(jí)證明草圖(Proof Sketch)。這模擬了人類(lèi)數(shù)學(xué)家的“直覺(jué)”或“規(guī)劃”能力

  • ?同步形式化:在分解的同時(shí),嘗試將這些證明步驟形式化為 Lean 4 代碼片段,形成一系列子目標(biāo)

然后,他們用一個(gè)較小的 7B 參數(shù)模型(DeepSeek-Prover-V2-7B 或類(lèi)似模型)去搜索每個(gè)子目標(biāo)的具體形式化證明。這樣做的好處是,針對(duì)小目標(biāo)的搜索計(jì)算成本更低

一旦所有子目標(biāo)都被解決了,就把這些子目標(biāo)的證明組合起來(lái),形成原始問(wèn)題的完整形式化證明。

最后,將這個(gè)完整的形式化證明與 DeepSeek-V3 最初生成的“分解思路+形式化草稿”(Chain-of-Thought)配對(duì),構(gòu)成一份高質(zhì)量的“冷啟動(dòng)”訓(xùn)練數(shù)據(jù)。這份數(shù)據(jù)既包含了宏觀的解題策略,也包含了微觀的、嚴(yán)格的證明步驟

二,強(qiáng)化學(xué)習(xí):用合成數(shù)據(jù)“教會(huì)”模型連接思路與證明

篩選出一部分“有挑戰(zhàn)性”的問(wèn)題:這些問(wèn)題是 7B 模型無(wú)法直接端到端解決,但其分解出的所有子目標(biāo)都能被成功證明的。用這些問(wèn)題對(duì)應(yīng)的“合成證明”(由子目標(biāo)證明拼接而成)和 DeepSeek-V3 的思路鏈,來(lái)構(gòu)建 RL 的初始數(shù)據(jù)

用這些合成數(shù)據(jù)對(duì) Prover 模型進(jìn)行微調(diào)

然后進(jìn)入強(qiáng)化學(xué)習(xí)階段。目標(biāo)是進(jìn)一步提升模型將非形式化推理(如 V3 給出的解題思路)轉(zhuǎn)化為形式化證明的能力。訓(xùn)練目標(biāo)很直接:對(duì)于模型生成的證明,系統(tǒng)反饋一個(gè)二元信號(hào)(正確或錯(cuò)誤)作為獎(jiǎng)勵(lì),驅(qū)動(dòng)模型學(xué)習(xí)生成正確的證明

新基準(zhǔn):ProverBench,更全面的評(píng)測(cè)

為了更全面地評(píng)估模型在不同數(shù)學(xué)領(lǐng)域和難度上的能力,DeepSeek 還推出了一個(gè)新的基準(zhǔn)測(cè)試集ProverBench

組成:共325個(gè)問(wèn)題

  • ?15 個(gè)來(lái)自近兩年的AIME(美國(guó)數(shù)學(xué)邀請(qǐng)賽)的數(shù)論和代數(shù)題,代表了真實(shí)的高中競(jìng)賽挑戰(zhàn)

  • ?310 個(gè)來(lái)自精心挑選的教科書(shū)和教程,覆蓋了數(shù)論 (40), 初等代數(shù) (30), 線性代數(shù) (50), 抽象代數(shù) (40), 微積分 (90), 實(shí)分析 (30), 復(fù)分析 (10), 泛函分析 (10), 概率論 (10) 等多個(gè)本科及以上數(shù)學(xué)領(lǐng)域

目標(biāo):提供一個(gè)能同時(shí)評(píng)估高中競(jìng)賽水平和本科基礎(chǔ)數(shù)學(xué)能力的、更多樣化、更貼近教育場(chǎng)景的評(píng)測(cè)平臺(tái)

快速上手:自己跑試試看

想自己跑跑看?很簡(jiǎn)單:

模型可以通過(guò) Hugging Face 的transformers庫(kù)直接加載使用

DeepSeek-Prover-V2-671B 與 DeepSeek-V3架構(gòu)相同,可以直接參考 DeepSeek-V3 在 Hugging Face 上的文檔

倉(cāng)庫(kù)里提供了一個(gè)基礎(chǔ)的 miniF2F 推理示例代碼:輸入形式化的定理描述,設(shè)置好 Prompt(要求模型先提供詳細(xì)證明計(jì)劃,再生成 Lean 4 代碼),模型就能輸出證明思路和代碼

# 示例代碼片段 (關(guān)鍵部分) from transformers import AutoModelForCausalLM, AutoTokenizer import torch model_id = "deepseek-ai/DeepSeek-Prover-V2-7B" # or 671B tokenizer = AutoTokenizer.from_pretrained(model_id) model = AutoModelForCausalLM.from_pretrained(model_id, ...) formal_statement = """ import Mathlib ... theorem mathd_algebra_10: abs ((120 : ?) / 100 * 30 - 130 / 100 * 20) = 10 := by   sorry """.strip() prompt = """ Complete the following Lean 4 code: ```lean4 {} Before producing the Lean 4 code to formally prove the given theorem, provide a detailed proof plan... """.strip() chat = [{"role": "user", "content": prompt.format(formal_statement)}] inputs = tokenizer.apply_chat_template(chat, ...) outputs = model.generate(**inputs, ...)

參考:

https://github.com/deepseek-ai/DeepSeek-Prover-V2

?星標(biāo)AI寒武紀(jì),好內(nèi)容不錯(cuò)過(guò)?

用你的在看告訴我~

求贊

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗報(bào)復(fù)以色列最新戰(zhàn)況!伊朗發(fā)射5輪約200枚導(dǎo)彈,突防效率10%不到屬于什么水平?

伊朗報(bào)復(fù)以色列最新戰(zhàn)況!伊朗發(fā)射5輪約200枚導(dǎo)彈,突防效率10%不到屬于什么水平?

軍武速遞
2025-06-14 18:51:49
李連杰首次開(kāi)啟直播,評(píng)價(jià)徒弟向佐穿女裝:這樣的風(fēng)格也挺好!

李連杰首次開(kāi)啟直播,評(píng)價(jià)徒弟向佐穿女裝:這樣的風(fēng)格也挺好!

魯中晨報(bào)
2025-06-14 09:54:03
男籃亞冠最瘋狂球隊(duì)!小組墊底卻逆襲奪冠:1分險(xiǎn)勝遼籃苦主登頂

男籃亞冠最瘋狂球隊(duì)!小組墊底卻逆襲奪冠:1分險(xiǎn)勝遼籃苦主登頂

籃球快餐車(chē)
2025-06-15 06:41:27
甘偉突發(fā)意外,不幸去世,終年59歲

甘偉突發(fā)意外,不幸去世,終年59歲

浙江之聲
2025-06-14 16:46:47
特朗普緊急開(kāi)會(huì),美國(guó)在中東調(diào)兵!伊朗:美參與襲擊,正準(zhǔn)備回應(yīng)!伊空軍高級(jí)軍官被騙聚集開(kāi)會(huì),遭以軍打擊,司令等多人身亡

特朗普緊急開(kāi)會(huì),美國(guó)在中東調(diào)兵!伊朗:美參與襲擊,正準(zhǔn)備回應(yīng)!伊空軍高級(jí)軍官被騙聚集開(kāi)會(huì),遭以軍打擊,司令等多人身亡

每日經(jīng)濟(jì)新聞
2025-06-14 00:40:08
那爾那茜底褲被扒!高考移民,父親央視制片人,這三人或受牽連

那爾那茜底褲被扒!高考移民,父親央視制片人,這三人或受牽連

公子麥少
2025-06-12 13:24:42
獨(dú)庫(kù)堵車(chē)后續(xù):惡意別車(chē)還罵人,車(chē)牌號(hào)被扒,網(wǎng)友曝已墜崖身亡?

獨(dú)庫(kù)堵車(chē)后續(xù):惡意別車(chē)還罵人,車(chē)牌號(hào)被扒,網(wǎng)友曝已墜崖身亡?

云景侃記
2025-06-14 06:45:05
阿曼外交大臣:原定15日舉行的伊美談判取消

阿曼外交大臣:原定15日舉行的伊美談判取消

上觀新聞
2025-06-15 07:08:10
格力突發(fā)!董明珠正式卸任!

格力突發(fā)!董明珠正式卸任!

春序娛樂(lè)
2025-06-14 09:16:16
東風(fēng)日產(chǎn)奇駿真心版 SUV 將于下月初上市,現(xiàn)款 17.99 萬(wàn)元起

東風(fēng)日產(chǎn)奇駿真心版 SUV 將于下月初上市,現(xiàn)款 17.99 萬(wàn)元起

IT之家
2025-06-13 15:04:17
《長(zhǎng)安的荔枝》:為什么李善德不把整棵荔枝數(shù)搬回去?

《長(zhǎng)安的荔枝》:為什么李善德不把整棵荔枝數(shù)搬回去?

老白讀書(shū)
2025-06-14 12:04:46
納悶!宋祖兒總愛(ài)露腳,莫非她這雙腳真有那么好看?

納悶!宋祖兒總愛(ài)露腳,莫非她這雙腳真有那么好看?

手工制作阿殲
2025-06-14 14:11:07
重拳出擊!中方發(fā)出最后通牒,重裝部隊(duì)壓境直抵班公湖,不戰(zhàn)而勝

重拳出擊!中方發(fā)出最后通牒,重裝部隊(duì)壓境直抵班公湖,不戰(zhàn)而勝

Ck的蜜糖
2025-06-13 01:28:57
球隊(duì)選項(xiàng)4489萬(wàn)~火記:范弗里特和火箭或續(xù)簽一份便宜一些的長(zhǎng)約

球隊(duì)選項(xiàng)4489萬(wàn)~火記:范弗里特和火箭或續(xù)簽一份便宜一些的長(zhǎng)約

直播吧
2025-06-15 08:48:15
湖北27歲大學(xué)生因“無(wú)暫住證”被抓遭毆打致死,護(hù)工:死于心臟病

湖北27歲大學(xué)生因“無(wú)暫住證”被抓遭毆打致死,護(hù)工:死于心臟病

坦然風(fēng)云
2025-06-08 20:30:35
緊急提醒:上海明天有大到暴雨!下“溫開(kāi)水”了,挺住→

緊急提醒:上海明天有大到暴雨!下“溫開(kāi)水”了,挺住→

上觀新聞
2025-06-14 22:34:11
最強(qiáng)殺豬盤(pán),睡遍歐美,財(cái)色全騙,靠的就是一張臉

最強(qiáng)殺豬盤(pán),睡遍歐美,財(cái)色全騙,靠的就是一張臉

奇聞故事會(huì)
2023-08-18 14:20:12
真的,千萬(wàn)別把公信力透支沒(méi)了

真的,千萬(wàn)別把公信力透支沒(méi)了

學(xué)術(shù)那些事兒
2025-06-14 20:11:53
曝上海知名主持人金昀去世!年僅43歲,曾因參加《媽媽咪呀》爆紅

曝上海知名主持人金昀去世!年僅43歲,曾因參加《媽媽咪呀》爆紅

小咪侃娛圈
2025-06-14 14:06:40
飛天茅臺(tái)價(jià)格持續(xù)走低,有網(wǎng)友分析若到1900元,多數(shù)經(jīng)銷(xiāo)商要賠錢(qián)

飛天茅臺(tái)價(jià)格持續(xù)走低,有網(wǎng)友分析若到1900元,多數(shù)經(jīng)銷(xiāo)商要賠錢(qián)

愛(ài)看劇的阿峰
2025-06-15 00:51:33
2025-06-15 09:56:49
AI寒武紀(jì) incentive-icons
AI寒武紀(jì)
專(zhuān)注于人工智能,科技領(lǐng)域
717文章數(shù) 313關(guān)注度
往期回顧 全部

科技要聞

華為Pura80系列首銷(xiāo):不再嚴(yán)重缺貨

頭條要聞

印度空難幸存者:機(jī)身撞出巨大裂口 爬出去后發(fā)生爆炸

頭條要聞

印度空難幸存者:機(jī)身撞出巨大裂口 爬出去后發(fā)生爆炸

體育要聞

約戰(zhàn)天王山,步行者G4輸在了哪?

娛樂(lè)要聞

鳳凰傳奇曾毅塌房?網(wǎng)友:別連累玲花

財(cái)經(jīng)要聞

以伊沖突持續(xù)升級(jí),對(duì)全球市場(chǎng)影響多大

汽車(chē)要聞

長(zhǎng)城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤(pán)大棋!

態(tài)度原創(chuàng)

游戲
本地
時(shí)尚
親子
公開(kāi)課

《誅仙世界》首次回應(yīng)銀價(jià)暴跌;騰訊網(wǎng)易紛紛做出違背祖訓(xùn)的決定

本地新聞

最近的打工人,都在熬夜看這劇逐幀學(xué)習(xí)職場(chǎng)小技巧

夏天最值得入手的6件單品,全在這了

親子要聞

父親節(jié)潑冷水:3種中國(guó)式父愛(ài)要不得!希望你一個(gè)也不占

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 免费无码黄动漫在线观看| аⅴ资源中文在线天堂| 九九影院午夜理论片少妇| 国产精品亚洲专区无码老司国| 日韩精品专区在线影院重磅| 国产亚洲精品久久久久婷婷瑜伽| 人妻激情偷乱一区二区三区| 亚洲色成人网站www永久小说| 亚洲色欲色欲www在线丝| 亚洲免费观看在线视频| 国产精品美女久久久久| 久久无码人妻一区二区三区| 亚洲国产精品久久久久制服| 国内精品视频在线观看九九| 精品人妻av一区二区三区| 国产麻豆精品久久一二三| 国产97色在线 | 免| 呦男呦女视频精品八区| 国产一区二区三区四区五区vm| 久久97久久97精品免视看秋霞| 播放男人添女人下边视频| 夜夜爱夜鲁夜鲁很鲁| 麻豆天美国产一区在线播放| 亚洲国产精品福利片在线观看| 亚洲精品天天影视综合网| 中文字幕人妻丝袜乱一区三区| 波多野结衣中文字幕一区二区三区| 国产免费人成视频在线播放播| 亚洲欧美日韩综合一区| 国产精品视频色拍拍| 日本熟人妻中文字幕在线| 四库影院永久国产精品| 午夜一区二区国产好的精华液| 老妇女性较大毛片| 国产精品亚洲专区无码影院| 无码人妻一区二区三区在线视频| 欧美又粗又大又硬又长又爽视频| 欧美性猛交xxxx乱大交极品| 国产精品亚洲综合色区| 日韩人妻潮喷中文在线视频| 久久精品无码一区二区www|