大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

科學家提出動力學擴展定律,支持更長的文本生成

0
分享至

近日,美國卡內基梅隆大學助理教授陳貝迪和團隊提出了“動力學擴展定律”(Kinetics Scaling Law)。在該定律的指導之下,當在英偉達 B200 上實現相同精度時,資源需求最高可降低至原來的三分之一。


(來源:http://publish.illinois.edu/rising-stars/beidi-chen)

同樣是在該定律的指導之下,在 AIME 和 LiveCodeBench 上,稀疏注意力在低成本模式下將問題解決率提高了 60%,在高成本模式下提高了 5% 以上。


(來源:arXiv)

動力學擴展定律的核心觀點是:在測試時擴展(TTS,Test-time scaling)任務中,影響性能的主要因素不是參數數量,而是注意力機制的計算成本。

本次研究團隊證明,稀疏注意力從根本上重塑了擴展格局,使得生成內容的長度更長、精度更高。其在論文中表示,稀疏動力學可能預示著一種新范式,這種新范式使得即便在預訓練進入平臺期后仍能推動持續進步。

研究中,他們還強調了將模型架構、測試時推理技術與硬件基礎設施進行協同設計的必要性,并認為這是推動下一波可擴展大模型部署的關鍵步驟。雖然本次分析主要集中在英偉達 GPU 上,但“擴展內存帶寬比擴展浮點運算(FLOP,floating-point operation)能力更具挑戰性且成本更高”這一基本原理廣泛適用于各類硬件平臺,因此本次成果具有一定的普適性。



降低每個 token 的計算成本,支持更長的文本生成和更多的并行樣本處理

研究團隊表示,他們從實際效率的角度重新思考了測試時擴展定律,發現較小模型的有效性實際上被嚴重高估了。具體來說,此前人們基于計算最優性的研究工作,其實忽略了推理時策略所引入的關鍵內存訪問瓶頸問題。

而在本次研究之中,他們全面分析涵蓋了從 0.6B 到 32B 參數的模型,借此揭示了動力學擴展定律,該定律通過同時納入計算成本和內存訪問成本,能夠更好地指導資源分配。

動力學擴展定律表明,在參數超過某個閾值的模型上使用測試時計算,比在較小模型上使用更為有效。一個關鍵原因是在測試時擴展中,注意力才是主要的成本因素(而非參數數量)。

受此啟發,研究團隊提出了以稀疏注意力為中心的新擴展范式,該范式可以降低每個 token 的計算成本,從而能在相同的資源預算下,支持更長的文本生成和更多的并行樣本處理。

研究團隊發現,稀疏注意力模型始終優于密集注意力模型。這說明隨著計算投入的增加,稀疏注意力是必不可少的,而且會越來越重要,只有這樣才能實現測試時擴展的全部潛力。而與訓練不同的是,準確性并未隨著計算的增加而飽和,而是會通過增加生成量不斷得到提高。

那么,研究團隊開展本次課題的原因是什么?這要從測試時擴展(TTS,Test-time scaling)說起。眼下,測試時擴展策略已經成為增強大模型推理能力的一種重要手段,特別是在智能體與復雜環境交互的場景中,例如編寫代碼、瀏覽網頁等場景中。

然而,這些能力會帶來顯著的推理時成本,因此理解這一新范式下的性能擴展規律至關重要。現有的擴展定律研究主要關注浮點運算(FLOP,floating-point operation),但卻忽略了內存訪問成本。而內存訪問成本往往是決定實際延遲的關鍵因素,因此上述做法可能會導致部署決策不夠優化。


(來源:arXiv)

如前所述,在本次研究之中他們展示了測試時擴展的動力學擴展定律,該定律源自于一個明確納入內存訪問成本的成本模型,它揭示了關于測試時計算資源分配的帕累托最優策略的截然不同的結論。

具體而言,研究團隊發現:首先,先前的標度律始終高估了通過推理時策略增強的小模型的有效性;其次,計算資源最好先用于將模型規模增大到一個關鍵閾值,然后再投入測試時策略。

研究中,他們針對一系列最先進的推理模型所進行的屋頂線分析表明:之所以出現最優測試時計算策略的轉變,是因為測試時策略不成比例地增加了注意力成本,而非增加了參數成本。


(來源:arXiv)

研究團隊的等成本分析表明,注意力機制隨生成長度呈二次方增長的特性,加上鍵值內存相對于模型參數的失衡擴展趨勢,共同使得人們更加傾向于擴大模型規模、而非增加生成長度。這種失衡現象在混合專家架構中被進一步加劇,正因此這種架構雖然能夠降低激活參數量,但卻未能緩解注意力計算的高開銷現狀。

基于上述分析,研究團隊引入了本次新的擴展范式,該范式以稀疏注意力為中心,從根本上重塑了擴展規律,顯著提高了測試時擴展的可擴展性。


(來源:arXiv)

根據研究團隊的稀疏動力學擴展定律,最好將計算資源分配給測試時策略,而非用于降低稀疏性。隨著在測試階段投入更多計算資源,高稀疏性對于充分利用這些策略的優勢變得愈發關鍵。

盡管稀疏性傳統上要么用于小模型的正則化,要么用于在參數過多的網絡中減少計算量,但本次研究引入了一個根本不同的視角——稀疏性能夠成為實現高效可擴展測試時計算的核心使能技術。與此同時,本次研究強調了在建立可擴展性定律的實際認知過程中,必須同時考量硬件因素與模型架構的重要性。



讓 Qwen3-0.6B 模型實現 23.6~33.3 倍的吞吐量增長

在實驗設置和實驗任務上,研究團隊聚焦于以下三個具有一定挑戰性的推理基準:涵蓋代數、組合數學和幾何的 AIME24 和 AIME25,以及包含近期編程競賽中的復雜編程問題的 LiveCodeBench。在模型選擇上,研究團隊評估了 Qwen3 和 DeepSeek-R1-DistilledQwen 系列不同模型的性能。

為了消除測試時策略的具體實現所引入的混雜效應,研究團隊采用了兩種具有代表性但簡單的方法:長 CoT 和 Best-of-N。長 CoT 是一種在先進推理模型中被廣泛使用的方法,Best-of-N 則通過可驗證問題的解決率進行效果評估,并借助測試時間擴展給出理論性能上限。

在硬件上,研究團隊使用了英偉達 B200。實驗中,他們在每個節點 8 個 GPU 上,通過批量大小和上下文長度分別為(4096,16384)和(2048,32768)的設置,展示了塊 top-k 注意力在不同模型規模下的優勢。

同時,他們假設具有相似上下文長度和生成長度的任務的工作負載是統一的。如下圖所示,塊 top-k 注意力能夠大大提高推理吞吐量,特別是對于較小的模型來說。例如,Qwen3-0.6B 模型實現了 23.6~33.3 倍的吞吐量增長。


(來源:arXiv)

這一性能提升反映出:隨著上下文長度的增加,稠密注意力機制的效率會逐漸下降,而較小模型受到的影響尤為顯著。吞吐量的顯著提升凸顯了這樣一種潛力:當與推理系統和測試時策略進行適當的協同設計時,任務級吞吐量也能獲得相應的提升。

除了 top-k 注意力機制之外,目前他們僅探討了一種簡單的變體(即塊 top-k 注意力),盡管如此已能展現出強大的可擴展性。眼下,已經存在更先進的稀疏注意力算法,這些算法具備將測試時擴展效率的邊界推向更高水平的潛力。

另一方面,測試時擴展算法旨在自適應地將計算資源分配給任務甚至是分配給 token。將它們擴展到稀疏注意力中的新資源分配問題,對于達到稀疏動力學的極限至關重要。例如,由于生成長度與稀疏注意力下的最佳試驗次數密切相關,因此可以將其用作調整試驗次數和鍵值預算的動態信號。


(來源:arXiv)

此外,稀疏的注意力大大降低了推理成本,使得更多的推理試驗和更長的生成成為可能,這為在固定資源預算內配置測試時擴展策略提供了更大的靈活性。

同時,通過將關注點從 token 級指標轉向任務級吞吐量,研究團隊認為本次成果能為算法與系統的協同設計開辟更廣闊的空間。需要說明的是,本次研究本質上屬于算法層面的成果,并不針對特定應用。盡管大模型可能被惡意濫用,但本研究并未引入現有系統之外的新能力或風險。

研究團隊表示,測試時擴展可能會消耗大量能源,引發人們對廣泛部署的環境可持續性的擔憂。而通過推廣稀疏注意力,他們希望幫助減少推理系統的碳足跡和能耗,并助力實現更廣泛的可持續人工智能目標。

未來,他們希望這項研究能夠指導在模型架構、測試時策略和硬件系統方面的協同設計,以便更好地解鎖下一波大模型擴展的潛力。

參考資料:

https://arxiv.org/pdf/2506.05333

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
48小時封殺令!知名女星高考特權頂包,牽連大佬集體落馬倒計時!

48小時封殺令!知名女星高考特權頂包,牽連大佬集體落馬倒計時!

新語愛八卦
2025-06-13 16:30:57
跌太猛了!浙江余杭這個小區從214萬暴跌到80萬,跌幅超過60%…

跌太猛了!浙江余杭這個小區從214萬暴跌到80萬,跌幅超過60%…

火山詩話
2025-06-14 14:30:42
楊冪Labubu包包炸街!時尚女王秒殺全場,漫畫腿帥到窒息!

楊冪Labubu包包炸街!時尚女王秒殺全場,漫畫腿帥到窒息!

開心熬夜觀影
2025-06-14 17:07:24
丟人啊!百度流量只占10%!馬上要被Google反超了

丟人啊!百度流量只占10%!馬上要被Google反超了

機械狗
2025-06-14 10:30:30
設計院被舉報使用盜版CAD,被一鍋端!

設計院被舉報使用盜版CAD,被一鍋端!

黯泉
2025-06-14 22:10:35
沒當過自由球員!亞當斯生涯賺了2.1億?四次提前續約!

沒當過自由球員!亞當斯生涯賺了2.1億?四次提前續約!

直播吧
2025-06-15 09:09:14
抽到下下簽!鄭欽文可能首輪出局,拿冠軍也難了,鮑里妮天堂好簽

抽到下下簽!鄭欽文可能首輪出局,拿冠軍也難了,鮑里妮天堂好簽

侃球熊弟
2025-06-15 00:01:50
7月起,我國將明令禁止收取這5種物業費,業主們還需早知道!

7月起,我國將明令禁止收取這5種物業費,業主們還需早知道!

詩詞中國
2025-06-14 14:09:57
62歲李連杰做夢也沒想到,自己4個女兒,已經都開始為他爭光了!

62歲李連杰做夢也沒想到,自己4個女兒,已經都開始為他爭光了!

小椰的奶奶
2025-06-15 09:24:26
寧夏固原一學校圍墻風雨天倒塌,墻外帳篷內祖孫二人被砸身亡,一孕婦受傷

寧夏固原一學校圍墻風雨天倒塌,墻外帳篷內祖孫二人被砸身亡,一孕婦受傷

極目新聞
2025-06-15 11:19:38
市長、副市長、縣長等148人,省林業局黨組、市政府黨組等13個黨組織,被嚴肅追責問責!

市長、副市長、縣長等148人,省林業局黨組、市政府黨組等13個黨組織,被嚴肅追責問責!

新京報政事兒
2025-06-15 10:27:42
國家電力局長意外被捕!居然早成美國間諜,被捕時叫囂我是美國人,被判5年監禁后驅離出境

國家電力局長意外被捕!居然早成美國間諜,被捕時叫囂我是美國人,被判5年監禁后驅離出境

大白聊IT
2025-06-14 22:40:59
詹姆斯突然發布!退役宣告?還是降薪簽1+1!

詹姆斯突然發布!退役宣告?還是降薪簽1+1!

柚子說球
2025-06-15 11:54:26
老公出差我偷偷走進地下室,發現消失3年的閨蜜,她哭著說:快走

老公出差我偷偷走進地下室,發現消失3年的閨蜜,她哭著說:快走

白云故事
2025-05-30 19:20:03
以色列箭3太空打爆伊朗導彈,卻被這一幕破防:以軍不敗神話破滅

以色列箭3太空打爆伊朗導彈,卻被這一幕破防:以軍不敗神話破滅

科羅廖夫
2025-06-14 19:00:19
華裔女子用20張圖片表達中西差異!

華裔女子用20張圖片表達中西差異!

霹靂炮
2025-06-09 22:12:29
網暴直播抓小三!6年閨蜜竟睡了她老公3年,雙方都已婚有娃!

網暴直播抓小三!6年閨蜜竟睡了她老公3年,雙方都已婚有娃!

說點真嘞叭
2025-06-15 06:43:29
嚴屹寬開車300公里回家,幫老婆拖地擦廁所,40歲杜若溪想要二胎

嚴屹寬開車300公里回家,幫老婆拖地擦廁所,40歲杜若溪想要二胎

界史
2025-06-13 09:22:56
房價跌幅前十城,最高跌一半,前三名竟他們,天津超武漢

房價跌幅前十城,最高跌一半,前三名竟他們,天津超武漢

石辰搞笑日常
2025-06-14 02:57:45
萬萬沒想到!酷似馬云的范小勤,在被資本拋棄后,如今活成了這樣

萬萬沒想到!酷似馬云的范小勤,在被資本拋棄后,如今活成了這樣

歸史
2025-06-14 11:14:30
2025-06-15 12:28:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15294文章數 513782關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

清華高顏值美女學霸走紅 本人最新發聲

頭條要聞

清華高顏值美女學霸走紅 本人最新發聲

體育要聞

裁判可以噴,但也從步行者自身找找問題?

娛樂要聞

鳳凰傳奇曾毅塌房?網友:別連累玲花

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

房產
藝術
數碼
公開課
軍事航空

房產要聞

又一城購房補貼!買房就發錢,正在海南樓市瘋狂擴散!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

數碼要聞

AMD 銳龍7 9700F曝光:無核顯加持,主流游戲玩家的新希望?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗最高領袖高級顧問沙姆哈尼 因傷勢過重離世

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 18禁超污无遮挡无码免费动态图| 久久本色成人综合网| 人人超碰人人爱超碰国产| 欧洲熟妇色xxxx欧美老妇| 亚洲s色大片在线观看| 亚洲精品一区二区三区四区手机版| 成人网站免费在线观看| 亚洲精品久久久久久久蜜臀老牛| 成人免费一区二区三区视频软件| 亚洲精品国产精品国自产小说| 在线观看免费人成视频| 亚洲欧美日本国产高清| 超碰97人人做人人爱少妇| 国产成人综合亚洲看片| 欧美色欧美亚洲另类二区| 欧美午夜精品一区二区蜜桃| 成人自慰女黄网站免费大全| 红杏亚洲影院一区二区三区| 久久夜色精品国产网站| 亚洲婷婷五月激情综合app| 亚洲精品无码久久毛片波多野吉衣| 亚洲高清偷拍一区二区三区| 欧美野外疯狂做受xxxx高潮| 欧美日韩国产的视频yw885| 日本无码人妻精品一区二区蜜桃| 国产成+人+综合+欧美亚洲| av无码免费岛国动作片不卡| 3p人妻少妇对白精彩视频| 亚洲熟伦熟女新五十路熟妇| 日本丰满熟妇videossex8k| 中文字幕日本人妻久久久免费| 亚洲不乱码卡一卡二卡4卡5卡| 久久婷婷狠狠综合激情| 国产呦交精品免费视频| 亚洲精品久久yy5099| 欧美黑人欧美精品刺激| 无码国模国产在线观看| 一出一进一爽一粗一大视频免费的| 狠狠色综合网站久久久久久久| 亚洲欧美18v中文字幕高清| av狼友无码国产在线观看|