大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

LLM省錢大測評!48塊GH200,首個百億級參數量實證

0
分享至


新智元報道

編輯:LRST 好困

【新智元導讀】EfficientLLM項目聚焦LLM效率,提出三軸分類法和六大指標,實驗包攬全架構、多模態、微調技術,可為研究人員提供效率與性能平衡的參考。

近年來,大型語言模型(LLM)如GPT系列取得了革命性進展,在自然語言處理、內容創作、多語言翻譯乃至科學研究等眾多領域展現出驚人能力。

然而,模型參數量(如DeepseekR1的671B參數)和上下文窗口的急劇膨脹,帶來了巨大的計算力(GPT-3訓練約需3640Petaflop/s-days)、能源消耗和資金投入(GPT-3訓練成本估計超460萬美元)。

高昂的成本已成為制約LLM進一步發展和廣泛應用的關鍵瓶頸。

EfficientLLM項目應「效率測評」需求而生,也是首個針對LLM效率技術進行端到端、百億級參數規模的系統性實證研究。


項目詳情:https://dlyuangod.github.io/EfficientLLM/

模型庫:https://huggingface.co/Tyrannosaurus/EfficientLLM

研究人員在配備了48塊GH200和8塊H200 GPU的生產級集群上執行效率測評,確保了對真實世界中LLM性能與能耗權衡的精確測量。

EfficientLLM的核心目標是為學術界和工業界的研發人員提供一個清晰、數據驅動的導航圖,幫助研究人員在下一代基礎模型的「效率-性能」復雜地貌中找到最佳路徑。


EfficientLLM的三維評測框架與核心指標

研究人員創新性地提出了一個統一的三軸分類法來系統評估LLM效率,覆蓋模型生命周期的關鍵階段:

架構預訓練(Architecture Pretraining)

此部分專注于為模型設計者和研究者在構建新型LLM架構時,提供關于計算資源和能源成本預算的精確分析,并深入評估了多種高效注意力機制變體(如多查詢注意力MQA、分組查詢注意力GQA、多頭潛在注意力MLA、原生稀疏注意力NSA)以及稀疏混合專家模型(MoE)的效率表現。

微調(Fine-tuning)

針對需要將預訓練基礎模型適配到特定下游任務或專業領域的實踐者,研究人員提供了參數高效微調(PEFT)方法的效率基準。評估涵蓋了LoRA、RSLORA、DoRA等主流PEFT技術。

位寬量化(Bit-width Quantization)

面向模型部署工程師,研究人員評估了如何通過模型壓縮技術(特別是無需重訓即可直接部署的訓練后量化方法,如int4和float16)有效降低服務成本和推理延遲。

評估指標

為全面刻畫效率,EfficientLLM還引入了六個相互正交的細粒度評估指標:

1. 平均內存利用率(Average-Memory-Utilization,AMU)

2. 峰值計算利用率(Peak-Compute-Utilization,PCU)

3. 平均延遲(Average-Latency,AL)

4. 平均吞吐量(Average-Throughput,AT)

5. 平均能耗(Average-Energy-Consumption,AEC)

6. 模型壓縮率(Model-Compression-Rate,MCR)這些指標共同捕捉了硬件飽和度、延遲與吞吐量的平衡,以及碳排放成本等關鍵因素。

基準測試涵蓋了超過100個「模型-技術」組合,納入從0.5B到72B參數規模的多種LLM。


EfficientLLM的三大核心洞見

效率優化是「沒有免費午餐」的量化權衡(Efficiency Involves Quantifiable Trade-offs)

百余項實驗清晰地表明,不存在一種能在所有維度上都達到最優的通用效率技術。

每一種被評估的方法,在提升至少一個效率指標的同時,幾乎總會在其他某個或某些指標上有所妥協。


以稀疏混合專家模型(MoE)為例,能有效降低推理時的FLOPs(浮點運算次數)并提升下游任務的準確率,但其代價是峰值顯存需求增加約40%(因為需要存儲所有專家網絡的參數)。

int4量化技術則展現了另一面:可以將模型的內存占用和能耗降低高達3.9倍,模型壓縮率表現優異,但根據實測數據,通常伴隨著約3-5%的任務平均得分下降。

最優效率策略高度依賴于具體任務和模型規模(Optima are Task- and Scale-Dependent)

效率的「最優解」并非一成不變,而是高度依賴于應用場景、模型規模和硬件環境。

高效注意力機制:在架構預訓練階段,對于內存資源極度受限的設備(如端側推理),MQA(多查詢注意力)因其共享鍵值頭設計,展現出最佳的內存占用和延遲特性。

而當追求極致的語言生成質量時(以困惑度PPL為衡量標準),MLA(多頭潛在注意力)則表現更優。若目標是最低能耗部署,NSA(原生稀疏注意力)則是首選。


PEFT方法的規模效應:在微調階段,對于1B到3B參數規模的較小模型,LoRA及其變體(如DoRA,統稱LoRA-plus)在特定的內存約束下能達到最低的性能損失(即最佳的任務表現)。

然而,當模型規模擴展到14B參數以上時,RSLORA在效率上反超LoRA,展現出更低的延遲和功耗。

對于超大規模模型的微調,參數凍結(僅更新部分層或組件)策略雖然可能犧牲少量任務精度,但能提供最佳的端到端微調延遲。

量化精度選擇:在推理階段,測試(涵蓋Llama-3,DeepSeek,Qwen等1.5B至34B模型)表明,int4訓練后量化能顯著提升資源效率。

內存占用減少接近理論上的4倍,吞吐量(每秒處理詞元數)在內存受限條件下可提升三倍,而平均任務性能得分僅有小幅下降(例如DeepSeek-R1-Distill-Qwen-14B的平均分從bf16的0.4719降至int4的0.4361)。

在16位浮點格式中,bfloat16在Hopper架構GPU(GH200/H200)上,相較于float16,始終在平均延遲和能耗方面表現更優,這得益于現代NVIDIA GPU對bfloat16運算的原生硬件加速。

LLM效率技術可廣泛遷移至跨模態模型(Broad ApplicabilityAcrossModalities)

研究人員將EfficientLLM的評估框架成功擴展到了大型視覺模型(LVMs)和視覺語言模型(VLMs),如Stable Diffusion3.5、Wan2.1和Qwen2.5-VL等。


實驗結果令人鼓舞:在LLM上得到驗證的效率技術,如MQA/GQA等高效注意力機制,能夠有效地遷移并改進LVM的生成質量(以FID分數為衡量標準);PEFT方法同樣在LVM和VLM上取得了良好的性能-效率權衡,表明針對LLM的效率優化研究成果具有更廣泛的適用性。

開放共享,賦能未來

研究人員即將開源完整的評估流程代碼以及排行榜,在為全球的學術研究者和企業工程師在探索下一代基礎模型的效率與性能平衡時,提供一個堅實的、可復現的、值得信賴的「指南針」。

研究成果可以為從業者提供基于嚴謹實證數據的可操作建議,幫助研究人員在具體的任務需求和資源限制下,做出更明智、更高效的模型和技術選型決策,而不是僅僅依賴理論推演或有限的經驗。

LLM的效率優化是一個持續演進的系統工程,EfficientLLM的探索也僅是其中的一部分,諸如訓練基礎設施優化、基于強化學習的訓練后對齊、測試時擴展策略等重要議題,開發團隊計劃在未來進行深入研究。

參考資料:

https://dlyuangod.github.io/EfficientLLM/


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
浙江一婚席吃掉50萬元,結賬嫌太貴拒付款,餐具供應商:我的錢也沒給

浙江一婚席吃掉50萬元,結賬嫌太貴拒付款,餐具供應商:我的錢也沒給

極目新聞
2025-06-14 10:52:54
11國棄權,中方反對票失效,以方侵犯伊朗主權,更可怕的還在后面

11國棄權,中方反對票失效,以方侵犯伊朗主權,更可怕的還在后面

吳欣純Deborah
2025-06-14 16:59:12
局勢突變!中國深夜發出警告,俄羅斯聲明立即結束會談!

局勢突變!中國深夜發出警告,俄羅斯聲明立即結束會談!

一個有靈魂的作者
2025-06-14 22:17:44
7國加入戰場,伊朗要被群毆?局勢變成5對2,中方不再靜觀其變

7國加入戰場,伊朗要被群毆?局勢變成5對2,中方不再靜觀其變

阿傖說事
2025-06-14 23:10:38
提車兩周,上高速半小時自燃,所有門打不開!一車主發帖引發關注

提車兩周,上高速半小時自燃,所有門打不開!一車主發帖引發關注

火山詩話
2025-06-15 07:29:21
新聞圖直出的美貌…

新聞圖直出的美貌…

阿廢冷眼觀察所
2025-06-14 01:19:01
伊朗革命衛隊發布通告:缺席即叛國,軍內逃亡潮浮現

伊朗革命衛隊發布通告:缺席即叛國,軍內逃亡潮浮現

桂系007
2025-06-14 22:32:58
恥辱!香港運動員奪冠拒唱國歌,這樣的運動員不止一個

恥辱!香港運動員奪冠拒唱國歌,這樣的運動員不止一個

柳絮憶史
2025-06-14 07:10:03
3年3900萬美元!火箭與亞當斯達成續約 還剩15天決定范弗利特選項

3年3900萬美元!火箭與亞當斯達成續約 還剩15天決定范弗利特選項

羅說NBA
2025-06-15 06:29:59
一男子高聲怒罵館長是“臺獨”狗

一男子高聲怒罵館長是“臺獨”狗

代偉看世界
2025-06-15 01:13:56
郭正亮神預判:為了全球資金流向美國,6月一定會挑起中東戰爭!

郭正亮神預判:為了全球資金流向美國,6月一定會挑起中東戰爭!

大歪歪
2025-06-14 16:48:22
霍華德芬森互毆沖突:摟脖抱摔扭打倒進觀眾席 現場混亂都被驅逐

霍華德芬森互毆沖突:摟脖抱摔扭打倒進觀眾席 現場混亂都被驅逐

追球者
2025-06-15 07:25:59
伊朗媒體稱伊又擊落一架以色列F-35戰機!以防長警告伊朗:如果繼續襲擊,德黑蘭將化為火海

伊朗媒體稱伊又擊落一架以色列F-35戰機!以防長警告伊朗:如果繼續襲擊,德黑蘭將化為火海

每日經濟新聞
2025-06-15 00:21:17
最新:以伊持續互襲!近200枚導彈飛向以色列,伊朗多個核設施遭襲…普京特朗普緊急通話50分鐘

最新:以伊持續互襲!近200枚導彈飛向以色列,伊朗多個核設施遭襲…普京特朗普緊急通話50分鐘

上觀新聞
2025-06-15 08:11:30
南航“美女經理”:除了生理期就沒閑過,兩年半和上級開房410次

南航“美女經理”:除了生理期就沒閑過,兩年半和上級開房410次

就一點
2025-06-13 16:45:25
羅帥宇冤不冤我說不準,但沒人會偷割你孩子的器官……

羅帥宇冤不冤我說不準,但沒人會偷割你孩子的器官……

基本常識
2025-06-14 22:42:03
突發!以軍發動新一輪襲擊,伊朗核計劃總部遭襲!以色列多地遭伊朗導彈襲擊,特朗普、普京最新表態

突發!以軍發動新一輪襲擊,伊朗核計劃總部遭襲!以色列多地遭伊朗導彈襲擊,特朗普、普京最新表態

每日經濟新聞
2025-06-15 07:28:03
再次跟中天說抱歉!“館長”:對中天有一分愧疚,我一直在彌補

再次跟中天說抱歉!“館長”:對中天有一分愧疚,我一直在彌補

海峽導報社
2025-06-14 21:35:02
以色列空襲也門胡塞武裝領導人住所

以色列空襲也門胡塞武裝領導人住所

新華社
2025-06-15 07:34:15
馬斯克吐槽:香港法官佩戴過時的假發,像是在清倉甩賣時買的!網友:28年了辮子都還沒剪掉

馬斯克吐槽:香港法官佩戴過時的假發,像是在清倉甩賣時買的!網友:28年了辮子都還沒剪掉

大白聊IT
2025-06-14 22:41:29
2025-06-15 10:20:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
12877文章數 66068關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

體育要聞

約戰天王山,步行者G4輸在了哪?

娛樂要聞

鳳凰傳奇曾毅塌房?網友:別連累玲花

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

家居
本地
健康
公開課
軍事航空

家居要聞

森林幾何 極簡灰調原木風

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

呼吸科專家破解呼吸道九大謠言!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊媒:以色列國防部大樓被伊朗導彈擊中

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品久久久久影院| 无码中字出轨中文人妻中文中| 欧美性黑人极品hd另类| 香蕉大美女天天爱天天做| 色欧美片视频在线观看| 国产丶欧美丶日本不卡视频| 内射中出日韩无国产剧情| 亚洲欧美国产国产综合一区| 欧美人与禽z0zo牲伦交| 欧美成 人 网 站 免费| 国产超高清麻豆精品传媒麻豆精品| 一本色道久久hezyo无码| 久久九九日本韩国精品| 青草av久久一区二区三区| 香港三日本8a三级少妇三级99| 国产又色又爽无遮挡免费软件| 亚洲国产精品久久久久秋霞1| 久久久精品国产sm调教网站| 日日橹狠狠爱欧美视频| 亚洲第一页综合图片自拍| 少妇内射兰兰久久| 国产精品亚洲色婷婷99久久精品| 极品少妇一区二区三区四区| 国产精品jizz视频| 97超碰国产精品最新| 无码熟妇人妻av在线影片| 亚洲第一无码专区天堂| 在线无码va中文字幕无码| 国产精品久久久久aaaa| 亚洲精品高清无码视频| 欧美老肥婆牲交videos| 四虎国产精品免费久久久| 色偷偷888欧美精品久久久| 亚洲国产一成人久久精品| 国内精品九九久久精品| 动漫人妻无码精品专区综合网| 久久久久高潮毛片免费全部播放| 久久亚洲精品无码va大香大香| 亚洲国产第一站精品蜜芽| 99视频偷窥在线精品国自产拍| 好紧好爽免费午夜视频|