大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

訓練MoE足足提速70%!華為只用了3招

0
分享至

允中 發自 凹非寺
量子位 | 公眾號 QbitAI

Scaling Law之下,MoE(混合專家)如今已經成為各大模型廠商擴展模型能力的制勝法寶。

不過,在高效實現模型參數規模化的同時,MoE的訓練難題也日益凸顯:

訓練效率不足,甚至一半以上訓練時間都浪費在“等待”上



現在,為了突破MoE的訓練瓶頸,華為出手了:

構建了一套名為Adaptive Pipe & EDPB的優化方案,開啟“上帝視角”,讓MoE面臨“交通擁堵”的訓練集群,實現無等待流暢運行。

MoE大規模訓練難題:一半以上的訓練時間在等待?

實踐已經表明,MoE模型訓練集群的效率面臨兩方面挑戰:

首先,是專家并行引入了計算和通信等。

當模型規模較大時,需要切分專家到不同設備形成并行(EP),這就引入額外All-to-All通信。

與此同時,MoE層絕大部分EP通信與計算存在時序依賴關系,一般的串行執行模式會導致大量計算單元空閑,等待通信。



其次,負載不均會引入計算和計算等。

MoE算法核心是“有能者居之”,在訓練過程中會出現部分熱專家被頻繁調用,而冷專家使用率較低的情況。

同時,真實訓練數據的長度不一,不同的模型層(如稀疏層、嵌入層等)的計算量也存在明顯差異,造成不同卡之間計算也在互相等待。

用一個形象點的說法就是,MoE訓練系統就像一個存在局部交通阻塞的城區,面臨兩大核心問題:

  • 人車混行阻塞:所有車輛(計算)與行人(通信)在紅綠燈交替通行,互相等待。
  • 車道分配僵化:固定劃分的直行、左轉車道就像靜態的專家分配,導致熱門車道(熱專家)大排長龍,而冷門車道(冷專家)閑置。

針對以上問題,華為團隊打造了“智慧化交通”設施:

首先,建造“行人地下通道”(通信掩蓋技術),徹底分離人車動線,使計算不再等待通信。

其次,部署“智能可變車道”(動態專家路由),根據實時車流(數據分布)動態調整車道功能,讓閑置的左轉車道也能分擔直行壓力,實現負載均衡。

這套組合方案既解決了資源分配不均的問題,又消除了通信阻塞的瓶頸,就像為城市交通裝上了“智慧大腦”,讓每個方向的通行效率都得到最大化提升。

DeployMind仿真平臺,小時級自動并行尋優

具體來說,華為首先構建了名為DeployMind的仿真平臺,它是一個基于昇騰硬件訓練系統的“數字孿生”平臺,通過計算/通信/內存三維度的多層級建模、昇騰硬件系統的高精度映射、全局化算法加速運行等技術,能在1小時內模擬百萬次訓練場景,實現MoE模型多樣化訓練負載的快速分析和自動找到與集群硬件規格匹配的最優策略選擇。

在訓練實踐驗證中,該建模框架可達到90%精度指標,實現低成本且高效的最優并行選擇。

針對Pangu Ultra MoE 718B模型,在單卡內存使用約束下,華為通過DeployMind以訓練性能為目標找到了TP8/PP16/VPP2/EP32(其中TP只作用于Attention),這一最適合昇騰集群硬件規格的并行方案,綜合實現計算、通信、內存的最佳平衡。

通信掩蓋>98%,讓計算不再等待通信

華為還提出了一套名為Adaptive Pipe的通信掩蓋框架。在DeployMind仿真平臺自動求解最優并行的基礎上,采用層次化All-to-All降低機間通信和自適應細粒度前反向掩蓋,實現通信幾乎“零暴露”。

層次化專家并行通信

針對不同服務器之間通信帶寬低,但機內通信帶寬高的特點,華為創新地將通信過程拆成了兩步走:

第一步,讓各個機器上“位置相同”的計算單元聯手,快速地從所有機器上收集完整的數據塊(Token);

第二步,每臺機器內部先對數據塊進行整理,然后利用機器內部的高速通道,快速完成互相交換。

這種分層設計的巧妙之處在于,它把每個數據塊最多的復制分發操作都限制在單臺機器內部的高速網絡上完成,而在跨機器傳輸時,每個數據塊只需要發送一份拷貝,相比傳統All-to-All通信加速1倍。

也就是說,有效通過減少跨機通信,提升了集群的通信速度。

自適應細粒度前反向掩蓋

在DualPipe掩蓋框架的基礎上,華為基于虛擬流水線并行技術,實現了更精密的調度,即Adaptive Pipe。



相比DualPipe,Adaptive Pipe僅利用一份權重,不僅將流水線并行所需的內存占用減半,有效降低了計算“空泡”,釋放了流水線的峰值性能潛力;同時,該策略能夠額外實現與分層通信的完美協同,無縫覆蓋機間與機內兩層通信的掩蓋。

在這種層次化通信和細粒度計算通信切分調度優化下,Adaptive Pipe可實現98%以上的EP通信掩蓋,讓計算引擎不受通信等待的束縛。



克服負載不均,訓練再加速25%

由于MoE模型訓練過程中天然存在的負載不均問題,集群訓練效率時高時低,華為團隊還提出了EDPB全局負載均衡,實現專家均衡調度。

在最優并行和通信掩蓋基礎上,EDPB再取得了25.5%的吞吐提升收益。



△集群P2P通信分析對比

所謂EDPB,E是專家預測動態遷移

MoE模型訓練中,設備間的專家負載不均衡如同“蹺蹺板”——部分設備滿載運行,另一些卻處于“半休眠”狀態。團隊提出了基于多目標優化的專家動態遷移技術,讓專家在分布式設備間“智能流動”。

該技術主要有三個特點:

  • 預測先行,讓專家負載“看得見未來”:預測負載趨勢,實現“計算零存儲開銷,預測毫秒級響應”;
  • 雙層優化,計算與通信的黃金分割點:提出節點-設備雙層貪心優化架構,在讓計算資源“齊步走”的同時,給通信鏈路“減負”;
  • 智能觸發,給專家遷移裝上“紅綠燈”:設計分層遷移閾值機制,通過預評估遷移收益動態決策,實現專家遷移的智能觸發。



△基于專家動態遷移的EP間負載均衡整體框架圖

D是數據重排Attention計算均衡

在模型預訓練中普遍采用數據拼接固定長度的策略,但跨數據的稀疏Attention計算量差異顯著,會引入負載不均衡問題,導致DP間出現“快等慢”的資源浪費。

為解決這一問題,華為團隊提出了一種精度無損的動態數據重排方案,其核心在于:通過線性模型量化單樣本計算耗時,在嚴格保持訓練精度無損下,批次內采用貪心算法構建最小化耗時的數據重排,實現負載均衡。

P是虛擬流水線層間負載均衡。

MoE模型通常采用混合結構,Dense層、MTP層、輸出層所在的Stage與純MoE層所在的Stage負載不均,會造成的Stage間等待。

華為團隊提出虛擬流水線層間負載均衡技術,將MTP層與輸出層分離,同時將MTP Layer的 Embedding計算前移至首個Stage,有效規避Stage間等待問題,實現負載均衡。



△基于異構模塊設計的VPP并行負載均衡

系統端到端72.6%訓練吞吐提升

在Pangu Ultra MoE 718B模型的訓練實踐中,華為團隊在8K序列上測試了Adaptive Pipe & EDPB吞吐收益情況。

實驗結果顯示,在最優并行策略的初始性能基礎上,華為這套“通信掩蓋+動態專家遷移”的優化方案,能實現系統端到端72.6%的訓練吞吐提升。



總而言之,華為的這套打法可以說是為大模型訓練優化提供了關鍵路徑。感興趣的小伙伴可以再通過完整技術報告深入了解——

技術報告地址:

https://gitcode.com/ascend-tribe/ascend-training-system/tree/main/DistributedOptimization

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
伊以沖突爆發后,多國紛紛站隊,俄羅斯、印度和巴基斯坦最反常

伊以沖突爆發后,多國紛紛站隊,俄羅斯、印度和巴基斯坦最反常

阿傖說事
2025-06-14 15:55:33
氛圍超贊!淮安南京比賽一側看臺坐滿觀眾,tifo“崛起江淮”矚目

氛圍超贊!淮安南京比賽一側看臺坐滿觀眾,tifo“崛起江淮”矚目

直播吧
2025-06-14 16:17:14
中國進入超單身時代!單身數直逼美國總人口,專家:錯不在年輕人

中國進入超單身時代!單身數直逼美國總人口,專家:錯不在年輕人

奇思妙想草葉君
2025-06-14 22:39:33
96年母親安排相親,我卻臨陣溜走,女孩竟直接找上門

96年母親安排相親,我卻臨陣溜走,女孩竟直接找上門

霧島夜話
2025-06-14 17:55:54
烏克蘭富家女嫁到河南農村,31歲的丈夫因病逝世,她立馬把3個兒子國籍全改了,公婆說:她是恩人!

烏克蘭富家女嫁到河南農村,31歲的丈夫因病逝世,她立馬把3個兒子國籍全改了,公婆說:她是恩人!

LULU生活家
2025-06-09 18:27:46
中東局勢走向失控?專家解讀此次以伊沖突背后原因與影響

中東局勢走向失控?專家解讀此次以伊沖突背后原因與影響

國際在線
2025-06-13 21:56:22
心理學上有一個詞叫:塞利格曼效應(讓你一輩子碌碌無為,一事無成的惡魔)

心理學上有一個詞叫:塞利格曼效應(讓你一輩子碌碌無為,一事無成的惡魔)

德魯克博雅管理
2025-06-14 17:01:08
陳震體驗7座特斯拉Model Y哭笑不得

陳震體驗7座特斯拉Model Y哭笑不得

鞭牛士
2025-06-14 11:28:21
企業紛紛逃離,珠江新城不行了?

企業紛紛逃離,珠江新城不行了?

樓市前線
2025-06-14 14:59:35
東部戰區:若武統臺灣,不會斬首賴清德,只因一個極其重要的原因

東部戰區:若武統臺灣,不會斬首賴清德,只因一個極其重要的原因

混沌錄
2025-06-13 21:04:24
靈活就業人員大量斷保,應該引起足夠的重視!

靈活就業人員大量斷保,應該引起足夠的重視!

逍遙論經
2025-06-14 10:46:35
以色列發動了第5輪對伊朗空襲,伊朗也不忍了,終于“硬氣”了

以色列發動了第5輪對伊朗空襲,伊朗也不忍了,終于“硬氣”了

爆笑大聰明阿衿
2025-06-15 02:30:39
12歲朝鮮第一千金陪同老爸登上驅逐艦!白色套裝配大卷發,好美啊

12歲朝鮮第一千金陪同老爸登上驅逐艦!白色套裝配大卷發,好美啊

時尚麗人風行
2025-06-14 11:34:20
“這不是蘿卜坑我公開道歉”,招聘年齡僅放寬1歲,圈內人卻看懂了

“這不是蘿卜坑我公開道歉”,招聘年齡僅放寬1歲,圈內人卻看懂了

熙熙說教
2025-06-13 19:10:39
蒙托利沃:加圖索不值得我尊敬,但仍祝愿其國家隊執教順利

蒙托利沃:加圖索不值得我尊敬,但仍祝愿其國家隊執教順利

懂球帝
2025-06-14 17:48:31
特朗普受邀訪華1天后,馬斯克父親突然出山,給兒子留下特殊囑托

特朗普受邀訪華1天后,馬斯克父親突然出山,給兒子留下特殊囑托

紅色鑒史官
2025-06-13 19:10:03
“誰叫你是事業單位的?”女孩考公上岸卻無法蓋章,眼淚惹人心疼

“誰叫你是事業單位的?”女孩考公上岸卻無法蓋章,眼淚惹人心疼

熙熙說教
2025-06-14 20:20:08
印航空難唯一幸存者:恢復意識后發現仍被安全帶固定在座位上,剛從裂口爬出就聽見爆炸

印航空難唯一幸存者:恢復意識后發現仍被安全帶固定在座位上,剛從裂口爬出就聽見爆炸

紅星新聞
2025-06-14 21:14:15
普京給伊總統打去電話,態度很明確,俄不會給伊朗提供實質性幫助

普京給伊總統打去電話,態度很明確,俄不會給伊朗提供實質性幫助

掌青說歷史
2025-06-14 10:59:57
6月14日俄烏最新:俄羅斯又丟掉了一大籌碼

6月14日俄烏最新:俄羅斯又丟掉了一大籌碼

西樓飲月
2025-06-14 21:05:03
2025-06-15 04:15:00
量子位 incentive-icons
量子位
追蹤人工智能動態
10666文章數 176166關注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業陪葬?

頭條要聞

以防長威脅哈梅內伊:若繼續發射導彈 德黑蘭將成火海

頭條要聞

以防長威脅哈梅內伊:若繼續發射導彈 德黑蘭將成火海

體育要聞

約戰天王山,步行者G4輸在了哪?

娛樂要聞

小S迎47歲生日,首個生日沒大S陪伴

財經要聞

樓市權威發聲

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

藝術
時尚
本地
數碼
親子

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

中年女人少穿黑色和灰色,年輕色穿出減齡效果,看起來嫩十歲

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

數碼要聞

黃仁勛親筆簽名版 RTX 5090 鍍金顯卡以 24200 美元達成慈善拍賣

親子要聞

給18個月幼兒灌酒,無論出于什么心態都不該寬?。戮﹫罂煸u

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久国产精品成人影院| 乱亲女h秽乱长久久久| 国产成人av一区二区三区无码| 精品国精品无码自拍自在线| 国产尤物精品视频| 中国丰满熟妇xxxx性| 成人国产精品一区二区网站| 狠狠色丁香久久婷婷综合蜜芽五月| 亚洲人成77777在线播放网站不卡| 夜夜澡天天碰人人爱av| 9999国产精品欧美久久久久久| 日本三级片网站| 精品久久久久久久久久久aⅴ| 日韩网红少妇无码视频香港| 狠狠亚洲婷婷综合色香五月| 成人无码午夜在线观看| 性色av免费观看| 久久天堂av综合合色| 国产午夜精品理论片小yo奈| 亚洲精品亚洲人成在线| 国产av久久人人澡人人爱| 国产精品无码一本二本三本色| 激情综合五月| 无码人妻丰满熟妇区bbbbxxxx| 亚洲人成网线在线播放va| 国产亚洲精品久久久久久无亚洲| 国产精品制服丝袜第一页| 欧美精品黑人粗大视频| 国産精品久久久久久久| 久久久橹橹橹久久久久高清| 欧美日本日韩aⅴ在线视频| 国产一在线精品一区在线观看| 特级aaaaaaaaa毛片免费视频| 亚洲性夜夜摸人人天天| 黑人猛挺进小莹的体内视频| 99久无码中文字幕一本久道| 野外做受三级视频| 久久人人97超碰精品| 国产精品亚洲а∨无码播放麻豆| 酒店大战丝袜高跟鞋人妻| 国产一区二区三区在线视頻|