網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

干掉“CPU霸權”，華為正式推出昇騰超節(jié)點技術

2025-05-26 12:37:19　來源: 互聯(lián)魚

甘肅舉報

分享至

當有些科技巨頭還在為“千卡級”AI集群爭得頭破血流時，5月25日，華為正式推出“昇騰超節(jié)點技術”，單集群384張AI加速卡互聯(lián)，通信帶寬暴漲15倍，時延驟降10倍。

這組數(shù)據(jù)放在任何科技媒體頭條都足夠炸裂。

384張卡“擰成一股繩”，華為在造什么“怪物”？

想象一下，384臺高性能AI加速卡同時工作是什么概念？傳統(tǒng)數(shù)據(jù)中心里，這些芯片往往分散在不同機柜，靠網(wǎng)線“隔空喊話”，數(shù)據(jù)跑個來回堪比跨省快遞。

而華為的解決方案堪稱暴力美學：把12個計算柜、4個總線柜拼成一臺“超級計算機”——計算柜是流水線上的車間，總線柜是傳送帶，數(shù)據(jù)不用出廠房就能完成全流程加工。

更恐怖的是，這還只是起點。華為工程師輕描淡寫地透露：這套架構能擴展到“數(shù)萬卡”規(guī)模。按這個路線，未來訓練GPT-5級大模型，就能開機即用，根本不用糾結“算力夠不夠”。

昇騰超節(jié)點技術干掉“CPU霸權”，華為在顛覆70年老傳統(tǒng)？

傳統(tǒng)架構里，CPU是霸道總裁，GPU、內(nèi)存等部件想溝通？先寫郵件等審批（數(shù)據(jù)經(jīng)總線中轉(zhuǎn)），效率很低。而華為的對等計算架構，相當于給每個部門（計算單元）發(fā)了工作群：數(shù)據(jù)直接點對點傳輸，CPU靠邊站。

這種設計有多反常識？舉個例子：原本AI訓練時，GPU算完數(shù)據(jù)要等CPU調(diào)度才能傳給下一張卡，現(xiàn)在GPU們自己拉了個群聊，帶寬從自行車道（以太網(wǎng)）升級成高鐵（高速總線），時延從2微秒降到200納秒——這速度，比你眨一下眼皮（300毫秒）快了一百萬倍。

所以這項技術背后，是干掉“CPU霸權”的節(jié)奏。

首先是打破英偉達壟斷：當老黃用NVLink和InfiniBand捆住高端AI算力市場時，華為直接用自研總線技術撕開缺口——“你們的互聯(lián)方案，該升級了”。

其次是給國產(chǎn)AI生態(tài)喂“興奮劑”：大模型訓練最大的痛點不是單卡算力，而是萬卡協(xié)作效率。昇騰超節(jié)點等于給國產(chǎn)AI公司發(fā)了外掛：同樣的算法，在我這兒跑得更快。

最后則是為6G時代埋彩蛋：未來AR眼鏡、自動駕駛需要的實時AI，拼的就是低時延。華為這套架構，簡直是為下一代終端量身定制。

因此綜合來說，華為這次亮劍，推出昇騰超節(jié)點技術說明，AI競賽不再是“堆芯片數(shù)量”，而是“拼系統(tǒng)級創(chuàng)新”。當別人還在琢磨怎么多塞幾張卡進機柜時，華為已經(jīng)用高速總線把整個機房變成了一臺“計算機”。

聲明：個人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.