當有些科技巨頭還在為“千卡級”AI集群爭得頭破血流時,5月25日,華為正式推出“昇騰超節(jié)點技術”,單集群384張AI加速卡互聯(lián),通信帶寬暴漲15倍,時延驟降10倍。
這組數(shù)據(jù)放在任何科技媒體頭條都足夠炸裂。
384張卡“擰成一股繩”,華為在造什么“怪物”?
想象一下,384臺高性能AI加速卡同時工作是什么概念?傳統(tǒng)數(shù)據(jù)中心里,這些芯片往往分散在不同機柜,靠網(wǎng)線“隔空喊話”,數(shù)據(jù)跑個來回堪比跨省快遞。
而華為的解決方案堪稱暴力美學:把12個計算柜、4個總線柜拼成一臺“超級計算機”——計算柜是流水線上的車間,總線柜是傳送帶,數(shù)據(jù)不用出廠房就能完成全流程加工。
更恐怖的是,這還只是起點。華為工程師輕描淡寫地透露:這套架構能擴展到“數(shù)萬卡”規(guī)模。按這個路線,未來訓練GPT-5級大模型,就能開機即用,根本不用糾結“算力夠不夠”。
昇騰超節(jié)點技術干掉“CPU霸權”,華為在顛覆70年老傳統(tǒng)?
傳統(tǒng)架構里,CPU是霸道總裁,GPU、內(nèi)存等部件想溝通?先寫郵件等審批(數(shù)據(jù)經(jīng)總線中轉(zhuǎn)),效率很低。而華為的對等計算架構,相當于給每個部門(計算單元)發(fā)了工作群:數(shù)據(jù)直接點對點傳輸,CPU靠邊站。
這種設計有多反常識?舉個例子:原本AI訓練時,GPU算完數(shù)據(jù)要等CPU調(diào)度才能傳給下一張卡,現(xiàn)在GPU們自己拉了個群聊,帶寬從自行車道(以太網(wǎng))升級成高鐵(高速總線),時延從2微秒降到200納秒——這速度,比你眨一下眼皮(300毫秒)快了一百萬倍。
所以這項技術背后,是干掉“CPU霸權”的節(jié)奏。
首先是打破英偉達壟斷:當老黃用NVLink和InfiniBand捆住高端AI算力市場時,華為直接用自研總線技術撕開缺口——“你們的互聯(lián)方案,該升級了”。
其次是給國產(chǎn)AI生態(tài)喂“興奮劑”:大模型訓練最大的痛點不是單卡算力,而是萬卡協(xié)作效率。昇騰超節(jié)點等于給國產(chǎn)AI公司發(fā)了外掛:同樣的算法,在我這兒跑得更快。
最后則是為6G時代埋彩蛋:未來AR眼鏡、自動駕駛需要的實時AI,拼的就是低時延。華為這套架構,簡直是為下一代終端量身定制。
因此綜合來說,華為這次亮劍,推出昇騰超節(jié)點技術說明,AI競賽不再是“堆芯片數(shù)量”,而是“拼系統(tǒng)級創(chuàng)新”。當別人還在琢磨怎么多塞幾張卡進機柜時,華為已經(jīng)用高速總線把整個機房變成了一臺“計算機”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.