在今日舉行的ADVANCING AI 2025大會(huì)上,AMD正式發(fā)布了CDNA 4架構(gòu)、Instinct MI350系列GPU、ROCm 7平臺(tái)以及Pensando Pollara 400 AI NIC網(wǎng)卡,配合其第5代EPYC系列處理器,真正實(shí)現(xiàn)了從硬件到軟件的完整生態(tài)系統(tǒng),在構(gòu)建開(kāi)放、靈活、可擴(kuò)展且高性價(jià)比AI基礎(chǔ)設(shè)施的道路上邁出了重要的一步,詳細(xì)信息可瀏覽我們更早一些時(shí)候發(fā)布的內(nèi)容。當(dāng)然AMD在大會(huì)上的重磅信息可不僅有這些,在AI平臺(tái)生態(tài)系統(tǒng)中的占有重要地位的UALink也是此次大會(huì)的重點(diǎn)之一,后續(xù)更有重磅產(chǎn)品登場(chǎng)。
UALink全稱為Ultra Accelerator Link,其作用是讓計(jì)算集群內(nèi)所有接入的GPU所附帶的顯存,實(shí)現(xiàn)相互之間的直接加載和存儲(chǔ),提升共同完成大規(guī)模計(jì)算任務(wù)的效率,與之作用最為接近,同時(shí)也作為直接競(jìng)爭(zhēng)對(duì)手的就是NVLink。在今年4月份UALink 1.0規(guī)范正式發(fā)布,這宣告UALink正式進(jìn)入了實(shí)用化階段。隨后NVIDIA則推出了NVLink Fusion授權(quán)并以此向AMD進(jìn)行還招。因此這次ADVANCING AI 2025大會(huì)上,AMD以三個(gè)“Any”著重介紹了UALink,此舉可視為對(duì)NVLink Fusion的有力回應(yīng)。
三個(gè)“Any”分別對(duì)應(yīng)任意CPU、任意加速器和任意交換器,這意味著UALink有很強(qiáng)的硬件兼容性,事實(shí)上Ultra Accelerator Link聯(lián)盟的成員中不乏AMD在AI領(lǐng)域的直接競(jìng)爭(zhēng)對(duì)手,例如英特爾、博通、思科等廠商,相比之下NVLink Fusion授權(quán)仍然是圍繞著NVIDIA的生態(tài)系統(tǒng)展開(kāi),在開(kāi)放性上UALink要更勝一籌。
AMD直接用UALink與NVLink Fusion進(jìn)行了對(duì)比,可以看到在兩者都能有效降低底層數(shù)據(jù)的傳輸延遲,高速I(mǎi)/O接口的速率也都是同一水平為224Gbps,不過(guò)UALink支持多達(dá)1024個(gè)GPU,幾乎是對(duì)手的翻倍,而且對(duì)于CPU與GPU的使用基本沒(méi)有限制,軟件以及規(guī)范也都是持開(kāi)放的態(tài)度;NVLink Fusion則只圍繞自家產(chǎn)品展開(kāi),整體為封閉式的生態(tài)環(huán)境。因此AMD認(rèn)為,從發(fā)展前景來(lái)看,規(guī)格更好而且生態(tài)環(huán)境更為開(kāi)放的UALink更適合規(guī)模化AI系統(tǒng)的組建與擴(kuò)展。
AMD Instinct MI350系列GPU相比前代產(chǎn)品有明顯的性能提升,然而與計(jì)劃在明年登場(chǎng)的新品相比,Instinct MI350系列反而是顯得有些“小打小鬧”。AMD對(duì)于Instinct系列GPU的下一代產(chǎn)品MI400系列賦予了極高的期望值,其相比MI355X在AI運(yùn)算性能上將有堪稱是質(zhì)變級(jí)的提升。
基于Instinct MI400系列GPU打造的AI機(jī)架系統(tǒng)代號(hào)為“Helios”,其主要組成部分包括有EPYC系列處理器、Instinct系列GPU、Pensando系列網(wǎng)卡以及AMD ROCm平臺(tái),仍然以開(kāi)放式生態(tài)系統(tǒng)作為自身特點(diǎn),UALink以及UEC超以太網(wǎng)絡(luò)等自然也是標(biāo)配,按照計(jì)劃這套系統(tǒng)將在2026年登場(chǎng)。
代號(hào)為“Helios”的新一代AI機(jī)架系統(tǒng)不僅僅采用Instinct MI400系列GPU,其CPU也會(huì)升級(jí)為代號(hào)“Venice”的新一代EPYC處理器,基于2nm制程工藝與Zen 6架構(gòu)打造,最高可實(shí)現(xiàn)256核心,CPU到GPU的帶寬翻倍,內(nèi)存帶寬可達(dá)1.6TB/s,代際性能提升可以達(dá)到70%的幅度,即為前代產(chǎn)品的1.7倍。
Instinct MI400系列GPU將提供40PF/20PF級(jí)別的FP4/FP8運(yùn)算能力,配置432GB容量的HBM4顯存,顯存數(shù)據(jù)帶寬可達(dá)19.6TB/s,每GPU的橫向陣列帶寬可達(dá)300GB/s,號(hào)稱可以實(shí)現(xiàn)10倍于Instinct MI355X的AI推理運(yùn)算能力。
Pensando網(wǎng)卡也會(huì)在2026年迎來(lái)升級(jí),代號(hào)為“Vulcano”的新品仍然基于UEC超以太網(wǎng)絡(luò)規(guī)范打造,節(jié)點(diǎn)工藝為3nm,網(wǎng)絡(luò)吞吐能力可以達(dá)到800G級(jí)別,為每個(gè)GPU提供的橫向陣列帶寬可以達(dá)到當(dāng)代產(chǎn)品的8倍,仍然使用UALink與PCIe接口。
AMD進(jìn)一步放出了“Helios”與對(duì)手下代產(chǎn)品Vera Rubin的對(duì)比,并表示“Helios”將在HBM4顯存總?cè)萘俊?nèi)存帶寬、橫向陣列帶寬等規(guī)格上達(dá)到對(duì)手1.5倍,有更強(qiáng)的競(jìng)爭(zhēng)優(yōu)勢(shì)。
同時(shí)在2027年,AMD的AI機(jī)架系統(tǒng)方案將進(jìn)一步升級(jí),搭載代號(hào)為“VERANO”的新一代EPYC處理器與MI500系列GPU,網(wǎng)卡則繼續(xù)沿用“VULCANO”,但更多的詳細(xì)信息,仍然需要一些時(shí)間才能逐步揭曉。
按照AMD的計(jì)劃,目前Instinct MI350系列GPU已經(jīng)進(jìn)入規(guī)模化生產(chǎn),最終的AI系統(tǒng)成品則會(huì)在今年第三季度上市,ROCm 7軟件平臺(tái)則計(jì)劃在今年8月份正式推出,在今年7月份我們還會(huì)看到新一代的線程撕裂者Threadripper處理器與Radeon AI產(chǎn)品,而面向開(kāi)發(fā)者的Developer Cloud則已經(jīng)正式上線。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.