IT之家 6 月 13 日消息,AMD 在今年 4 月推出了 Pensando Pollara 400 NIC 網(wǎng)口,這也是首款兼容 Ultra Ethernet Consortium(IT之家注:即超以太網(wǎng)聯(lián)盟 UEC)規(guī)范的 400GbE網(wǎng)卡產(chǎn)品。
在今日的“Advancing AI”活動中,AMD 宣布 Pensando Pollara 已進入部署階段。同期,UEC 聯(lián)盟發(fā)布面向超大規(guī)模 AI 與 HPC 數(shù)據(jù)中心的技術(shù)規(guī)范 1.0 版本,該技術(shù)生態(tài)正式邁入落地階段。
AMD 表示,甲骨文(Oracle)云基礎(chǔ)設(shè)施(OCI)成為首批部署該網(wǎng)卡的超大規(guī)模云服務(wù)商,其還將同步采用 AMD Instinct MI350X 系列 GPU。
按規(guī)劃,這些硬件今年下半年起在 OCI 大規(guī)模落地,Oracle 擬以此構(gòu)建規(guī)模達 131,072 塊 Instinct MI355X 的澤字節(jié)級 AI 集群,支撐客戶開展大規(guī)模 AI 訓(xùn)練與推理。
據(jù)介紹,Pensando Pollara 400GbE 網(wǎng)卡專為超大規(guī)模場景(支持百萬級 AI 處理器或 GPU 互聯(lián))設(shè)計,核心亮點包括:
- 性能表現(xiàn):RDMA 性能較 NVIDIA CX7 高 10%、較 Broadcom Thor2 高 20%;結(jié)合 Ultra Ethernet 1.0 規(guī)范的智能負載均衡、選擇性重傳、路徑感知擁塞控制,RDMA 性能較傳統(tǒng) RoCEv2 再提升 25%,AI 負載處理效率最高達 6 倍提升。
- 智能調(diào)度:基于自研專用處理器與可定制硬件,實現(xiàn)數(shù)據(jù)流智能拆分與動態(tài)路由,規(guī)避網(wǎng)絡(luò)瓶頸,保障大規(guī)模 GPU 集群吞吐量穩(wěn)定。
- 高可靠性:搭載故障轉(zhuǎn)移技術(shù),可快速檢測并繞開故障連接,在數(shù)萬加速器互聯(lián)場景下維持低延遲與高集群利用率。
AMD 表示,除甲骨文外,其他規(guī)劃大規(guī)模 Instinct GPU 部署的企業(yè)也將快速跟進,推動 Ultra Ethernet 硬件生態(tài)普及。目前該網(wǎng)卡已向意向客戶啟動交付。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.