【中關村在線原創行業評論】當前以及未來很長一段時間里,人工智能都將以前所未有的發展速度改變著人類社會的生活、工作、娛樂方式,從普通智能設備上的AI智能體到基于AI的自動駕駛,從醫療行業的AI診斷到金融領域的風險預測,從傳統企業的AI數智化轉型到現代化工廠里無處不在的智能制造,AI已經深入融合到人類社會發展歷程中的各個角落。也正是因為如此,龐大數據量所引發的算力需求指數級增長,無時無刻不在對傳統硬件領域發起挑戰。
在這一背景之下,AMD等與AI行業緊密相關的半導體芯片公司,相繼開始了為AI應用提供強大算力支持的新架構、新技術研發。就在剛剛舉辦的AMD ADVANCING 2025峰會上,AMD展示了全新的CDNA 4架構Instinct MI350系列GPU,預先公布了下一代Instinct MI400系列GPU,并且發布了全新的ROCm 7,正式推出了業界首款專注于AI領域的智能網卡設備AMD Pensando Pollara 400 AI NIC,同時還公布了以AMD EPYC為核心,基于Instinct MI350系列GPU以及Pollara 400 AI NIC打造的AI機架解決方案。
這也標志著AMD能夠為行業帶來全棧式的高算力AI計算解決方案。
·AI計算對核心硬件提出了更高要求
縱觀近年來AI領域的高速發展,不難發現AI計算與傳統計算領域有著天壤之別。AI大模型在訓練和推理方面需要處理海量數據,并執行復雜的多元化計算任務,這對CPU、GPU、內存等核心硬件提出了更高要求。同時,如何為企業用戶提供更加經濟性的解決方案,也成為擺在面前的亟需解決的問題。
AMD EPYC處理器在這方面有著天然優勢,強大的多核心、多線程能力,出色的能效表現以及卓越的TCO,使其能夠輕松勝任各種高算力計算任務,配合AMD Instinct系列GPU可以顯著提高AI訓練和推理效率。
在AI模型訓練中,CPU主要承擔數據預處理、模型評估等相對較小數據集或相對簡單的計算任務。此時,具有更高頻率和更高能效比的處理器就能夠更為高效地執行并完成這些任務。同時,AI大模型訓練與推理并非一蹴而就,往往需要持續性地長時間工作,因此需要CPU這樣的核心硬件具備出色的穩定性,并具備與 GPU、NPU、TPU等AI計算單元的協同工作能力,進而實現性能與能效之間的完美平衡。
·Zen 4/Zen 5架構EPYC實現底層架構層面的AI計算優化
AMD EPYC處理器之所以能夠勝任當今越來越復雜的AI計算任務需求,可以說是從底層架構層面就打下了堅實基礎。通過在Zen核心、Chiplet設計、指令集優化以及協同性設計等多個方面的不斷革新與演進,充分適配了AI時代的硬件升級。
以Zen架構核心為例,第四代AMD EPYC所采用的Zen 4架構就開始展現出了顯著的AI適應性。其憑借96核心單處理器設計,在整個業界實現了性能與能效方面的領先。與上一代產品相比,它能夠提供高達2.8倍的性能提升,并減少多達54%的能耗。此外,它還能夠提供完整的軟硬件生態系統支持,能夠更好地承載虛擬化、AI/ML、HPC等多種工作負載。對于AI計算尤為重要的一點是,第四代AMD EPYC處理器引入了對AI/ML應用程序至關重要的DDR5內存和PCIe 5.0高速通道。大內存、高帶寬設計使其在參與AI模型訓練和推理任務時能夠提供足夠出色的性能支持。此外別忘了,AMD 3D V-Cache技術的加持,進一步增強了第四代AMD EPYC處理器的多任務執行能力,并有效降低延遲。
而最新的第五代EPYC處理器則基于全新的AMD Zen 5架構打造。得益于在Zen 4節點的積累,Zen 5架構進一步強化了AI和HPC計算能力,不僅能夠提供多達17%的IPC性能提升,還帶來了更強悍的AI計算能力。例如基于64核心EPYC 9575F處理器打造的1000個節點組成的AI集群,其每秒可處理高達70萬個推理令牌(Reasoning Tokens),極大地提高了處理效率;而得益于超高吞吐量優勢,192核心的EPYC 9965處理器可為包括TPCx-AI(衍生)在內的端到端AI工作負載提供更高性能,為企業用戶帶來高效的大語言模型推理能力,助力其輕松部署DeepSeek R1、Llama等常見的本地化AI大模型,優化自身工作流,為企業辦公提速。
·Chiplet設計助力AMD EPYC提供更加靈活的算力需求
除了架構優勢之外,AMD EPYC處理器設計層面另一大亮點自然是采用了先進的Chiplet設計。通過將不同功能的芯片模塊封裝集成在一起,這種設計不僅提高了生產效率,降低了成本,還能根據不同的應用需求靈活組合芯片模塊,實現更高性能和能效的同時,甚至可以滿足定制化需求。
在當今的AI應用中,Chiplet設計使得處理器能夠更好地滿足對計算能力和內存帶寬的高要求。例如在處理大規模AI模型訓練時,通過合理配置不同的芯片模塊,可以實現計算核心與內存之間的高效數據傳輸,避免數據傳輸瓶頸對性能造成影響,進而大大提高了AI訓練、推理的效率。
·先進指令集與協同計算讓EPYC直面AI時代的挑戰
當然,先進指令集也是AMD EPYC處理器AI性能提升的關鍵要素。AMD通過不斷優化指令集,使其能夠更好地支持AI計算中的各種復雜運算,如AI計算中常見的矩陣計算、向量計算、卷積運算等方面,AMD EPYC處理器的指令集都有專門的、針對性的優化,幫助處理器在單個指令周期內處理更多的數據,顯著提高計算效率以及大模型的訓練和推理性能。
此外,AI時代對于硬件的挑戰不僅來自于對單個硬件的算力需求,如何將CPU、GPU、NPU等各種計算單元有機結合在一起,充分發揮其協同計算能力,可以說是擺在每一個半導體芯片公司面前的問題。
AMD EPYC處理器無疑在這方面有著獨特優勢。通過優化硬件接口、提高帶寬速率以及不斷進化的通信協議,AMD EPYC處理器能夠與GPU等硬件之間實現高速數據傳輸,以確保在AI任務執行過程中與不同硬件之間實現無縫協作,充分調度并發揮各自優勢,更加高效地應對復雜的AI計算任務。比如在深度學習訓練中,GPU負責處理大規模的并行計算任務,而CPU則負責數據預處理、任務調度等工作。AMD EPYC處理器與GPU之間的高效協同,能夠使整個訓練過程更加流暢,因此效率也更高。再比如在DeepSeek等大預言模型推理任務中,GPU事實上也并非是“唯一解”。負責執行各種程序指令,處理各種邏輯和算法的CPU,在這類AI計算中會發揮極大作用。更多的核心數、更高的內存帶寬、更大的緩存容量以及軟件生態層面的優化,可以助力其在相同功耗下實現更大幅度地性能提升。
當然,AI訓練、推理之外,AMD EPYC處理器在智慧城市、工業物聯網、醫療、零售等邊緣AI場景中,同樣也有著得天獨厚的安全性與能效優勢。如專為零售、制造、電信等智能邊緣領域以及云服務、存儲等數據中心場景打造的AMD EPYC 8004系列處理器就極具典型性。這一單路平臺具備極為出色的高能效表現,它擁有最多64個Zen 4c核心,并支持6通道DDR5內存,設計小巧,非常適合空間、功率有限的部署環境。該系列針對云、電信網絡、零售和智能邊緣進行了性能優化,在低至70W的功耗范圍內實現了更好的性能釋放;同時該系列還通過了 NEBS(網絡設備構建系統)認證,運行更為安靜,適用場景極為廣泛。比如在工業物聯網中,通過在邊緣設備中部署AMD EPYC 8004系列處理器,能夠實時對生產數據進行分析和處理,實現設備的智能監控和故障預測,提高生產效率和產品質量。
·深度適配DeepSeek 推動AI普惠進程
今天,AI領域的飛速發展離不開DeepSeek等大模型的厚積薄發。它們的出現真正讓AI走出實驗室,落地到真正的生活化應用場景中。可以說,DeepSeek的出現加速了AI的普惠化進程,使得以更低成本實現最大化的性能與能效成為可能。
同時,第四代和第五代AMD EPYC處理器在與DeepSeek的技術與應用側協同上,進一步推動了AI普惠進程。基于AMD EPYC處理器的強大算力,結合DeepSeek的先進算法和推理能力,企業用戶可以實現對海量數據的快速處理與精準分析。在電商、醫療、金融、司法等等諸多領域遍地開花,推動了傳統領域的數智化轉型進程。
此外,在本次ADVANCING AI 2025峰會期間,AMD不僅推出了基于第五代EPYC處理器的AI機架解決方案,更公布了未來兩年基于AMD EPYC “VENICE”以及AMD EPYC “VERANO”處理器的下一代和下下代高性能AI機架解決方案,為未來AI行業的算力發展描繪了更加清晰的前景。
·結語
在可以預見的未來里,AI算力指數級持續增長已然是現代和未來社會科技發展的底層邏輯。因此,更加高效的算力支持與更低的能耗表現將成為未來半導體芯片競爭的主旋律。
在本次AI峰會主題演講中,Lisa Su博士談到了AMD在AI領域的三大戰略。為了實現AI的廣泛部署,事實上并沒有一種架構是“萬能鑰匙”,因此需要針對不同的使用案例選擇合適的計算架構。基于此,AMD堅持為行業提供一系列產品組合,以便其客戶可以將合適的計算設備與合適的大模型和AI用例相匹配;同時,AMD堅持擁抱開源生態,并加大投資力度,以實現對各類框架、庫、模型的支持,以開放標準賦予行業生態更強的凝聚力;此外,AMD堅持為AI領域提供全棧式解決方案,并積極與合作伙伴共同構建生態系統。從產品組合的角度來看,AMD提供了最完整的計算套件,包括CPU、GPU、DPU、NIC、FPGA以及自適應引擎等,無論AI在哪里運行或需要多少計算力,AMD都有合適的解決方案給到行業用戶與開發者。
此外,AMD EPYC處理器通過第四與第五兩代產品的積累與持續演進,為包含訓練、推理、邊緣部署在內的AI全棧應用提供了性能、能效與成本之間更為平衡的支持。而伴隨著AMD對于2026、2027年EPYC處理器的描摹,相信其在更加先進的架構基礎之上,會為用戶建立性能、能效更為出色的算力底座,并為AI領域的未來發展提供更加強大的動力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.