【中關村在線原創行業評論】開發工具,對于一個行業的發展至關重要。無論是對于硬件廠商還是開發者都是如此,優秀的開發工具更好地賦能開發者,從而幫助軟件與硬件實現更好的兼容性與更加便捷、高效的體驗。因此,在全行業邁入AI時代之后,AMD這些領軍者們不僅為開發者提供了性能強大的AI硬件,同時還為其帶來了配套的開發工具。ROCm,就是AMD與開源社區攜手,為推動AI發展而推出的強力工具之一。
·AMD推出全新的ROCm 7
在剛剛舉辦的AMD ADVANCING AI 2025峰會上,AMD發布了最新的ROCm 7,旨在通過大幅提升性能、分布式推理、企業解決方案以及在Radeon和Windows上的更廣泛支持,與開源社區攜手共同驅動AI行業進一步發展。
同時,AMD為開發者提供了開發者云服務,它允許開發者即時、無硬件限制地訪問最新發布的Instinct MI350系列GPU,配備預配置環境和免費試用額度,幫助開發者們實現無縫AI開發和部署。
AMD打造ROCm 7以及AMD開發者云的核心理念是堅持“開發者至上”,因此無論是首次探索AI大語言模型的研究者、調整下一代注意力機制的研究人員,還是推動超大規模生產工作負載的研發團隊,AMD都在通過ROCm 7以及AMD開發者云服務,使得這些研究者、開發者們的工作更加輕松、更加高效快捷。
而且伴隨著AMD AI生態系統的不斷擴展,ROCm已經被越來越多開發者所廣泛采用。ROCm無處不在,促進了可擴展、開放式的AI創新。
ROCm 7旨在從算法到基礎設施的每一層級來為AI創新提速,也為軟件棧重新帶來真正的競爭力和開放性。ROCm 7能夠滿足生成式AI和高性能計算(HPC)工作負載不斷增長的需求,同時通過易用性、高效性以及充滿活力的社區合作來改善開發者體驗。全新的ROCm 7將于2025年第三季度正式上市。
·ROCm 7新特性解析
接下來我們看看ROCm 7具備哪些全新特性:
首先,ROCm 7在性能方面實現了飛躍。與ROCm 6相比,其推理能力提升超過3.5倍,訓練能力提升3倍。這一成就得益于可用性、性能以及對FP4和FP6等低精度數據類型的支持。而且通信堆棧的進一步優化提高了GPU利用率和數據傳輸效率。
其次,ROCm 7引入了強大的分布式推理方法,與開源生態系統,如SGLang、vLLM和llm-d等框架合作。借助開放策略,ROCm 7與這些行業合作伙伴緊密合作,共同開發共享接口和原始數據,以在AMD硬件平臺上實現更加高效的分布式推理能力。
其三,ROCm Enterprise AI首次亮相,這意味著ROCm 7成為企業AI的專業解決方案?。作為一個穩健的MLOps平臺,ROCm 7旨在實現企業環境中的無縫AI運營。它包括用于使用行業特定數據進行模型微調和與結構和非結構化工作流集成的工具,并通過生態系統內的合作伙伴關系來促進開發聊天機器人和文檔摘要等參考應用,進而將AI真正賦能到企業用戶的日常工作流中,提升企業辦公效率。
此外,ROCm 7進一步優化了其在AMD Radeon以及Windows上的應用?體驗。ROCm 7將體驗擴展到云端之外,支持在各類Ryzen筆記本電腦和工作站上進行開發,實現從云端到客戶端的持續創新。預計從2025年下半年開始,ROCm將出現在主流市售產品中,并助力Windows成為受支持的一流操作系統,確保家庭和企業環境中的可移植性和效率。
·AMD開發者云亮點?解讀
?與ROCm 7一同而來的,還有AMD開發者云服務。它具備以下幾大亮點屬性:
其一,零設置環境?:允許開發者即時啟動基于云的Jupyter Notebook,無需安裝。使用GitHub或電子郵件地址即可輕松設置。
其二,支持預安裝的Docker容器和出色的靈活性?:AMD開發者云預加載了流行AI軟件的Docker容器,最大限度地減少了設置時間,同時為開發者提供了自定義代碼以滿足其特定需求的靈活性。
其三,在Day-0生態的Instinct MI350系列GPU系統?,包括vVLLM、SGLang、HAO AI lab、Stanford AI Lab,支持PyTorch和Triton CL?等。
其四,擁有多元化的可擴展計算選項,如小型化的1x MI300X GPU(192GB GPU內存)以及大型的8×MI300X GPU(1536GB GPU內存)
其五,為開發者提供免費額度?:開發者可申請25小時的免費云使用時長,通過ROCm星級開發者證書等項目則可額外獲得高達50小時的使用時長。
因此無論是微調LLM、基準測試推理性能還是構建可擴展的推理堆棧,AMD開發者云都為開發者們提供了即時開始的工具和靈活性,讓開發者在不受限制的環境中釋放生產力。因此,AMD開發者云的獨特之處不僅在于其基礎設施,更在于支持并隨其擴展的頗具活力的生態系統。
此前,ROCm生態合作伙伴已經涵蓋了Meta?、微軟、紅帽、OpenAI、Midjourney以及Hugging Face?等各個領域的客戶,這種深入合作確保了開發者能夠訪問一流的工具、享受持續的性能改進以及一個開放的迭代和快速部署環境,從基礎上提升了開發者的體驗。
因此,AMD開發者云與ROCm有著相輔相成的協同作用,且已向全球開發者和開源社區廣泛開放。這個完全托管的環境提供了即時訪問AMD Instinct MI300X GPU的能力,無需硬件投資或本地設置。
·結語
過去一年中,AMD專注于增強關鍵模型和框架下的推理和訓練能力,并積極擴拓寬客戶基礎。對開發者的支持使AMD實現了開箱即用能力的提升、設置流程的簡化以及社區參與的增強。因此,AMD的客戶正以前所未有的速度部署AI能力,促使其發布節奏提速,不斷推出新功能。
目前,Llama 4、Gemma 3以及DeepSeek等行業領先的大模型均已實現支持,AMD也與開源社區保持愈發緊密的合作,并致力于打造一個開放且富有創新性的AI生態系統。
同時這些與生態伙伴的深入合作也表明,AMD開發者云不僅僅是一個計算平臺,更是下一代AI創新的發射臺。從企業采用到開源實驗,不斷增長的AMD合作伙伴網絡正在積極塑造每個云用戶可用的工具和服務。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.