芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影
芯東西5月26日報道,在臺北國際電腦展COMPUTEX 2025前夕,Arm高級副總裁兼終端事業部總經理Chris Bergey發表主題演講,分享Arm生態系統如何推動下一波人工智能(AI)浪潮。目前,基于Arm架構的芯片出貨量已累計超過3100億顆,廣泛應用于消費電子設備、AI汽車以及AI優先的數據中心。
近日,Chris Bergey與芯東西等媒體進行深入交流。據他透露,Arm預計今年稍晚將推出新的Armv9旗艦CPU(代號Travis),同時下一代GPU(代號Drage)將提供更強性能。他告訴芯東西,Arm GPU重點聚焦邊緣側,針對物聯網和終端市場均有GPU產品,同時在汽車領域的GPU進行投入,目前尚未計劃對數據中心GPU進行投入。
Travis CPU將帶來雙位數的IPC性能提升,并將是第一代引入Armv9可伸縮矩陣擴展(Scalable Matrix Extension,SME)的處理器,可進一步加速處理AI工作負載。Drage GPU將能為長時間的游戲和更豐富的多媒體內容提供持續的性能支持。這兩款產品的結合將引入面向移動端市場的Arm Lumex CSS解決方案,為未來消費電子設備上的邊緣AI性能奠定基礎。
Arm已被中國生態系統視為手機高性能GPU的領先提供商,今年加入了Arm精銳超級分辨率技術(Arm ASR),使用戶能夠在移動設備上實現游戲主機級畫質和游戲體驗。
一、云側:預計今年近50%頭部云服務算力基于Arm架構
Arm已轉型為計算平臺公司,從云端到邊緣側等各個應用,在計算能效與能源效率方面展現領導地位。
在云端與數據中心方面,亞馬遜云科技(AWS)、谷歌、微軟等科技巨頭均在持續擴展搭載Arm計算平臺的自研數據中心芯片。
AWS曾分享,其超過90%的重要客戶(不包括亞馬遜)在用Arm先進架構。過去兩年,AWS新部署的CPU算力中,有超過50%是基于Arm技術的Graviton芯片。
Arm預計在2025年,出貨到頭部超大規模云服務提供商的算力中,有近50%是基于Arm架構。
這股動力,來自業界對Arm高效節能計算能力的強烈需求。相比其他平臺,頭部云服務提供商所采用的Arm架構芯片可實現高達40%的能效提升。
在COMPUTEX期間,NVIDIA也分享了基于Arm架構的NVIDIA Grace CPU的進展。該CPU在包括埃克森美孚、Meta等一系列的實際部署中,為要求苛刻的AI工作負載提供了性能和效率的提升。
Bergey強調說,數據中心的未來將是Arm計算與加速器的緊密耦合。這一趨勢在很大程度上建立于Arm生態系統之上。
二、邊緣側:預測今年PC和平板出貨量占比超40%
每瓦性能在邊緣設備中至關重要。
在去年的COMPUTEX展會上,Arm發布了專為消費電子設備打造的Arm終端計算子系統(CSS),作為旗艦AI智能手機與新一代AI PC的計算平臺。
Bergey告訴芯東西,Arm的大部分業務是向整個行業提供標準化產品和平臺解決方案,當前隨著AI快速演進,芯片設計變得越來越具有技術挑戰性,成本變高,產品上市時間愈發關鍵,此外因摩爾定律放緩,設計過程中對工藝的定制化需求也持續增長,這些驅使Arm推出CSS。
CSS仍屬于標準化產品,而非定制化業務。Arm可以為從云端、汽車到終端等不同細分市場的合作伙伴提供CSS,幫助合作伙伴有效提升性能、降低成本,并加快產品上市周期。
除了帶來兩位數的性能提升之外,終端CSS也為用戶帶來了實質性效益——應用程序啟動更快速、AI 體驗更流暢且更持久。
目前全球99%的智能手機都采用Arm架構,對性能、電池續航以及“始終在線(Always-on)”的需求也在不斷擴展到其他消費設備市場。
在中國手機市場,Arm正在為聯發科技等生態合作伙伴提供前沿CPU和GPU技術,這些合作伙伴正與眾多一線手機廠商攜手,將搭載Arm技術的優秀手機產品推向市場。
Armv9架構自四年前推出以來,已被全球多款最新的手機與PC采用,為這些設備帶來了更出色的AI性能。
對于移動終端設備而言,控制功耗是一個關鍵考量因素。IPC(每時鐘周期指令數)與頻率的乘積決定了整個平臺的性能。相較于單純依賴提高頻率來提升性能,提升IPC可以更高效地實現性能的增強,同時還能顯著改善能耗表現。
據Bergey分享,Arm堅信異構計算是未來的發展方向,目前大多數第三方應用都是在CPU上進行AI開發的,有70%會始終運行在CPU上,而不會遷移到GPU或NPU,也有不少應用借助GPU進行加速。
如今AI PC的設計正越來越接近現代智能手機的形態——輕薄的尺寸、無風扇的設計、全天候的電池續航能力、始終在線的效率,以及無論是視頻會議還是視頻流媒體,都能享受到卓越的多媒體體驗。
近年來,Arm架構在PC與平板市場的需求大幅成長,預估在2025年將占整體出貨量的40%以上。全球大多數主流的應用均已推出適用于Windows的Arm原生版本,帶來更快速、更強大的AI PC體驗,涵蓋聊天機器人、生產力工具等核心應用。
聯發科技近期推出的Kompanio Ultra SoC,更進一步提升了Chromebook市場的水平,讓新一代 Chromebook Plus 設備具備先進AI與多媒體能力。
此外,NVIDIA推出的DGX Spark個人AI超級計算機,將數據中心級別的計算能力帶到了桌面級產品。該產品搭載了基于Armv9架構CPU的Grace Blackwell超級芯片,具備支持2000億參數模型的AI計算能力。
在本屆COMPUTEX 上,NVIDIA宣布與宏碁、華碩、戴爾科技、技嘉、惠普、聯想和微星等全球領先系統制造商共同打造NVIDIA DGX Spark和DGX Station系統。
三、匯聚超2200萬名開發者,Kleidi軟件庫累計安裝超80億次
Bergey認為,構建AI系統有三個關鍵因素:
首先,從云端到邊緣打造一個無處不在的平臺將具有極大的價值,因為很多時候AI是在端側運行的,但在某些情況下,又希望能夠將工作負載轉移到云端。因此,擁有一個高度且可移植的平臺,對于推動先進技術及產品的實現,以及為現有產品增加新功能,都非常有價值。
二是電力和每瓦性能。AI極為耗電,數據中心能耗從兆瓦級(MW)躍升至吉瓦(GW)級,其中超過50%實際上來自于機架和半導體設備。“每瓦性能”將是關鍵衡量指標。
三是軟件。強大的軟件生態進一步催生了更多硬件的發展機會。
在Bergey看來,要在端側AI中兼顧算力與能效,芯片設計也有三個關鍵要素:一是內存帶寬,二是確保在平臺中集成強大、靈活性高的硬件,三是軟件。如果沒有成熟的軟件及其生態系統,要跟上所有行業標準和各種AI框架,將會是一項非常繁重且具有挑戰性的工作。
目前,Arm已有超過2200萬名開發者在Arm平臺上進行開發。Arm持續大力投資軟件,協助開發者在開發的過程中降低復雜度、并提高效率。
Bergey補充道,開發者僅需一次開發,就能在整個半導體生態系統中眾多采用Arm CPU的SoC上運行。
在去年的COMPUTEX上,Arm發布了Arm Kleidi軟件庫,讓開發者能在各種AI模型與工作負載上實時獲得最佳的性能表現。
Kleidi推出后僅一年,已整合至多個主流AI框架中,包括ExecuTorch、PyTorch、Angel、llama.cpp、MediaPipe、MNN以及ONNX Runtime。
迄今為止,Kleidi已在搭載Arm架構的設備上累計超過80億次安裝,且仍在持續增長中。
結語:AI轉型依賴持續創新
Bergey在COMPUTEX主題演講末尾強調,AI時代是一場千載難逢的機會,能夠重新定義科技如何影響世界。但要真正實現這項潛力,仍依賴持續創新,以及與Arm世界級生態系統的深度合作。
過去18個月內,有超過150個涵蓋語音、圖像、文字與視頻生成的基礎模型面世。原本只存在于云端的AI助理,如今也正優先在邊緣設備上開發,推動AI推理作業由云端轉向邊緣應用。
推理是AI實際運行并創造價值的環節,是真正驅動未來創新與商業價值的關鍵。AI agents也正快速增長,這些系統能夠獨立執行復雜任務、彼此協作,并在大規模下自動運行。這將成為物理AI的基礎,使AI從數字世界延伸至真實的物理環境,例如機器人。
據Bergey觀察,AI agents方面已經有一些非常有趣的應用場景和非常成功的商業項目或初創公司,兩個頗受關注的領域是AI編程和AI客服。物理AI也蘊藏著巨大機遇,一些機器人技術已經落地應用,接下來一到三年,機器人設備有望在自主模式下具備媲美人類操作的表現。
具備可擴展性且高效率的計算,在未來會變得更加重要。
從云端到邊緣,Arm的計算平臺正處于AI轉型的核心。Arm及其世界級生態系統持續在硬件與軟件領域不斷創新與投入,以實現下一波即將改變數十億人生活的AI浪潮。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.