芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影
芯東西5月19日報道,今日,英偉達創始人兼CEO黃仁勛發表臺北國際電腦展COMPUTEX 2025開幕演講,公布了英偉達制造過的“最大產品之一”——中國臺灣新辦公大樓NVIDIA Constellation,設在臺北的北投士林。
英偉達還宣布與鴻海、中國臺灣科技委員會、臺積電聯合打造AI基礎設施,為中國臺灣AI生態系統提供支持。
英偉達與富士康鴻海科技集團合作打造一臺巨型AI超級計算機,將采用英偉達GB300 NVL72機架式解決方案,搭載10000張英偉達Blackwell GPU。
臺灣科技委員會將利用AI超算,為中國臺灣科技生態系統提供AI云計算資源。臺積電研究人員計劃利用該系統推進其研發,性能比上一代系統將提高幾個數量級。
大型AI基礎設施建設,是今日演講的重頭戲。
黃仁勛穿著標志性的黑皮衣,一路小跑上臺,說今天他的爸爸媽媽也在觀眾席。
一大重磅發布是NVLink Fusion半定制AI基礎設施,向外部芯片敞開了允許接入英偉達NVLink機架式系統的大門。這意味著構建AI系統,不必全用英偉達的芯片產品,而是可以搭配使用其他企業的定制CPU和AI芯片。
富士通、高通都是其定制CPU合作伙伴。今日,高通宣布將開發定制數據中心CPU,可接入英偉達機架式架構,實現與英偉達GPU的快速通信。
黃仁勛還曬出美國AI數據中心項目“星際之門”的進展:超過4萬平方米,可擴展至1.2GW?!百I得越多,做到得越多!”黃仁勛說,這就是構建AI工廠的原因。
總體而言,黃仁勛重點分享了在AI工廠、AI agents、機器人技術等方面的最新進展。
他回顧了英偉達從GPU芯片到的AI基礎設施轉型歷程:2006年介紹CUDA并行計算軟件平臺和編程模型;2016年推出DGX-1超級計算機,被贈予首臺DGX-1的非營利性公司OpenAI開啟了AI新革命;2019年/2020年收購Mellanox,將整個數據中心轉換成一個計算單元。
“十年后回頭看,你會看見AI融入一切?!秉S仁勛說,就像互聯網,就像生產電力需要工廠,AI需要生成tokens的AI工廠。他預言AI基礎設施產業的市場規模將達到數萬億美元。
加速計算始于CUDA-X GPU加速庫,覆蓋、計算光刻、計算輔助工程、決策優化、數據科學與處理、深度學習、量子計算、天氣分析、醫藥影像等。這些庫讓開發者更易利用CUDA的功能并從英偉達平臺獲得高性能,從而加速應用。
臺積電、Cadence 、KLA、西門子、新思科技正在采用英偉達CUDA-X和Blackwell平臺推動芯片設計和制造的發展。
GeForce改變了AI,AI又反過來改變GeForce。英偉達Grace Blackwell由臺積電代工生產,反過來臺積電將采用Grace Blackwell來推進芯片制造。
在電信行業,英偉達與軟銀、T-Mobile、諾基亞、三星、富士通、思科等生態伙伴合作,基于AI構建6G;在量子計算領域,英偉達構建混合量子-GPU計算。
代理式AI(Agentic AI)基于“理解-思考-行動”循環,所需的計算量是單范例提示(One-Shot)的100倍~1000倍。物理AI是理解世界的AI,機器人革命的基石。通用機器人將開啟下一個萬億美元產業。
一、GB200全面投產,GB300今秋上市,詳解Blackwell芯片生產全流程
Grace Blackwell NVL72是一個集成了36張英偉達Grace CPU和72張Blackwell GPU的機架級系統,用于加速AI訓練和推理。
它展示了英偉達縱向擴展(Scale up)的能力,相當于“一顆巨型GPU”。
橫向擴展(Scale out)是指將計算機連在一起。黃仁勛說,Scale out很簡單,Scale up很難。構建更大的計算機超出半導體物理學的極限,而Grace Blackwell做到了。
GB200系統已全面投產。相同的體系結構、物理占用空間、電氣機械條件,將于今年第三季度可升級成GB300 Grace Blackwell芯片。
相比GB200,GB300的AI推理性能提高到1.5倍,還實現了1.5倍的HBM和2倍的網絡互連速率。
新系統一個節點的性能,就能匹敵2018年的整臺Sierra超級計算機(有18000張GPU),也就是6年內將性能提高4000倍。
Blackwell不僅是一個科技、工程奇跡,更是中國臺灣科技生態系統卓越成就的證明。從晶圓上蝕刻第一個晶體管,到銷緊Blackwell機架的最后一顆螺絲,每個步驟都承載著合作伙伴的貢獻。
它最初是臺積電的一片空白硅晶圓,在一片12英寸晶圓上,經歷數百道的晶圓處理和紫外光微影步驟,逐層構建2000億顆晶體管,晶圓被劃線切割成個別的Blackwell裸晶粒(die)。經過測試和分類,良品晶粒被挑選出來,進入后續制程。
在臺積電、矽品與艾克爾執行的CoWoS封裝中,32顆Blackwell晶粒與128組HBM堆疊,被接合在一片定制化硅中介層晶圓上。蝕刻在其中的金屬互連線,將Blackwell GPU與HBM堆疊連接到每個SIP單元中,最后加熱、模塑并固化,形成Blackwell B200超級芯片。
在京元電子,每顆Blackwell芯片都會在125攝氏度的烤箱中,進行數小時壓力測試。在鴻海,機器夜以繼日地將超過1萬個零部件精準地放置在Grace Blackwell PCB上。
同時,全球各地工廠也在準備其他零部件。酷碼、奇鋐、雙鴻、臺積電提供的定制化液冷銅制散熱器讓芯片保持最佳溫度。
在另一件鴻海廠房制造的ConnectX-7 SuperNIC用來實現橫向擴展的通信能力。加上BlueField-3 DPU來卸載并加速網絡、存儲等工作。
這些零部件精心得整合進GB200運算托盤。
英偉達NVLink是一項突破性高速互連技術,可連接多個GPU,擴展成一個巨大的虛擬GPU。NVLink交換機托盤由NVLink交換芯片構成,提供14.4TB/s的全互連帶寬。
NVLink主干形成了一個定制化的盲插背板,整合了5000條銅纜,提供130TB/s的全互連帶寬,這將所有72張Blackwell芯片(144顆GPU晶粒),連成了一個巨大的GPU。
從世界各地來的組件運抵鴻海、緯創、廣達、戴爾、華碩、技嘉、慧與、美超微及其他合作伙伴手中,由技術人員組裝成機架級規模的AI超級計算機GB200 NVL72,總計有120萬個零部件、130萬億顆晶體管,重量高達1800公斤。
二、英偉達敞開生態大門,能與定制CPU、AI芯片混搭!助攻靈活構建AI工廠
英偉達一直致力于開發全棧集成解決方案,并將其技術作為模塊化產品提供給客戶及合作伙伴,以便靈活構建。其NVL72機架級系統幾乎部署在全球所有主要的超大規模AI工廠中。
今日,英偉達發布半定制AI基礎設施NVLink Fusion。
NVLink Fusion擁有世界一流的AI性能、經工業驗證的縱向和橫向擴展生態系統,以及單一可擴展AI工廠架構,支持英偉達芯片與其他定制芯片混搭,能加快AI工廠上市時間,供超大規模企業采用和管理。
該AI基礎設施有兩種配置:一種是通過NVLink C2C,將定制CPU與英偉達GPU結合到NVLink機架級架構中;另一種是將英偉達Grace CPU與定制AI計算加速器結合。
其定制芯片合作伙伴包括AIchip、Astera Labs、Marvell、聯發科,CPU合作伙伴包括富士通、高通,技術合作伙伴包括Cadence和新思科技。
云提供商可使用任何ASIC、英偉達的機架式系統和英偉達端到端網絡平臺,將AI工廠擴展至數百萬張GPU。該網絡平臺提供高達800Gb/s的吞吐量,并將提供共封裝光學器件。
三、Blackwell全家桶添新:個人AI超算、AI筆電、AI服務器
英偉達Blackwell產品組合涵蓋從桌面到AI工廠,有面向Arm平臺的個人AI平臺DGX Spark、數據中心解決方案GB200/GB300 NVL72,也有針對x86平臺的RTX PRO筆記本電腦、企業數據中心解決方案RTX PRO Blackwell服務器以及先進的AI存儲服務器解決方案。
今日,英偉達Blackwell家族增加新成員,包括DGX Spark和DGX Station個人AI超級計算機、RTX PRO筆記本電腦、RTX PRO Blackwell服務器。
1、桌面級AI超算DGX Spark和DGX Station
DGX Spark個人AI超級計算機今夏就會上市。它是全球最小AI超級計算機,采用GB10 Grace Blackwell超級芯片、128GB統一系統內存、ConnectX-7 SmartNIC,AI算力達到1PFLOPS。
黃仁勛舉起2016年推出的DGX-1超級計算機(圖左)與DGX Spark(圖右)作對比,可見DGX Spark有多輕巧。
宏碁、華碩、戴爾、技嘉、惠普、聯想、微星等OEM合作伙伴將推出DGX Spark。
DGX Station是針對更嚴苛AI工作負載設計的桌面AI超級計算機,本地能跑1萬億參數模型,可提供數據中心級性能。
它搭載GB300 Grace Blackwell Ultra超級芯片、784GB統一系統內存、網絡速度多達800Gb/s的ConnectX-8 SuperNIC,AI性能達到20PFLOPS。
華碩、戴爾、技嘉、惠普和微星等將在今年晚些時候推出DGX Station。
2、RTX PRO筆記本電腦
英偉達RTX PRO筆記本電腦搭載24GB GDDR7內存、2倍快的內存,AI性能達到1.8PFLOPS,今年5月上市。
英偉達專業GPU一直是企業工作站部署的首選解決方案。RTX技術結合AI、實時光線追蹤、高級圖形和計算,改變了桌面計算。
英偉達正在更新RTX PRO GPU陣容,覆蓋RTX PRO 5000、4000、3000、2000、1000、500系列筆記本電腦GPU,搭載這些GPU的筆記本電腦將于今年夏天從OEM合作伙伴處提供。
3、RTX PRO Blackwell服務器
英偉達RTX PRO Blackwell服務器是面向企業AI和工業AI的計算平臺,擴展了Blackwell的性能和能源效率,可加速代理式AI、物理AI、模擬仿真、視覺計算、設計、數字孿生等各種企業工作負載,支持使用英偉達藍圖構建的AI agents和生成式AI應用,即日可訂購。
這些新服務器將提供多種NVIDIA認證系統配置,針對英偉達AI軟件棧、Spectrum-X以太網網絡進行了優化,最多科支持8張RTX PRO 6000 Blackwell服務器版GPU,FP4 AI性能可達30PFLOPS,3PFLOPS RTX圖形性能可支持大規模實時Omniverse數字孿生模擬和工業機器人等物理AI應用。
相比H100 HGX服務器,Blackwell服務器運行DeepSeek-R1的性能達到4倍。
四、助攻企業更快開發AI agents,挖掘數據知識,提高團隊生產力
英偉達企業AI平臺正在加速全球IT一萬億美元投資。該平臺包含三層:AI基礎設施、AIOps、代理式AI。
在企業AI工廠基礎設施上部署AI agents的開發人員可利用Dataiku、DataRobot、Dynatrace、JFrog等合作伙伴AIOps工具來構建、編排、運營和擴展AI工作流。
該設計還支持來自CrewAI的框架,以及來自DataStax和Elastic的向量數據庫,以幫助agents存儲、搜索和檢索數據。
借助來自Arize AI、Galileo、SuperAnnotate、Unstructured、Weights & Biases等合作伙伴的工具,開發人員可進行數據標記、合成數據生成、模型評估和實驗跟蹤。ActiveFence、CrowdStrike、Fiddler、Securiti、Trend Micro等安全合作伙伴的軟件可保護AI工廠。
Canonical、Nutanix、Red Hat、VMware等編排和部署合作伙伴支持在復雜的企業環境中無縫擴展和管理AI agents工作負載。
代理式AI改變了企業用數據做決策的方式。比如,VAST僅用3天就利用英偉達AI-Q藍圖與自身的加速AI數據平臺,打造出銷售研究AI agent,通過NeMo Retriever,該平臺持續提取、嵌入和索引數據資料,讓語義搜索更快。
過去需要幾天才能擬定的銷售計劃,現在只需一個AI提示詞。AI agent會擬定一個銷售大綱,接著使用CRM系統、多模態知識庫和內部工具等資料,最后用Llama Nemotron將大綱轉為逐步銷售計劃。
英偉達推出經過英偉達企業AI工廠驗證的新設計和英偉達AI藍圖,使企業能夠構建智能、適應性強的AI Agents,從而提高團隊生產力。
新AI藍圖可幫助開發人員構建能說話、研究和學習的智能AI隊友,通過理解自然通信和直接訪問企業數據,創建符合業務目標的agents,以提高員工工作效率。
全球領先存儲系統制造商正推出基于英偉達AI數據平臺的產品和解決方案,來支持AI agents。英偉達AI數據平臺使用檢索增強生成和NeMo檢索微服務來訪問企業數據,能夠為AI agents提供近乎實時的業務洞察。
使用這些解決方案構建代理式AI基礎設施,可直接訪問企業中許多存儲設備中的非結構化數據,幫助企業使用檢索增強生成(RAG)軟件將數據轉化為可操作的知識,為AI agents提供更快更準確的響應。
存儲提供商可將他們的文檔安全和訪問控制專業知識集成到內容索引和檢索過程中,從而提高AI推理的安全性和數據隱私合規性。
五、加速人形機器人開發:開源基礎模型,擴充合成運動數據集
AI agents本質上是數字機器人。英偉達還想制造物理機器人。
機器人要在虛擬世界中學習如何成為一個好的機器人,虛擬世界必須遵循真實世界的物理定律。英偉達與谷歌DeepMind、迪士尼研究院合作研發了世界上最先進的物理引擎Newton,將于7月開源。
物理AI是下一波AI浪潮。英偉達構建了機器人行業所需的3臺計算機:
(1)DGX,用Omniverse來訓練AI模型;
(2)RTX PRO Blackwell服務器和RTX PRO 6000工作站,用于模擬仿真與合成數據生成;
(3)Jetson AGX,用于機器人運行時。
英偉達已構建全棧軟硬件,包括在這些計算機上運行的基礎模型、仿真框架和數據管道,以供開發人員加速工作流程。
人形機器人是增長最快的機器人領域之一。英偉達打造了開放式人形機器人開發平臺Isaac GR00T。這是面向物理AI合成數據生成、預訓練和推理的新AI基礎設施。
該平臺包括兩項重要發布:Isaac GR00T N1.5基礎模型和Isaac GR00T-Dreams合成數據生成藍圖。
Isaac Groot N1.5是英偉達開放、通用、完全可定制的人型機器人基礎模型的首次更新,它能夠更好地適應新的環境和工作空間配置,并在給定指令時更好地識別物體,提高拾取和放置任務的成功率。
此前該模型已被下載6000次,獲得3.6K星。新的N1.5模型將于6月9日開源。
開發者可以為特定機器人品牌發布訓練模型,并使用英偉達Isaac GR00T-Dreams藍圖生成的合成數據訓練Isaac Groot N1.5。
機器人制造商面臨的主要挑戰是缺乏大規模、真實和合成數據來訓練模型。機器人從真實世界的數據中學習,人工示范無法大規模推行,這既昂貴又耗時。開發者可使用英偉達Cosmos物理AI世界基礎模型來擴增數據。
英偉達研究團隊使用Isaac GR00T-Dreams藍圖生成合成數據,僅用36小時就選練出Isaac Groot N1.5。而如果不用這個藍圖,手動收集這些數據需要花費近3個月。
Isaac GR00T-Dreams是一個基于英偉達Cosmos構建的藍圖,用于生成大規模合成軌跡數據,是一種真實到真實的數據工作流程。這些生成數據可以被用來教機器人適應不斷變化的環境,掌握新的行為。
首先,通過記錄單一環境中的單一任務進行遠程操作的人工演示,開發者可對Cosmos世界基礎模型進行微調。
然后,用圖像和新的指令提示模型,以生成“夢境(Dream)”,即機器人在新環境中執行新任務的視頻,或者說是未來世界的狀態。
一旦產生大量“夢境”,Cosmos就會推理并評估每個“夢境”的質量,選擇最好的進行訓練。
這些“夢境”仍然只是像素。機器人是從動作中學習的,GR00T-Dreams藍圖從3D“夢境”視頻片段,生成3D的動作軌跡,然后用它來訓練機器人模型。
GR00T-Dreams讓機器人能夠以少量的人工捕捉,學習大量各種新動作。
因此,一個小型的人類示范團隊,就能完成過去需要數千人才能完成的工作。這使得開發者在解決機器人挑戰方面又邁進了一步。
最終,機器人可以正確拾取物品,比如讓它拿起蘋果或罐頭。
六、臺積電用Omniverse構建新晶圓廠,富士康用數字孿生訓練機器人
臺積電、富士康、緯創、和碩、臺達、廣達、緯穎、技嘉等中國臺灣領先的半導體和電子制造公司使用英偉達Omniverse,為制造過程的每一個步驟開發數字孿生。
他們正在建設晶圓廠和AI工廠的數字孿生,以優化制造過程,這為他們節省了數百萬美元的成本。
例如,廣達、緯創、和碩在實體動工前,先以虛擬方式規劃新廠房和產線,并透過減少停機時間,節省數百萬美元的成本。和碩模擬錫膏點膠以減少生產缺陷。
臺積電正在與一家AI驅動的數字孿生創企合作,優化其新晶圓廠的規劃與建設。臺積電利用AI引擎和基于Omniverse庫構建的應用程序,將傳統的2D CAD圖資轉化成了整座晶圓廠的豐富交互式3D布局,并在英偉達cuOpt平臺上開發AI工具,可模擬和優化跨多樓層的復雜管線系統,進而節省數月時間。
臺積電也使用視覺語言模型和視覺基礎模型來改進自動缺陷分類工作流程,從而提高對晶圓產品缺陷進行分類的效率,幫助工程師查明問題的潛在根源。
除了使用數字孿生和視覺AI之外,臺積電還利用英偉達CUDA-X軟件庫和GPU來加速其半導體芯片設計工作流程,從使用英偉達cuLitho進行光刻到半導體工藝模擬。
富士康臺灣工廠正依靠基于OpenUSD、西門子和Omniverse技術開發的Fii數字孿生平臺來設計和模擬機器人工作單元、裝配線和整個工廠布局。
此外,富士康使用英偉達Isaac GR00T N1模型、用于生成合成操作動作的Isaac GR00T-Mimic藍圖和Isaac Lab來訓練工業機械臂和人形機器人執行擰緊螺絲、拾取和放置、組裝、電纜插入等復雜任務。
利用Omniverse藍圖的AI工廠數字孿生,富士康可以在液冷POD中模擬和測試GB200 Grace Blackwell超級芯片,以復制AI工廠的條件。
為了開發物理AI機器人,多家公司利用數字孿生作為機器人訓練場,以開發、訓練、測試和模擬這些機器人。
無論是機械臂、自主移動機器人、人形機器人還是視覺AI agents,都可以模擬任務執行,或以團隊方式進行多方協作,而且當通過物聯網連接到實體孿生時,每個數字孿生都會變成實時互動式儀表板。
和碩借助英偉達Metropolis打造AI agents,以協作員工學習復雜技能。
Linker Vision和高雄市用數字孿生來模擬各種不可預測情境的影響,并打造管理城市里影像串流系統的AI agents,以發送即時通知給第一線應變人員。
結語:全力投身AI基建,英偉達再擴生態影響力
短短幾年,英偉達已發展成為一家市值3萬億美元的公司。當前英偉達正全力投入AI基礎設施建設,積極布局下一波企業AI、工業AI、物理AI以及AI4Science浪潮,為下一代AI研發提供各類硬件設備及軟件。
英偉達將從AI到機器人的基礎設施各階段拆解,形成靈活、模塊化的產品矩陣。隨著定制AI芯片陣營日趨壯大,英偉達又適時推出半定制AI基礎設施NVLink Fusion,敞開生態大門,此舉有望幫助英偉達進一步擴大其數據中心生態及市場影響力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.