(圖片來源:NVIDIA官網(wǎng))
就在全球AI龍頭英偉達(dá)(NVIDIA)財報發(fā)布數(shù)小時前,華為再度隔空“硬碰硬”。
5月29日凌晨,華為技術(shù)團隊在Gitcode平臺上發(fā)布Pangu Ultra MoE萬億規(guī)模大模型技術(shù)報告,其擁有約7180億參數(shù)規(guī)模的結(jié)構(gòu),首次全流程在昇騰Ascend 910上進(jìn)行訓(xùn)練,顯著提升推理吞吐并降低延遲,并且融合大算子和通信優(yōu)化有效提升了NPU利用率,從而有效提高訓(xùn)練過程的穩(wěn)健性。
而昨天,華為盤古還發(fā)布基于分組混合專家模型(MoGE)架構(gòu)構(gòu)建的盤古Pro MoE大模型,參數(shù)規(guī)模720億,基于昇騰300I Duo和800I A2實現(xiàn)了更優(yōu)專家負(fù)載分布與計算效率(321 tokens/s 和 1528 tokens/s)。
更早之前,華為技術(shù)團隊稱昇騰在MoE模型的推理部署性能已全面超越了基于英偉達(dá)Hopper架構(gòu)的推理部署性能,而DeepSeek基于國產(chǎn)芯片的部署方案,性能也已超越英偉達(dá)H100系列芯片。另外,華為“CloudMatrix 384超節(jié)點”技術(shù)在算力規(guī)模和推理性能上也全面超越英偉達(dá)NVL72。
因此,面對華為的“兇猛”進(jìn)擊AI算力賽道,身價1173億美元的黃仁勛似乎也感受到全球AI市場的快速變化,并開始放緩新產(chǎn)品迭代速度,而轉(zhuǎn)向網(wǎng)絡(luò)架構(gòu)。
5月29日凌晨,英偉達(dá)發(fā)布2026財年第一季度(2025自然年第二季度)業(yè)績報告,收入利潤仍在上漲。
財報顯示,英偉達(dá)當(dāng)季營收441億美元,環(huán)比增長12%,同比增長69%;凈利潤187.75億美元,市場預(yù)期207.67億美元;調(diào)整后每股收益為0.96美元,市場預(yù)期0.93美元。其中,關(guān)鍵的數(shù)據(jù)中心業(yè)務(wù)營收同比增長73%,達(dá)到391億美元,略低于市場預(yù)期的393億美元。
值得注意的是,財報中披露,4月美國政府宣布H20對中國禁售,英偉達(dá)在2026財年第一季度因H20產(chǎn)品過剩庫存和采購義務(wù)產(chǎn)生了45億美元的費用,因為對H20產(chǎn)品的需求下降。在新的出口許可要求之前,2026財年第一季度英偉達(dá)H20產(chǎn)品的銷售額為46億美元。英偉達(dá)在第一季度無法發(fā)貨導(dǎo)致額外的25億美元H20收入。此外,預(yù)計英偉達(dá)Q2受此損失80億美元。
近期有消息稱,英偉達(dá)即將在6月開始對華出貨B20“特供版”芯片,以取代H20。
談到B20的進(jìn)入對中國AI算力格局看法,Gartner研究副總裁盛陵海(Roger Sheng)近期對筆者表示,AI芯片到底是否適用、到底能不能受到歡迎,在于它能否支持最新AI大模型,且效率要高,從而要得到市場的認(rèn)同,如果競爭力不高,可能沒人去使用。然而,即便英偉達(dá)AI卡有更好的性能表現(xiàn),同時也不放棄中國市場,但中國需要發(fā)展國產(chǎn)AI算力,一旦美國斷供很難讓企業(yè)信任。“不能把所有的東西放在一個籃子里,我們要多元化(發(fā)展)。”
受財報影響,英偉達(dá)(NASDAQ:NVDA)股價盤后大漲4.89%,最新市值3.29萬億美元。
數(shù)據(jù)中心收入持續(xù)暴漲,資本市場已不再“震驚”
事實上,自2025年初DeepSeek熱潮下,最受矚目的就是英偉達(dá)。
華爾街質(zhì)疑,DeepSeek“現(xiàn)象級”的崛起,對美國科技巨頭3000多億美元的算力支出是否有用,動搖了推動美國 AI 行業(yè)發(fā)展預(yù)期。就在美股今年1月27日,英偉達(dá)股價暴跌17%,收于118.58美元,市值蒸發(fā)近6000億美元(約合4.3萬億元)。
CNBC稱,這是“美國公司有史以來的最大跌幅”。
到了5月,華為又“助力”了。5月中旬,華為發(fā)布CloudMatrix 384超節(jié)點技術(shù),利用多寬帶高速網(wǎng)絡(luò)連接AI加速卡,用網(wǎng)絡(luò)的“量”彌補顯卡性能上的“質(zhì)”,以此算力訓(xùn)練更大規(guī)模的AI模型。
如今,英偉達(dá)已感受到了壓力。
黃仁勛近期多次表示,中國AI競爭確實非常激烈,初創(chuàng)企業(yè)眾多,大概有五十多家相關(guān)GPU算力公司迅速崛起,其中華為無疑是全球最具實力的科技公司之一。他提到華為昇騰CloudMatrix 384超節(jié)點和910C,部分性能上甚至超過英偉達(dá)的產(chǎn)品。
“這是一個我們必須高度重視、充分尊重的對手,我們也必須全力以赴,持續(xù)創(chuàng)新,才能在這樣的競爭中保持領(lǐng)先地位。”黃仁勛指出,華為目標(biāo)就是將5G與AI深度融合,這一戰(zhàn)略方向非常有前瞻性,也完全正確,而英偉達(dá)也在推進(jìn)同樣的工作。
財報顯示,英偉達(dá)收入來源于數(shù)據(jù)中心、游戲、專業(yè)可視化、汽車等業(yè)務(wù)方向。
具體來看,數(shù)據(jù)中心業(yè)務(wù)上,英偉達(dá)當(dāng)季營收為391億美元,同比增長73%,環(huán)比增長10%。微軟、谷歌等大型云服務(wù)平臺仍然是英偉達(dá)最大的客戶群體,占數(shù)據(jù)中心收入的近50%。Blackwell在該季度貢獻(xiàn)了近70%的數(shù)據(jù)中心計算收入,Hopper的遷移工作已接近完成。
其中,計算業(yè)務(wù)收入為342億美元,同比增長76%;網(wǎng)絡(luò)收入為50億美元,同比增長56%。
英偉達(dá)CFO克雷斯(Colette Kress)表示,AI工作負(fù)載已強勢轉(zhuǎn)向推理,AI工廠的建設(shè)正在帶來可觀的收入,其對客戶的承諾堅定不移。GB200 NVL的引入是一項根本性的架構(gòu)變革,旨在支持?jǐn)?shù)據(jù)中心規(guī)模的工作負(fù)載,并實現(xiàn)最低的單位推理令牌成本。雖然這些系統(tǒng)的構(gòu)建過程很復(fù)雜,但英偉達(dá)已經(jīng)看到制造良率的顯著提升,機架出貨量也正在向最終客戶穩(wěn)步增長。
本季度,游戲方面營收38億美元,同比增長42%,環(huán)比增長48%,增長主要得益于Blackwell架構(gòu)GPU的銷售;專業(yè)可視化業(yè)務(wù)營收5.1億美元,同比增長19%,環(huán)比持平;汽車業(yè)務(wù)營收為5.8億美元,同比增長72%,環(huán)比下降1%。
黃仁勛表示:“我們突破性的 Blackwell NVL72 AI 超級計算機——一款專為推理而設(shè)計的‘思考機器’——現(xiàn)已在系統(tǒng)制造商和云服務(wù)提供商中全面投入生產(chǎn)。全球?qū)?NVIDIA AI 基礎(chǔ)設(shè)施的需求異常強勁。AI 推理代幣的產(chǎn)量在短短一年內(nèi)就激增了十倍,隨著 AI 代理成為主流,對 AI 計算的需求也將加速增長。世界各國都已將 AI 視為與電力和互聯(lián)網(wǎng)一樣重要的基礎(chǔ)設(shè)施,而英偉達(dá)正處于這一深刻變革的中心。”
展望2026財年第二季度(2025自然年三季度),英偉達(dá)指出,預(yù)計公司收入為450億美元,上下浮動2%。這一預(yù)期反映了近期出口管制限制導(dǎo)致的H20收入約80億美元的損失;預(yù)計 GAAP 和非 GAAP 毛利率分別為 71.8% 和 72.0%,上下浮動 50 個基點,并力爭在今年下半年將毛利率提高到 70% 左右;預(yù)計GAAP和非GAAP運營費用分別約為57億美元和40億美元。預(yù)計2026財年全年運營費用增長率將在30%左右。
對于英偉達(dá)來說,中國市場無疑是本季市場最為關(guān)注的事件。
黃仁勛近期表示,美國對華AI芯片出口管制是失敗的。他說道,“事實證明,最初制定AI擴散規(guī)則的那些基本假設(shè)存在根本性缺陷。”黃仁勛表示,英偉達(dá)在中國的市場份額已從美國前總統(tǒng)拜登執(zhí)政初期的95%降至目前的50%。
研究機構(gòu)Emarketer分析師雅各布·伯恩(Jacob Bourne)在一份報告中表示,更廣泛的擔(dān)憂是,貿(mào)易緊張局勢以及關(guān)稅對數(shù)據(jù)中心擴張的潛在影響,可能會在未來幾個季度對AI芯片的需求造成阻力。“這并不意味著英偉達(dá)的主導(dǎo)地位將終結(jié),但這凸顯出,英偉達(dá)要維持這種主導(dǎo)地位,需要應(yīng)對日益復(fù)雜的地緣政治、競爭和經(jīng)濟挑戰(zhàn)。”伯恩寫道。
5月29日財報會議上,黃仁勛表示,中國是全球最大的AI市場之一,也是通往全球成功的跳板。全球有一半的AI研究人員在中國,贏得中國市場的平臺有望在全球領(lǐng)先。然而,如今價值500億美元的中國市場實際上對美國企業(yè)關(guān)閉了大門。
“H20出口禁令終止了我們在中國的Hopper數(shù)據(jù)中心業(yè)務(wù)。我們無法進(jìn)一步削減Hopper的產(chǎn)能以遵守出口管制規(guī)定。因此,我們將對無法出售或重新利用的庫存進(jìn)行數(shù)十億美元的減記。我們正在探索有限的競爭方式,但Hopper已不再是我們的選擇。 無論有沒有美國芯片,中國的AI都會不斷發(fā)展。它必須進(jìn)行計算才能訓(xùn)練和部署先進(jìn)的模型。問題不在于中國是否會擁有AI,它已經(jīng)擁有了。問題在于,作為全球最大的 AI 市場之一,中國是否會在美國平臺上運行。保護(hù)中國芯片制造商免受美國競爭的影響,只會增強它們在海外的競爭力,削弱美國的地位。出口限制刺激了中國的創(chuàng)新和規(guī)模化發(fā)展。 AI競賽不僅僅關(guān)乎芯片,而關(guān)乎世界將基于哪種技術(shù)棧運行。隨著該技術(shù)棧擴展到6G和量子技術(shù),美國的全球基礎(chǔ)設(shè)施領(lǐng)導(dǎo)地位岌岌可危。 美國的政策建立在‘中國無法制造AI芯片’的假設(shè)之上。這一假設(shè)一直以來都備受質(zhì)疑,現(xiàn)在顯然是錯誤的。中國擁有巨大的制造能力。最終,贏得AI開發(fā)者的平臺才能最終贏得AI。出口管制應(yīng)該強化美國的平臺,而不是迫使全球一半的AI人才流向競爭對手。”黃仁勛表示
克雷斯表示,雖然新加坡占英偉達(dá)第一季度賬單收入的近20%,因為許多大客戶都使用新加坡進(jìn)行集中開票,但英偉達(dá)的產(chǎn)品幾乎總是運往其他地方。需要注意的是,H100、H200和Blackwell數(shù)據(jù)中心計算收入中,超過99%的賬單收入來自美國客戶的訂單。
談到DeepSeek,黃仁勛毫不吝嗇地對DeepSeek和通義千問表達(dá)了贊賞,稱其是“最佳開源AI模型之一”。“就像ChatGPT一樣,引入了推理AI,它思考的時間越長,給出的答案就越好。”
“來自中國的DeepSeek和Qwen是最優(yōu)秀的開源AI模型之一。它們免費發(fā)布,在美國、歐洲及其他地區(qū)都獲得了廣泛關(guān)注。DeepSeek-R1與ChatGPT類似,引入了推理AI,其思考時間越長,給出的答案就越好。推理AI能夠逐步解決問題、規(guī)劃和使用工具,將模型轉(zhuǎn)化為智能代理。推理是計算密集型的,每個任務(wù)需要的令牌數(shù)量是以前一次性推理的數(shù)千倍——每個任務(wù)需要的令牌數(shù)量是以前的一次性推理的數(shù)千倍。推理模型正在推動推理需求的階躍式增長。AI Scaling Law保持不變,不僅在訓(xùn)練方面,現(xiàn)在推理也需要大規(guī)模計算。”黃仁勛稱。
克雷斯表示,英偉達(dá)在制造良率方面得到顯著改善,機架出貨量正以強勁速度交付。GB300也預(yù)計本季度末量產(chǎn)發(fā)貨。
“我們的目標(biāo)是在一年內(nèi)在美國制造從芯片到超級計算機的整個過程。每個GB200 NVLink72機架包含 120 萬個組件,重近2噸。迄今為止,還沒有人生產(chǎn)過如此規(guī)模的超級計算機,我們的合作伙伴正在作出非凡的貢獻(xiàn)。”黃仁勛稱。
黃仁勛強調(diào),“美國將永遠(yuǎn)是英偉達(dá)最大的市場,也是我們基礎(chǔ)設(shè)施最大安裝基數(shù)的所在地。如今,每個國家都將AI視為下一次工業(yè)革命的核心,這是一個為每個經(jīng)濟體提供智能和必要基礎(chǔ)設(shè)施的新興產(chǎn)業(yè)。各國正在競相構(gòu)建國家級AI平臺,以提升其數(shù)字化能力。上周,我前往瑞典,出席了該國首個國家級AI基礎(chǔ)設(shè)施的啟動儀式。日本、韓國、印度、加拿大、法國、英國、德國、意大利、西班牙等國家正在建設(shè)AI工廠,以賦能初創(chuàng)企業(yè)、各行各業(yè)和社會。自主AI是英偉達(dá)新的增長引擎。”
華為完成中國AI大模型推理適配部署,H20作用大大減少
黃仁勛對華為中國AI市場的渴求,已經(jīng)擺在了臺面上。
“DeepSeek凸顯了開源AI的戰(zhàn)略價值。當(dāng)熱門模型在美國平臺上進(jìn)行訓(xùn)練和優(yōu)化時,它將推動其應(yīng)用、反饋和持續(xù)改進(jìn),從而鞏固美國在整個AI領(lǐng)域的領(lǐng)導(dǎo)地位。美國平臺必須繼續(xù)成為開源AI的首選平臺。這意味著要支持與包括中國在內(nèi)的全球頂尖開發(fā)者的合作,當(dāng)像DeepSeek和阿里Qwen這樣的模型在美國基礎(chǔ)設(shè)施上達(dá)到最佳運行狀態(tài)時,美國就將獲得勝利。”黃仁勛認(rèn)為中國AI大模型應(yīng)該要用英偉達(dá)這樣的美國AI系統(tǒng)進(jìn)行訓(xùn)練,而不應(yīng)該是華為。
實際上,2017年美國開始發(fā)動對華貿(mào)易戰(zhàn),2018年已經(jīng)開始在半導(dǎo)體和芯片等領(lǐng)域圍堵中國,2019年切斷了對華為5G芯片的供應(yīng)。
過去六年,華為“低調(diào)”處理,接連完成消費級、云服務(wù)器層面的芯片部署。當(dāng)前,基于高達(dá)100%國產(chǎn)化率的昇騰芯片,華為昇騰鯤鵬AI系統(tǒng)已經(jīng)解決了大模型訓(xùn)練、推理問題。所以這對于黃仁勛來說,無疑是一個巨大打擊。
就在5月29日一場學(xué)術(shù)活動上披露,DeepSeek模型已經(jīng)在華為昇騰上進(jìn)行了高效推理。通過對模型算子權(quán)重進(jìn)行Int4量化優(yōu)化,顯著降低現(xiàn)存占用,首次實現(xiàn)單臺華為8卡服務(wù)器上的DeepDeek-R1的推理,同時在DeepSeek V2推理性能比vLLM昇騰版本在不同請求下平均提升88%以上。
上述是一套自主可控的推理優(yōu)化方案。
據(jù)Gartner最新報告顯示,截至目前,消費者業(yè)務(wù)全球份額高達(dá)21%,國產(chǎn)芯片自給率高達(dá)42%,模擬芯片、無線通訊相關(guān)產(chǎn)業(yè)芯片達(dá)到27%的自給率。
盛陵海對筆者指出,隨著自研芯片趨勢,自給率份額會逐漸提升。比如,預(yù)期今年由于AI市場的投資持續(xù)增加,國產(chǎn)AI芯片自給率會有進(jìn)一步提升。中國芯片企業(yè)把眼光不應(yīng)該僅局限于國產(chǎn)替代,而且要建立相關(guān)標(biāo)準(zhǔn)、要去國際市場做新的競爭。
不過,目前國產(chǎn)AI芯片依然存在很多不足。
中國科學(xué)院院士、清華大學(xué)計算機系教授胡事民表示,國產(chǎn)芯片格局已基本明朗,高端芯片與美國仍有較大差距。算法和模型優(yōu)化能夠?qū)崿F(xiàn)卓越的性能提升,彌補國產(chǎn)算力不足,原始創(chuàng)新仍然需要加強。
近期華為發(fā)布的CloudMatrix 384超節(jié)點,通過全面架構(gòu)創(chuàng)新,在算力、互聯(lián)帶寬、內(nèi)存帶寬等方面實現(xiàn)全面領(lǐng)先。而目前,華為開發(fā)者規(guī)模超1200萬,伙伴數(shù)量超4.5萬,云商店應(yīng)用數(shù)量超1.2萬。
目前,黃仁勛也在追趕華為384超節(jié)點,部署多個網(wǎng)絡(luò)平臺。他在財報會上表示,目前英偉達(dá)有四個網(wǎng)絡(luò)擴展平臺:NVLink、InfiniBand、Spectrum-X和BlueField。
黃仁勛也透露了公司對全球AI基礎(chǔ)設(shè)施建設(shè)的宏偉愿景:“我們可以預(yù)見到在不遠(yuǎn)的將來,需要數(shù)十吉瓦的英偉達(dá)AI基礎(chǔ)設(shè)施的項目。”
他指出,AI是一種基礎(chǔ)設(shè)施。就像電力和互聯(lián)網(wǎng)成為基礎(chǔ)設(shè)施一樣,AI將成為每個國家、每個行業(yè)必不可少的基礎(chǔ)設(shè)施。我們正處于這種基礎(chǔ)設(shè)施建設(shè)的初期階段。
展望未來,英偉達(dá)仍保持樂觀。黃仁勛強調(diào),“這是強勁新一波增長的開始。Grace Blackwell已全面投產(chǎn),我們已全力以赴。我們現(xiàn)在有多個重要的增長引擎。”
“AI時代已經(jīng)到來,從AI基礎(chǔ)設(shè)施、大規(guī)模推理、自主AI、企業(yè)AI和工業(yè)AI,NVIDIA 已經(jīng)做好準(zhǔn)備。”黃仁勛稱。(本文首發(fā)于鈦媒體App,作者|林志佳)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.