新智元報(bào)道
編輯:KingHZ
【新智元導(dǎo)讀】推理模型開(kāi)始「自言自語(yǔ)」、量子計(jì)算進(jìn)入臨界點(diǎn)……AI大航海時(shí)代已然啟航,這不是一次產(chǎn)品發(fā)布會(huì),而是未來(lái)的預(yù)言書(shū)。巴黎GTC大會(huì),黃仁勛開(kāi)講了!這次他脫下了皮衣。
「AI是世界上創(chuàng)造的最偉大的平等工具。」
在巴黎,黃仁勛這樣說(shuō)道。
他表示,人工智能既不會(huì)引發(fā)反烏托邦式災(zāi)難,也不會(huì)導(dǎo)致壟斷,它是解放人類(lèi)的工具。
再巴黎GTC會(huì)議后的新聞發(fā)布會(huì)上,黃仁勛認(rèn)為AI的確改變了職場(chǎng),但駁斥了Dario Amodei最近關(guān)于AI導(dǎo)致大裁員的預(yù)測(cè):
每個(gè)人的工作都會(huì)發(fā)生變化。雖然部分崗位會(huì)被替代,但也會(huì)涌現(xiàn)出大量新職業(yè)……
當(dāng)公司更具生產(chǎn)力時(shí),他們會(huì)雇傭更多人。
這次英偉達(dá)還簽了個(gè)大單:直接賣(mài)了1萬(wàn)塊GPU!
這些GPU將用于在德國(guó)建設(shè)全球首個(gè)工業(yè)AI云平臺(tái),加速歐洲工業(yè)巨頭的制造應(yīng)用。
這次歐洲之行,英偉達(dá)收獲滿(mǎn)滿(mǎn),包括與法國(guó)、德國(guó)、意大利等國(guó)家達(dá)成合作。
左右滑動(dòng)查看
此外,與多家公司和研究機(jī)構(gòu)建立了合作關(guān)系,包括與Mistral合作開(kāi)發(fā)AI云服務(wù)等。
黃仁勛還宣布了DGX Lepton項(xiàng)目,助力歐洲擴(kuò)大AI影響力:
DGX Cloud Lepton正在連接歐洲開(kāi)發(fā)者與全球AI基礎(chǔ)設(shè)施。我們正在與來(lái)自歐洲的伙伴共同打造AI工廠(chǎng)網(wǎng)絡(luò),供開(kāi)發(fā)者、研究人員和企業(yè)將本地的突破性成果擴(kuò)展為全球性創(chuàng)新。
這意味著客戶(hù)能夠自動(dòng)將推理工作負(fù)載從不同的云平臺(tái)之間轉(zhuǎn)移,同時(shí)理論上保持相同的軟件用戶(hù)界面和體驗(yàn)。
如果DGX Lepton成功,它將為所有新云(neocloud)創(chuàng)建標(biāo)準(zhǔn)的用戶(hù)體驗(yàn)、價(jià)值和性能水平,這將導(dǎo)致這些新云陷入激烈的價(jià)格戰(zhàn),最終使利潤(rùn)降至極低的商品水平。
這是英偉達(dá)首次在巴黎舉行GTC大會(huì),拉開(kāi)2025年VivaTech的序幕,揭示了從智能體系統(tǒng)到AI工廠(chǎng)的下一階段AI計(jì)算。
從感知AI到自主AI
正是英偉達(dá)的GPU,使AI革命成為可能。
而AI,早已是英偉達(dá)關(guān)注的重點(diǎn)。
在巴黎GTC上,黃仁勛回顧了AI的發(fā)展,強(qiáng)調(diào)了AI在理解、感知、推理、規(guī)劃和執(zhí)行任務(wù)方面的進(jìn)步。
AI的第一波浪潮:感知智能
回到2012年,那時(shí)英偉達(dá)與開(kāi)發(fā)者合作,「深度學(xué)習(xí)」的新算法橫空出世,誕生了AlexNet,這被認(rèn)為是AI的宇宙大爆炸時(shí)刻。
AlexNet由Alex Krizhevsky, Ilya Sutskever,和「深度學(xué)習(xí)教父」Hinton使用Cuda和C++開(kāi)發(fā)
在過(guò)去15年,AI的進(jìn)展非常迅速。
第一階段是讓計(jì)算機(jī)看懂圖像、聽(tīng)懂語(yǔ)音、識(shí)別模式。這就是「感知智能」。
第二波浪潮:生成式人工智能(GenerativeAI)
最近這五年,AI進(jìn)入了第二階段——生成式人工智能GenAI。
AI不只是識(shí)別,還能生成圖像、生成語(yǔ)言?xún)?nèi)容。
它擁有「多模態(tài)」能力——能夠同時(shí)理解圖像和文字,所以我們可以用文字“提示”AI去創(chuàng)作圖像。
這項(xiàng)能力極大地提升了我們生產(chǎn)內(nèi)容的效率。
AI能寫(xiě)、能畫(huà)、能說(shuō)、能演,這開(kāi)啟了「內(nèi)容生成革命」。
為了支持開(kāi)源生態(tài),讓開(kāi)發(fā)者與企業(yè)也能擁有世界一流的大模型,于是英偉達(dá)打造了NeMo框架和Nemotron項(xiàng)目。
NeMo是NVIDIA開(kāi)發(fā)的全棧大模型平臺(tái),而Nemotron是提升開(kāi)源模型質(zhì)量的專(zhuān)項(xiàng)計(jì)劃。
LLaMA Nemotron針對(duì)性強(qiáng)化了開(kāi)源的Llama模型,效率和準(zhǔn)確率大幅度提升。
在多個(gè)領(lǐng)域,Nemotron模型排名領(lǐng)先,性能優(yōu)異。
第三波浪潮:AgenticAI
現(xiàn)在進(jìn)入了第三波浪潮 ——智能體AI(Agentic AI)。
智能不僅僅是識(shí)別或生成內(nèi)容,更是能“理解、推理、規(guī)劃并執(zhí)行任務(wù)”。
我們正在開(kāi)啟新一波AI浪潮。
從根本上說(shuō),智能是關(guān)于理解、感知、推理、規(guī)劃任務(wù)(如何解決問(wèn)題),然后執(zhí)行任務(wù)。
真正的智能包括三個(gè)核心循環(huán):
感知(Perception)
推理(Reasoning)
規(guī)劃(Planning)
它允許應(yīng)用一些以前學(xué)過(guò)的規(guī)則,來(lái)解決從未見(jiàn)過(guò)的問(wèn)題。
這就是聰明人之所以聰明的原因,他們能夠解決復(fù)雜問(wèn)題,將問(wèn)題一步步分解,思考如何解決問(wèn)題;也許會(huì)進(jìn)行研究,也許會(huì)學(xué)習(xí)一些新信息,獲得一些幫助;使用工具,并一步步解決問(wèn)題。
智能體AI(Agentic AI)具備這些能力,它能將所學(xué)知識(shí)應(yīng)用到新問(wèn)題中,逐步拆解復(fù)雜問(wèn)題,找到解決方案。比如:
面對(duì)沒(méi)見(jiàn)過(guò)的問(wèn)題,AI可以自己想步驟、找工具、搜索資料、調(diào)用其他智能體、整合上下文,并一步步完成任務(wù)。
英偉達(dá)提供了完整的Agent平臺(tái)。
企業(yè)客戶(hù)正在用它構(gòu)建專(zhuān)屬Agent系統(tǒng):
Cisco(思科):用于企業(yè)安全情報(bào)的AI平臺(tái);
SAP:將AI集成到業(yè)務(wù)自動(dòng)化;
DeepL:用于翻譯系統(tǒng)的AI平臺(tái);
PhotoRoom:用于AI圖像與視頻編輯;
Kodo(前Kodium):AI代碼助手;
Iola:語(yǔ)音交互系統(tǒng);
全球最大臨床試驗(yàn)自動(dòng)化平臺(tái):也使用NeMo構(gòu)建智能體。
第四波浪潮:進(jìn)入機(jī)器人時(shí)代
在實(shí)際實(shí)現(xiàn)中,智能體AI的具身化以及現(xiàn)在的生成能力正在生成運(yùn)動(dòng)。
這種AI不是生成視頻、圖像或文本,而是生成局部運(yùn)動(dòng)。它能夠行走,或者伸手抓取東西,使用工具。AI以物理形式具身化的能力基本上就是機(jī)器人技術(shù)。
這些能力,即實(shí)現(xiàn)智能體(基本上是信息機(jī)器人)和具身化AI(物理機(jī)器人)的基本技術(shù),現(xiàn)在已經(jīng)擺在我們面前。
從虛擬世界走向現(xiàn)實(shí),這就是「具身智能」(EmbodiedAI)的世界。機(jī)器人就是這種智能的物理體現(xiàn)。
目前,我們正處于兩個(gè)核心AI領(lǐng)域交匯的時(shí)刻:
(1)信息型機(jī)器人(像ChatGPT這樣的聊天助手);
(2)實(shí)體型機(jī)器人(可以在物理世界中行動(dòng)的AI)。
這兩類(lèi)智能體現(xiàn)在都已經(jīng)成為現(xiàn)實(shí),我們正在迎來(lái)AI發(fā)展的全新時(shí)代!
對(duì)于AI來(lái)說(shuō),這真是令人興奮的時(shí)刻。
但這一切都始于都始于英偉達(dá)的第一張顯卡:GeForce 256。
GeForce 256
加速千行百業(yè)
GeForce帶來(lái)了計(jì)算機(jī)圖形。
這是有史以來(lái)開(kāi)發(fā)的第一個(gè)加速計(jì)算應(yīng)用程序,計(jì)算機(jī)圖形的發(fā)展令人難以置信。
GeForce將CUDA帶給世界,這使得機(jī)器學(xué)習(xí)研究人員和AI研究人員能夠推進(jìn)深度學(xué)習(xí)。
隨后,深度學(xué)習(xí)徹底改變了計(jì)算機(jī)圖形,并使我們將計(jì)算機(jī)圖形提升到全新的水平成為可能。
黃仁勛展示了計(jì)算機(jī)模擬:光子模擬、物理模擬、粒子模擬。
所有一切從根本上來(lái)說(shuō)都是模擬,而不是動(dòng)畫(huà),也不是藝術(shù)。
它之所以看起來(lái)如此美麗,是因?yàn)槭澜绫旧砭褪敲利惖模瑪?shù)學(xué)也是美麗的。
那么,讓我們一起來(lái)看看吧。
這本質(zhì)上就是模擬,而且看起來(lái)非常美麗。
現(xiàn)在能夠模擬幾乎所有事物的規(guī)模和速度,可以將所有事物都變成數(shù)字孿生。
因?yàn)樗惺挛锒伎梢员粩?shù)字孿生,我們可以在將其投入物理世界之前,完全以數(shù)字方式進(jìn)行設(shè)計(jì)、規(guī)劃、優(yōu)化和操作。
一切都在軟件中構(gòu)建,英偉達(dá)將這一想法現(xiàn)在已經(jīng)成為現(xiàn)實(shí):
所有物理事物都將以數(shù)字方式構(gòu)建。
所有宏偉的事物都將以數(shù)字方式構(gòu)建。
所有以巨大規(guī)模運(yùn)行的事物都將首先以數(shù)字方式構(gòu)建,并且會(huì)有數(shù)字孿生來(lái)操作它們。
現(xiàn)在的「GB300 NVL 72」看起來(lái)是這樣的。
該計(jì)算設(shè)備重兩噸半,1.2萬(wàn)個(gè)零件,大約300萬(wàn)美元。120千瓦,由150家工廠(chǎng)制造,200家技術(shù)合作伙伴與英偉達(dá)合作完成
它已經(jīng)完全投入生產(chǎn)。它被設(shè)計(jì)成一臺(tái)思考機(jī)器。
這意味著它能夠推理、規(guī)劃,并且像人一樣,花費(fèi)大量時(shí)間自言自語(yǔ)。
加速AI推理
推理模型正在自言自語(yǔ),我們需要30到40倍的性能提升。
它不再是那種一問(wèn)一答的ChatGPT,現(xiàn)在是推理模型,當(dāng)思考時(shí),它會(huì)生成更多的token。
它會(huì)一步步地分解問(wèn)題、推理;嘗試各種不同的路徑:也許是思維鏈(chain of thoughts),也許是思維樹(shù)(tree of thoughts)的最佳結(jié)果。
它會(huì)反思自己的答案。
可能你已經(jīng)看到這些研究模型在反思答案,說(shuō)「這是一個(gè)好答案嗎?你能做得更好嗎?」然后推理模型會(huì)說(shuō):「哦,是的,我能做得更好。」然后回去思考更多。
因此,這些思考模型、推理模型實(shí)現(xiàn)了令人難以置信的性能,但這需要更多的算力。
而最終的結(jié)果,MVLink 72 Blackwells的架構(gòu),帶來(lái)了性能的巨大飛躍,在僅僅一代之內(nèi)實(shí)現(xiàn)30到40倍的性能提升。
根據(jù)摩爾定律,半導(dǎo)體物理學(xué),每三到五年只有大約兩倍的性能提升。
而解讀下圖的方式是:X軸代表它思考的速度。Y軸代表工廠(chǎng)在同一時(shí)間支持大量用戶(hù)時(shí)的產(chǎn)出量。
加速計(jì)算
英偉達(dá)曾經(jīng)夢(mèng)想,創(chuàng)建全新的計(jì)算平臺(tái),去完成傳統(tǒng)計(jì)算機(jī)無(wú)法完成的任務(wù)。
他們加速了CPU,創(chuàng)造了一種全新的計(jì)算方式,稱(chēng)為「加速計(jì)算」。
他們最初的應(yīng)用之一是分子動(dòng)力學(xué)模擬。從那以后,他們走過(guò)了漫長(zhǎng)的道路,開(kāi)發(fā)了無(wú)數(shù)的庫(kù)。
事實(shí)上,使加速計(jì)算與眾不同的原因在于,它不僅僅是一個(gè)新的處理器,也不僅僅是你編譯代碼就能運(yùn)行的軟件。
你必須徹底重新設(shè)計(jì)你的計(jì)算方式,重新構(gòu)思你的算法。而這對(duì)大多數(shù)人來(lái)說(shuō)極其困難——
要將軟件和算法重新構(gòu)建為高度并行化的形式并不容易。
所以,他們創(chuàng)建了各種庫(kù),幫助每一個(gè)行業(yè)、每一個(gè)應(yīng)用領(lǐng)域?qū)崿F(xiàn)加速。
每一個(gè)這樣的庫(kù)都為開(kāi)發(fā)者打開(kāi)了新的可能。
比如:
計(jì)算光刻,也許是今天半導(dǎo)體設(shè)計(jì)中最重要的應(yīng)用之一;它在臺(tái)積電、三星等大型晶圓廠(chǎng)中運(yùn)行,在芯片制造之前會(huì)運(yùn)行一個(gè)基于反物理算法的流程,稱(chēng)為Computational Lithography(計(jì)算光刻)。
稀疏求解器、代數(shù)多重網(wǎng)格求解器等。
cuOpt:剛剛開(kāi)源的應(yīng)用庫(kù),它能加速?zèng)Q策制定,優(yōu)化數(shù)百萬(wàn)變量和約束的問(wèn)題,比如旅行商問(wèn)題。
這些只是他們提供的部分庫(kù)。
他們有400多個(gè)類(lèi)似的庫(kù),每一個(gè)都加速特定的應(yīng)用領(lǐng)域,每一個(gè)都為行業(yè)打開(kāi)新的可能。
另一個(gè)極其重要的是CUDA Q。它將CUDA擴(kuò)展到量子經(jīng)典領(lǐng)域。
量子計(jì)算拐點(diǎn)
英偉達(dá)開(kāi)發(fā)CUDAQ已經(jīng)好幾年了。
黃仁勛認(rèn)為:「量子計(jì)算正在發(fā)生拐點(diǎn)。」
眾所周知,在近30年前,第一個(gè)物理量子比特就被演示了。
第一一個(gè)糾錯(cuò)算法于1995年被發(fā)明,而在2023年,將近30年后,世界上第一個(gè)邏輯量子比特由谷歌演示。從那時(shí)起,幾年后,邏輯量子比特的數(shù)量(由大量帶糾錯(cuò)的物理量子比特表示)開(kāi)始增長(zhǎng)。
就像摩爾定律一樣,完全可以預(yù)期每5年邏輯量子比特增加10倍,每10年增加100倍。這些邏輯量子比特將得到更好的糾錯(cuò),更健壯,性能更高,更有彈性,當(dāng)然也將繼續(xù)可擴(kuò)展。
英偉達(dá)與世界各地的量子計(jì)算公司以多種不同的方式合作,而歐洲相關(guān)從業(yè)者最多。
現(xiàn)在,英偉達(dá)很清楚:「我們已經(jīng)觸手可及,能夠在未來(lái)幾年將量子計(jì)算,量子經(jīng)典計(jì)算應(yīng)用于可以解決一些有趣問(wèn)題的領(lǐng)域。」
這是真正激動(dòng)人心的時(shí)刻。
在接下來(lái)的幾年里,或者至少是下一代超級(jí)計(jì)算機(jī),都將配備QPU,并且QPU將連接到GPU。QPU當(dāng)然會(huì)進(jìn)行量子計(jì)算,而GPU將用于預(yù)處理、控制、糾錯(cuò)(這將是計(jì)算密集型的)、后處理等。
就像加速CPU一樣,現(xiàn)在有QPU與GPU協(xié)同工作,以實(shí)現(xiàn)下一代計(jì)算。
參考資料:
https://www.youtube.com/watch?v=X9cHONwKkn4%20
https://www.nvidia.cn/gtc/paris/keynote/
https://nvidianews.nvidia.com/news/nvidia-builds-worlds-first-industrial-ai-cloud-to-advance-european-manufacturing
https://media.iprsoftware.com/219/files/20255/gtc-paris-2025-keynote-deck.pdf
https://fortune.com/2025/06/11/nvidia-jensen-huang-disagress-anthropic-ceo-dario-amodei-ai-jobs/
https://abcnews.go.com/Technology/wireStory/nvidia-chief-calls-ai-greatest-equalizer-warns-europe-122745910
https://x.com/SemiAnalysis_/status/1932802502069755956
https://blogs.nvidia.cn/blog/nvidia-dgx-cloud-lepton-connects-europes-developers-to-global-nvidia-compute-ecosystem/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.