智東西
編譯 王涵
編輯 漠影
智東西5月27日消息,據外媒Business Insider報道,今年早些時候在巴黎舉行的AI Action Summit上,Meta首席人工智能(AI)科學家楊立昆(Yann LeCun)指出,當前AI雖在多個領域展現驚人能力,其仍缺乏理解物理世界、持久記憶、邏輯推理與分層規劃四大人類智能核心特征。
據外媒VentureBeat此前報道,科技巨頭們的行動印證了這一判斷,開始從“打補丁”式優化轉向“世界模型”架構革新,谷歌等企業已將其納入戰略布局。
這場圍繞AI本質的探索,不僅關乎技術突破,更指向人機認知邊界的未來走向。
一、AI模型缺乏4個人類特征:理解、記憶、推理與規劃
所有智能生命的共同點是什么?今年早些時候在巴黎舉行的AI Action Summit上,圖靈獎得主、Meta首席AI科學家楊立昆與IBM AI負責人安東尼·安農齊亞塔(Anthony Annunziata)分享了其對智能行為的基準定義:
“所有動物——至少是相對聰明的動物——都具備四種基本智能特征,人類當然也不例外,”楊立昆闡述道,“理解物理世界、擁有持久記憶、進行邏輯推理,以及制定復雜行動計劃的能力,特別是分層規劃能力。”
楊立昆認為,當前AI(尤其是大語言模型)尚未達到該閾值,要實現這些能力需變革訓練范式。他解釋這正是科技巨頭們在AI競賽中不斷為現有模型“打補丁”的原因:“為理解物理世界,就訓練獨立的視覺系統然后硬塞進LLM;為實現記憶功能,要么采用RAG(檢索增強生成),要么外掛關聯記憶模塊,或者簡單粗暴地擴大模型規模。”
▲Meta首席AI科學家楊立昆(Yann LeCun)
二、“世界模型”構建抽象層級來理解物理世界
但楊立昆直言這些只是“權宜之計”。他多次倡導的“世界模型”(world model)替代方案,是通過現實場景訓練、具備比模式識別AI更高認知水平的架構。在與安農齊亞塔對話中,他給出新定義:“獲取時間T的世界狀態后,設想可能采取的行動,世界模型就能預測行動后的新狀態。”
不過現實世界演化存在無限不可預測性,楊立昆認為唯一訓練途徑是抽象化。Meta今年2月開源的V-JEPA模型正進行相關實驗,讓這個非生成式模型通過預測視頻缺失片段來學習。“關鍵是不做像素級預測,而是訓練系統構建視頻抽象表征,在此維度進行預測時自動過濾不可預測的細節。”他解釋道。
這種抽象層級思想類似化學物質構成體系:“我們建立粒子→原子→分子→材料的層級,每上升一層就剔除下層與當前任務無關的信息。”楊立昆說,這本質上是通過構建抽象層級來理解物理世界的另一種表述。
三、谷歌將“世界模型”與其短期策略緊密結合
無獨有偶,在上周硅谷舉行的Google I/O 2025開發者大會上,除卻奪人眼球的炫酷功能,谷歌也提到要打造AI時代的操作系統,即能理解物理環境并代人類推理決策的“世界模型”。
自2024年末以來,DeepMind首席執行官德米斯·哈薩比斯就在持續完善“世界模型→通用AI助手”理論體系。此次I/O大會上,CEO桑達爾·皮查伊(Sundar Pichai)與Gemini負責人喬希·伍德沃德(Josh Woodward)同臺呼應這一愿景。相較微軟、OpenAI和xAI對世界模型的抽象討論,谷歌獨樹一幟地將其與短期戰略緊密結合。
▲Gemini負責人喬希·伍德沃德(Josh Woodward)(圖源:谷歌I/O)
若真能打造出理解物理環境的“通用AI助手”,谷歌或將成為連接用戶、企業與技術的“隱形操作系統”。對追求尖端AI的企業而言,利用谷歌的“世界模型”研究、多模態能力(如I/O大會展示的Veo 3和Imagen 4)及其AGI發展路徑,將開啟重大創新通道。
結語:世界模型是AI大模型的未來
楊立昆揭示的AI四大能力鴻溝不僅暴露了現有模型的局限,更指明了技術突破的方向。科技巨頭們的行動印證了這一判斷:無論是Meta通過V-JEPA模型探索抽象表征訓練,還是谷歌將“世界模型”納入操作系統級戰略,本質上都在重構AI與物理世界的交互方式。
這場角逐的深層意義,在于將AI從模式識別的工具升級為具備物理世界理解能力的認知主體。當行業從“打補丁”式優化轉向架構級創新,我們或許正站在通用人工智能(AGI)發展的關鍵轉折點。
未來AI的真正突破,或許不在于參數量的指數級膨脹,而在于能否像人類一樣,構建起對世界的深層理解。
來源:Business Insider,VentureBeat
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.