大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

Meta推出開源最新世界模型,運行速度是英偉達Cosmos的30倍

0
分享至

想象一下,當你的寵物狗看到你舉起網球準備投擲時,它會本能地預判球的落點并提前跑向那里,而不是傻傻地盯著你手中的球。

這種對物理世界的直覺理解,正是 AI 領域長期以來始終難以攻克的難題。

如今,Meta 推出了新的開源世界模型 V-JEPA 2 和三個新基準測試,希望借助它們的力量來改變這一點。模型和測試已開源在 GitHub 和 HuggingFace 上。


(來源:Meta)

所謂世界模型,就是專門來幫助 AI 智能體理解周圍世界,預測周遭狀況如何發展,并最終通過規劃自身行動來完成目標的模型。

這種能力在人類身上體現為直覺與預判:預測世界將如何回應我們的行為(或他人的行為),尤其是在規劃行動以及判斷如何應對新情況時。

世界模型已然成為 AI 領域聚焦的目標。李飛飛的 World Labs 、谷歌的 DeepMind 都在開發類似的世界模型。

英偉達也開發了世界模型 Comos,而 Meta 表示,V-JEPA 2 的運行速度是英偉達 Cosmos 模型的 30 倍。

Meta 首席 AI 科學家楊立昆(Yann LeCun)表示:“我們相信世界模型將開啟機器人技術的新時代,使現實世界的 AI 代理能夠幫助處理家務和物理任務,而無需天文數字般龐大的機器人訓練數據。”

V-JEPA 2 是去年發布的 V-JEPA 模型的升級版。它主要基于視頻進行訓練,擁有 12 億參數,采用自監督學習方法。它的英文全名是聯合嵌入預測架構(joint-embedding predictive architecture,縮寫即為 JEPA)。

V-JEPA 2 包含兩個主要組件:

一個是編碼器(encoder),它接收原始視頻并輸出嵌入(embeddings),以捕獲有關觀察世界狀態的有用語義信息。

另一個是預測器(predictor),它接收視頻嵌入和關于預測內容的額外上下文,并輸出預測的嵌入。




圖 | V-JEPA 2 架構(來源:Meta)

V-JEPA 2 的訓練過程則分為兩個階段:

在第一個預訓練階段,研究團隊使用了超過 100 萬小時的視頻和 100 萬張圖像。這些豐富的視覺數據幫助模型學習了世界運行的大量知識,包括人們如何與物體互動、物體如何在世界中運動,以及物體如何與其他物體互動。

Meta 發現,僅在預訓練階段后,模型就已經展現出了與理解和預測相關的關鍵能力。

在訓練的第二階段,Meta 專注于利用機器人數據來提升模型的規劃能力。他們向預測器提供動作信息,從而將這些數據整合到 JEPA 訓練流程中。在使用額外數據訓練后,預測器學會了在預測時考慮具體動作,然后可用于控制。

令人驚訝的是,這個階段并不需要大量的機器人數據。Meta 的技術報告顯示,僅使用 62 小時的機器人數據進行訓練,就足以產生一個可用于規劃和控制的模型。

在性能表現方面,V-JEPA 2 展現出了令人矚目的能力。在運動理解方面,該模型在 Something-Something v2 數據集上實現了 77.3% 的 top-1 準確率。


(來源:Meta)

在人類動作預期任務中,它在 Epic-Kitchens-100 數據集上達到了 39.7% 的 recall-at-5 分數,超越了現有所有任務特定模型。


(來源:Meta)

當 V-JEPA 2 與大語言模型對齊后,在多個視頻問答任務上展現了 80 億參數規模下的最先進性能。例如,在 PerceptionTest 上達到 84.0 分,在 TempCompass 上達到 76.9 分。


(來源:Meta)

為了更好地評估模型從視頻理解和推理物理世界的能力,Meta 還發布了三個新的基準測試:IntPhys 2、MVPBench 和 CausalVQA。

IntPhys 2 用于衡量模型區分場景是否符合物理學的能力,它是在 IntPhys 基準的基礎上擴展的。


(來源:Meta)

MVPBench 是通過選擇題來衡量視頻語言模型對物理(世界)的理解能力,防止模型依賴膚淺的線索“走錯誤的捷徑”。


(來源:Meta)

CausalVQA 則是衡量模型回答與物理因果關系有關問題的能力,包括反事實問題(如果……會發生什么)、預期問題(接下來可能會發生什么)以及規劃問題(為了實現目標,下一步應該采取什么行動)。


(來源:Meta)

三個測試對人類來說小菜一碟,在 84%-93% 之間,但 V-JEPA 2 等模型與人類表現之間仍存在顯著差距。

整體來看,V-JEPA 2 在 IntPhys 2 和 MVPBench 表現最好,Gemini 2.5 Flash 則在 CausalVQA 推理預測任務中表現最好。

值得注意的是,在三個測試中,阿里通義千問視覺語言模型 Qwen2.5-VL 的表現也比較亮眼。


(來源:Meta)

Meta 還展示了在全新環境中使用 V-JEPA 2 進行零樣本機器人規劃。他們在不同實驗室的 Franka 機械臂上零樣本部署 V-JEPA 2-AC(動作條件版本),實現了使用圖像目標進行規劃的物體拾取和放置。

這是在沒有從環境中的機器人收集任何數據,也沒有任何任務特定訓練或獎勵的情況下實現的,展示了從網絡數據和少量機器人交互數據中,自監督學習如何產生一個能夠在物理世界中規劃的世界模型。

最后,需要看到的是,V-JEPA 2 模型也存在局限性,比如預測動作時沒有使用攝像頭參數,依賴手動找到效果最好的攝像頭角度;誤差累積和搜索空間爆炸導致無法完成長時規劃任務。

接下來,Meta 團隊計劃探索多模態 JEPA 模型,通過多種感官進行預測,包括視覺、聽覺和觸覺等等。

參考資料:

https://ai.meta.com/blog/v-jepa-2-world-model-benchmarks/

https://github.com/facebookresearch/vjepa2

https://huggingface.co/collections/facebook/v-jepa-2-6841bad8413014e185b497a6

https://ai.meta.com/research/publications/v-jepa-2-self-supervised-video-models-enable-understanding-prediction-and-planning/

排版:劉雅坤

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
專家預言:“伊朗半小時滅掉以色列”

專家預言:“伊朗半小時滅掉以色列”

難得君
2025-06-14 20:24:25
原來劉強東老婆現實中長這樣,身材有點干癟。

原來劉強東老婆現實中長這樣,身材有點干癟。

情感大頭說說
2025-06-14 03:14:08
湖北一縣政協主席任上被查!曾任紀委書記

湖北一縣政協主席任上被查!曾任紀委書記

瀟湘晨報
2025-06-15 09:52:10
今年11月起,中國公民持有效澳大利亞簽證可免簽入境新西蘭

今年11月起,中國公民持有效澳大利亞簽證可免簽入境新西蘭

界面新聞
2025-06-15 09:39:47
以色列國家安全總局局長巴爾宣布辭職

以色列國家安全總局局長巴爾宣布辭職

新京報
2025-06-15 07:30:02
啪啪打臉!買房圖便宜后悔了,深圳一樓盤業主掛“吵”字橫幅抗議

啪啪打臉!買房圖便宜后悔了,深圳一樓盤業主掛“吵”字橫幅抗議

火山詩話
2025-06-15 06:07:29
梅西的影響力?世俱杯首戰上座觀眾人數:60927人

梅西的影響力?世俱杯首戰上座觀眾人數:60927人

雷速體育
2025-06-15 10:03:27
國家級健身教練唐博濤去世,僅37歲,滿身肌肉很健碩,死因疑曝光

國家級健身教練唐博濤去世,僅37歲,滿身肌肉很健碩,死因疑曝光

180視角
2025-06-14 12:20:45
已確認!是知名演員朱一龍!

已確認!是知名演員朱一龍!

掌中邯鄲
2025-06-15 07:04:44
局勢突變!中國深夜發出警告,俄羅斯聲明立即結束會談!

局勢突變!中國深夜發出警告,俄羅斯聲明立即結束會談!

一個有靈魂的作者
2025-06-14 22:17:44
伊朗不再藏后手,2000枚導彈已搬上發射架?以色列領導層經不起炸

伊朗不再藏后手,2000枚導彈已搬上發射架?以色列領導層經不起炸

梁訊
2025-06-15 09:10:07
設計院被舉報使用盜版CAD,被一鍋端!

設計院被舉報使用盜版CAD,被一鍋端!

黯泉
2025-06-14 22:10:35
李連杰宣布跟41歲兒子父親節重聚,久別30年攬實眼濕濕

李連杰宣布跟41歲兒子父親節重聚,久別30年攬實眼濕濕

快樂的小青瓦
2025-06-14 15:03:39
上海專家發現:吃甜食的老人,健康指數是吃蔬菜的人的5倍不止?

上海專家發現:吃甜食的老人,健康指數是吃蔬菜的人的5倍不止?

華庭講美食
2025-06-14 13:52:03
印度曝光!中印在藏南交火,中國軍人一個動作感動14億國人

印度曝光!中印在藏南交火,中國軍人一個動作感動14億國人

Ck的蜜糖
2025-06-15 01:51:14
恥辱!香港運動員奪冠拒唱國歌,這樣的運動員不止一個

恥辱!香港運動員奪冠拒唱國歌,這樣的運動員不止一個

柳絮憶史
2025-06-14 07:10:03
18月齡幼童被飯店客人灌50毫升啤酒,面部浮腫、身體多處皮疹!律師回應

18月齡幼童被飯店客人灌50毫升啤酒,面部浮腫、身體多處皮疹!律師回應

極目新聞
2025-06-14 10:41:22
63歲吳鎮宇新造型絕了,沒有老人味還越來越年輕了,至少年輕30歲

63歲吳鎮宇新造型絕了,沒有老人味還越來越年輕了,至少年輕30歲

手工制作阿殲
2025-06-15 08:44:14
突發!蒼井空確認復出,你最希望看到她的什么?

突發!蒼井空確認復出,你最希望看到她的什么?

閑侃閑侃
2025-06-15 07:16:55
1-2!鄭欽文輸球內情曝光,賽后眼眶含淚,對手采訪說到了關鍵

1-2!鄭欽文輸球內情曝光,賽后眼眶含淚,對手采訪說到了關鍵

侃球熊弟
2025-06-15 00:02:53
2025-06-15 10:56:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15294文章數 513782關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

體育要聞

約戰天王山,步行者G4輸在了哪?

娛樂要聞

鳳凰傳奇曾毅塌房?網友:別連累玲花

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

房產
藝術
健康
時尚
軍事航空

房產要聞

又一城購房補貼!買房就發錢,正在海南樓市瘋狂擴散!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

呼吸科專家破解呼吸道九大謠言!

夏天最值得入手的6件單品,全在這了

軍事要聞

伊媒:以色列國防部大樓被伊朗導彈擊中

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产久青青青青在线观看| 亚洲 小说 欧美 激情 另类| 波多野结衣办公室双飞| 美女扒开屁股让男人桶| 欧美伊香蕉久久综合网另类| 精品少妇无码av在线播放| 国产成人无码a区视频在线观看| 亚洲狠狠色丁香婷婷综合| 日韩精品一区二区三区中文| 国产午夜福利在线观看视频_| 亚洲欧美黑人深喉猛交群| 亚洲人成网线在线播放va| 无码人妻h动漫网站| 国产又色又爽又黄的在线观看| 无码av岛国片在线播放| 国自产偷精品不卡在线| 亚洲高清中文字幕在线看不卡| 日韩人妻无码一区二区三区久久| 亚洲亚洲精品av在线动态图| 香蕉久久夜色精品升级完成| 久久久精品94久久精品| 精品国产v无码大片在线看| 琪琪女色窝窝777777| 大又大粗又爽又黄少妇毛片| 亚洲一区二区三区av在线观看| 国产三级a在线观看| 午夜国产免费视频亚洲| 成人做爰视频www| 老女老肥熟国产在线视频| 少妇夜夜春夜夜爽试看视频| 啦啦啦www播放日本观看| 中文字幕av久久一区二区| 最新亚洲人成无码网www电影| 亚洲精品宾馆在线精品酒店| 久久婷婷色综合一区二区| 老熟妇乱子交视频一区| 国产亚洲av无码av男人的天堂| 日本又黄又爽gif动态图| 亚洲欧美日韩综合在线丁香| 亚洲午夜精品a片久久www慈禧| 一区二区三区在线 | 日本|