大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

Meta推出開源最新世界模型,運行速度是英偉達Cosmos的30倍

0
分享至

想象一下,當你的寵物狗看到你舉起網球準備投擲時,它會本能地預判球的落點并提前跑向那里,而不是傻傻地盯著你手中的球。

這種對物理世界的直覺理解,正是 AI 領域長期以來始終難以攻克的難題。

如今,Meta 推出了新的開源世界模型 V-JEPA 2 和三個新基準測試,希望借助它們的力量來改變這一點。模型和測試已開源在 GitHub 和 HuggingFace 上。


(來源:Meta)

所謂世界模型,就是專門來幫助 AI 智能體理解周圍世界,預測周遭狀況如何發展,并最終通過規劃自身行動來完成目標的模型。

這種能力在人類身上體現為直覺與預判:預測世界將如何回應我們的行為(或他人的行為),尤其是在規劃行動以及判斷如何應對新情況時。

世界模型已然成為 AI 領域聚焦的目標。李飛飛的 World Labs 、谷歌的 DeepMind 都在開發類似的世界模型。

英偉達也開發了世界模型 Comos,而 Meta 表示,V-JEPA 2 的運行速度是英偉達 Cosmos 模型的 30 倍。

Meta 首席 AI 科學家楊立昆(Yann LeCun)表示:“我們相信世界模型將開啟機器人技術的新時代,使現實世界的 AI 代理能夠幫助處理家務和物理任務,而無需天文數字般龐大的機器人訓練數據?!?/p>

V-JEPA 2 是去年發布的 V-JEPA 模型的升級版。它主要基于視頻進行訓練,擁有 12 億參數,采用自監督學習方法。它的英文全名是聯合嵌入預測架構(joint-embedding predictive architecture,縮寫即為 JEPA)。

V-JEPA 2 包含兩個主要組件:

一個是編碼器(encoder),它接收原始視頻并輸出嵌入(embeddings),以捕獲有關觀察世界狀態的有用語義信息。

另一個是預測器(predictor),它接收視頻嵌入和關于預測內容的額外上下文,并輸出預測的嵌入。




圖 | V-JEPA 2 架構(來源:Meta)

V-JEPA 2 的訓練過程則分為兩個階段:

在第一個預訓練階段,研究團隊使用了超過 100 萬小時的視頻和 100 萬張圖像。這些豐富的視覺數據幫助模型學習了世界運行的大量知識,包括人們如何與物體互動、物體如何在世界中運動,以及物體如何與其他物體互動。

Meta 發現,僅在預訓練階段后,模型就已經展現出了與理解和預測相關的關鍵能力。

在訓練的第二階段,Meta 專注于利用機器人數據來提升模型的規劃能力。他們向預測器提供動作信息,從而將這些數據整合到 JEPA 訓練流程中。在使用額外數據訓練后,預測器學會了在預測時考慮具體動作,然后可用于控制。

令人驚訝的是,這個階段并不需要大量的機器人數據。Meta 的技術報告顯示,僅使用 62 小時的機器人數據進行訓練,就足以產生一個可用于規劃和控制的模型。

在性能表現方面,V-JEPA 2 展現出了令人矚目的能力。在運動理解方面,該模型在 Something-Something v2 數據集上實現了 77.3% 的 top-1 準確率。


(來源:Meta)

在人類動作預期任務中,它在 Epic-Kitchens-100 數據集上達到了 39.7% 的 recall-at-5 分數,超越了現有所有任務特定模型。


(來源:Meta)

當 V-JEPA 2 與大語言模型對齊后,在多個視頻問答任務上展現了 80 億參數規模下的最先進性能。例如,在 PerceptionTest 上達到 84.0 分,在 TempCompass 上達到 76.9 分。


(來源:Meta)

為了更好地評估模型從視頻理解和推理物理世界的能力,Meta 還發布了三個新的基準測試:IntPhys 2、MVPBench 和 CausalVQA。

IntPhys 2 用于衡量模型區分場景是否符合物理學的能力,它是在 IntPhys 基準的基礎上擴展的。


(來源:Meta)

MVPBench 是通過選擇題來衡量視頻語言模型對物理(世界)的理解能力,防止模型依賴膚淺的線索“走錯誤的捷徑”。


(來源:Meta)

CausalVQA 則是衡量模型回答與物理因果關系有關問題的能力,包括反事實問題(如果……會發生什么)、預期問題(接下來可能會發生什么)以及規劃問題(為了實現目標,下一步應該采取什么行動)。


(來源:Meta)

三個測試對人類來說小菜一碟,在 84%-93% 之間,但 V-JEPA 2 等模型與人類表現之間仍存在顯著差距。

整體來看,V-JEPA 2 在 IntPhys 2 和 MVPBench 表現最好,Gemini 2.5 Flash 則在 CausalVQA 推理預測任務中表現最好。

值得注意的是,在三個測試中,阿里通義千問視覺語言模型 Qwen2.5-VL 的表現也比較亮眼。


(來源:Meta)

Meta 還展示了在全新環境中使用 V-JEPA 2 進行零樣本機器人規劃。他們在不同實驗室的 Franka 機械臂上零樣本部署 V-JEPA 2-AC(動作條件版本),實現了使用圖像目標進行規劃的物體拾取和放置。

這是在沒有從環境中的機器人收集任何數據,也沒有任何任務特定訓練或獎勵的情況下實現的,展示了從網絡數據和少量機器人交互數據中,自監督學習如何產生一個能夠在物理世界中規劃的世界模型。

最后,需要看到的是,V-JEPA 2 模型也存在局限性,比如預測動作時沒有使用攝像頭參數,依賴手動找到效果最好的攝像頭角度;誤差累積和搜索空間爆炸導致無法完成長時規劃任務。

接下來,Meta 團隊計劃探索多模態 JEPA 模型,通過多種感官進行預測,包括視覺、聽覺和觸覺等等。

參考資料:

https://ai.meta.com/blog/v-jepa-2-world-model-benchmarks/

https://github.com/facebookresearch/vjepa2

https://huggingface.co/collections/facebook/v-jepa-2-6841bad8413014e185b497a6

https://ai.meta.com/research/publications/v-jepa-2-self-supervised-video-models-enable-understanding-prediction-and-planning/

排版:劉雅坤

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
新一代機皇!新機官宣:7月份,即將發布!

新一代機皇!新機官宣:7月份,即將發布!

Q科技基地
2025-06-15 13:17:24
40歲健身網紅唐博濤離世,妻子透露原因,常年健身經常爬320層樓

40歲健身網紅唐博濤離世,妻子透露原因,常年健身經常爬320層樓

娛樂圈圈圓
2025-06-14 15:20:50
這是另外的價錢斯蒂芬森與霍華德超級大沖突 口角推搡抱摔!

這是另外的價錢斯蒂芬森與霍華德超級大沖突 口角推搡抱摔!

直播吧
2025-06-15 07:56:14
桃子大量上市,醫生提醒:桃子雖美味,但這3類人還是少吃為妙

桃子大量上市,醫生提醒:桃子雖美味,但這3類人還是少吃為妙

荷蘭豆愛健康
2025-06-15 13:44:19
你在部隊見過啥離譜事?網友:你媽媽人真好

你在部隊見過啥離譜事?網友:你媽媽人真好

解讀熱點事件
2025-06-15 00:05:03
20萬洲際導彈兵就位,1710枚核導彈高高豎起:孤軍奮戰又如何?

20萬洲際導彈兵就位,1710枚核導彈高高豎起:孤軍奮戰又如何?

陣匠
2025-06-13 01:25:17
60歲大爺:每天早起以晨跑為由和情人約會,被老婆發現后遭報應

60歲大爺:每天早起以晨跑為由和情人約會,被老婆發現后遭報應

熱心柚子姐姐
2025-06-14 16:06:13
馬英九:任何政治力量都無法阻斷兩岸中國人同根同源的自然情感

馬英九:任何政治力量都無法阻斷兩岸中國人同根同源的自然情感

海峽導報社
2025-06-15 11:47:02
全美震驚!明尼蘇達州眾議員遭暗殺滅門,幾天前剛投票取消非法移民免費醫保

全美震驚!明尼蘇達州眾議員遭暗殺滅門,幾天前剛投票取消非法移民免費醫保

大洛杉磯LA
2025-06-15 02:26:16
韓媒:中國男足選帥密切關注申臺龍,后者在亞洲范圍頗有影響力

韓媒:中國男足選帥密切關注申臺龍,后者在亞洲范圍頗有影響力

直播吧
2025-06-15 16:04:08
央視開播!36集掃黑大劇來了!張譯王勁松坐鎮,這尺度開播就封神

央視開播!36集掃黑大劇來了!張譯王勁松坐鎮,這尺度開播就封神

草本紀年
2025-06-15 13:00:39
廣州美女坐黑人男友懷里騎車兜風,不雅視頻流出,一畫面難以啟齒

廣州美女坐黑人男友懷里騎車兜風,不雅視頻流出,一畫面難以啟齒

博士觀察
2025-06-15 13:07:17
摩根大通上調“最壞情況概率”至17%:霍爾木茲海峽關閉,油價將升至120美元

摩根大通上調“最壞情況概率”至17%:霍爾木茲海峽關閉,油價將升至120美元

華爾街見聞官方
2025-06-15 10:48:18
我國5600余個姓氏中只有8個姓氏從未衰落,看一下有你的姓氏嗎?

我國5600余個姓氏中只有8個姓氏從未衰落,看一下有你的姓氏嗎?

老謝談史
2025-06-15 09:00:19
清華高顏值女孩父親回應女兒直播:暫時不同意,但支持大學生創業,不能盲目瞎搞

清華高顏值女孩父親回應女兒直播:暫時不同意,但支持大學生創業,不能盲目瞎搞

魯中晨報
2025-06-15 13:38:04
以軍放狠話挑釁中方,中式裝備亮相前線,局勢突變

以軍放狠話挑釁中方,中式裝備亮相前線,局勢突變

智觀科技
2025-06-11 12:11:06
章子怡千算萬算也沒想到,自己在上海電影節失策,短發慘遭滑鐵盧

章子怡千算萬算也沒想到,自己在上海電影節失策,短發慘遭滑鐵盧

TVB的四小花
2025-06-15 09:57:53
多名院士呼吁停止食用,比肥肉還傷血管,轉告父母,趁早撤下餐桌

多名院士呼吁停止食用,比肥肉還傷血管,轉告父母,趁早撤下餐桌

溫讀史
2025-06-14 11:49:31
網傳“女生萬象城遭挾持”,杭州上城警方通報

網傳“女生萬象城遭挾持”,杭州上城警方通報

環球網資訊
2025-06-14 18:57:23
女婿罵我老不死,我轉頭賣掉給女兒的5套學區房,女兒:媽做得對

女婿罵我老不死,我轉頭賣掉給女兒的5套學區房,女兒:媽做得對

風起青萍之未
2025-06-14 18:25:12
2025-06-15 17:31:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15294文章數 513783關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

清華高顏值女孩父親:不同意女兒直播 創業不能盲目瞎搞

頭條要聞

清華高顏值女孩父親:不同意女兒直播 創業不能盲目瞎搞

體育要聞

裁判可以噴,但也從步行者自身找找問題?

娛樂要聞

鳳凰傳奇曾毅塌房?網友:別連累玲花

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

教育
數碼
手機
藝術
公開課

教育要聞

對于地理視角的回顧:這道題的練習對于完成廣東高考綜合題第17題有幫助

數碼要聞

上海消費品以舊換新訂單量超 1100 萬筆,將繼續按全品類執行

手機要聞

華為鴻蒙 HarmonyOS 5.1 系統新增特性曝光

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 丰满岳妇乱一区二区三区| 中文字幕丰满乱孑伦无码专区| 国产午夜亚洲精品区| 无码中文字幕av免费放| 色吊丝永久性观看网站| 国产拍拍拍无遮挡免费| 国产精品vⅰdeoxxxx国产| 又湿又黄裸乳漫画无遮挡网站| av边做边流奶水无码免费| 国产av永久精品无码| 亚洲色在线无码国产精品不卡| 久久综合网欧美色妞网| 久久www色情成人免费观看| 日本高清无卡码一区二区久久| 亚洲熟女乱色综合亚洲图片| 国产一卡2卡3卡四卡国色天香| 天堂√最新版中文在线地址| 久久66热人妻偷产国产| 国产偷国产偷亚洲清高动态图| 闺蜜张开腿让我爽了一夜| 日本久久久久亚洲中字幕| 人妻饥渴偷公乱中文字幕| 国产精品白丝av网站| 亚洲中文字幕无码mv| 疯狂做受xxxx高潮不断| 欧美黑人添添高潮a片www| 丰满少妇69激情啪啪无| 无码欧精品亚洲日韩一区| 亚洲午夜国产成人av电影| 2018天天拍拍天天爽视频| 丰满少妇被猛烈进入高清播放| 中文成人无码精品久久久动漫| 国产精品乱子乱xxxx| 5x性社区免费视频播| 三级特黄60分钟在线观看| 99久久亚洲精品日本无码| 老司机精品视频一区二区| 偷窥日本少妇撒尿chinese| 亚洲性色成人av天堂| 久久激情五月丁香伊人| 麻豆国产96在线日韩麻豆|