大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

LeCun世界模型出2代了!62小時(shí)搞定機(jī)器人訓(xùn)練開啟物理推理新時(shí)代

0
分享至

聞樂 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

物理學(xué)正在走向人工智能——

Meta開源發(fā)布V-JEPA 2世界模型:一個(gè)能像人類一樣理解物理世界的AI模型。



圖靈獎(jiǎng)得主、Meta首席AI科學(xué)家Yann LeCun親自出鏡宣傳,并稱:

我們相信世界模型將為機(jī)器人技術(shù)帶來一個(gè)新時(shí)代,使現(xiàn)實(shí)世界中的AI智能體能夠在不需要大量機(jī)器人訓(xùn)練數(shù)據(jù)的情況下幫助完成家務(wù)和體力任務(wù)。



那什么是世界模型呢?

簡單說,就是能夠?qū)φ鎸?shí)物理世界做出反應(yīng)的AI模型。

它應(yīng)該具備以下幾種能力:

  • 理解:世界模型應(yīng)該能夠理解世界的觀察,包括識別視頻中物體、動(dòng)作和運(yùn)動(dòng)等事物。
  • 預(yù)測:一個(gè)世界模型應(yīng)該能夠預(yù)測世界將如何演變,以及如果智能體采取行動(dòng),世界將如何變化。
  • 規(guī)劃:基于預(yù)測能力,世界模型應(yīng)能用于規(guī)劃實(shí)現(xiàn)給定目標(biāo)的行動(dòng)序列。

V-JEPA 2(Meta Video Joint Embedding Predictive Architecture 2 )是首個(gè)基于視頻訓(xùn)練的世界模型(視頻是關(guān)于世界信息豐富且易于獲取的來源)

它提升了動(dòng)作預(yù)測和物理世界建模能力,能夠用于在新環(huán)境中進(jìn)行零樣本規(guī)劃機(jī)器人控制



V-JEPA 2一發(fā)布就引起了一片好評,甚至有網(wǎng)友表示:這是機(jī)器人領(lǐng)域的革命性突破!





62小時(shí)訓(xùn)練即可生成規(guī)劃控制模型

V-JEPA 2采用自監(jiān)督學(xué)習(xí)框架,利用超過100萬小時(shí)的互聯(lián)網(wǎng)視頻和圖像數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,不依賴語言監(jiān)督,證明純視覺自監(jiān)督學(xué)習(xí)可以達(dá)到頂尖表現(xiàn)。



上圖清晰地展示了如何從大規(guī)模視頻數(shù)據(jù)預(yù)訓(xùn)練到多樣化下游任務(wù)的全過程:

輸入數(shù)據(jù):利用100萬小時(shí)互聯(lián)網(wǎng)視頻和100萬圖片進(jìn)行預(yù)訓(xùn)練。

訓(xùn)練過程:使用視覺掩碼去噪目標(biāo)進(jìn)行視頻預(yù)訓(xùn)練。

下游應(yīng)用分為三類:

  • 理解與預(yù)測:行為分類、物體識別、行為預(yù)測;
  • 語言對齊:通過與LLM對齊實(shí)現(xiàn)視頻問答能力;
  • 規(guī)劃:通過后訓(xùn)練行動(dòng)條件模型(V-JEPA 2-AC)實(shí)現(xiàn)機(jī)器人操作。

V-JEPA 2采用聯(lián)合嵌入預(yù)測架構(gòu)(JEPA),主要包含兩個(gè)組件:編碼器預(yù)測器

編碼器接收原始視頻并輸出能夠捕捉有關(guān)觀察世界狀態(tài)的語義信息的嵌入。

預(yù)測器接收視頻嵌入以及關(guān)于要預(yù)測的額外上下文,并輸出預(yù)測的嵌入。





研究團(tuán)隊(duì)用視頻進(jìn)行自監(jiān)督學(xué)習(xí)來訓(xùn)練V-JEPA 2,這就能夠在無需額外人工標(biāo)注的情況下進(jìn)行視頻訓(xùn)練。

V-JEPA 2的訓(xùn)練涉及兩個(gè)階段:先是無動(dòng)作預(yù)訓(xùn)練(下圖左側(cè)),然后是額外的動(dòng)作條件訓(xùn)練(下圖右側(cè))。



經(jīng)過訓(xùn)練后,V-JEPA 2在運(yùn)動(dòng)理解方面取得了優(yōu)異性能(在Something-Something v2上達(dá)到77.3的 top-1準(zhǔn)確率),并在人類動(dòng)作預(yù)測方面達(dá)到了當(dāng)前最佳水平(在Epic-Kitchens-100上達(dá)到39.7的recall-at-5),超越了以往的任務(wù)特定模型。





此外,在將V-JEPA 2與大型語言模型對齊后,團(tuán)隊(duì)在8B參數(shù)規(guī)模下多個(gè)視頻問答任務(wù)中展示了當(dāng)前最佳性能(例如,在PerceptionTest上達(dá)到84.0,在TempCompass上達(dá)到76.9)。



對于短期任務(wù),例如拾取或放置物體,團(tuán)隊(duì)以圖像的形式指定目標(biāo)。

使用V-JEPA 2編碼器獲取當(dāng)前狀態(tài)和目標(biāo)狀態(tài)的嵌入。

從其觀察到的當(dāng)前狀態(tài)開始,機(jī)器人通過使用預(yù)測器來想象采取一系列候選動(dòng)作的后果,并根據(jù)它們接近目標(biāo)的速度對候選動(dòng)作進(jìn)行評分。

在每個(gè)時(shí)間步,機(jī)器人通過模型預(yù)測控制重新規(guī)劃并執(zhí)行朝向該目標(biāo)的最高評分的下一個(gè)動(dòng)作。

對于更長期的任務(wù),例如拾取物體并將其放置在正確的位置,指定一系列機(jī)器人試圖按順序?qū)崿F(xiàn)的視覺子目標(biāo),類似于人類觀察到的視覺模仿學(xué)習(xí)。

通過這些視覺子目標(biāo),V-JEPA 2在新的和未見過的環(huán)境中拾取并放置新物體時(shí),成功率達(dá)到65%–80%。



物理理解新基準(zhǔn)

Meta還發(fā)布了三個(gè)新的基準(zhǔn)測試,用于評估現(xiàn)有模型從視頻中理解和推理物理世界的能力

雖然人類在所有三個(gè)基準(zhǔn)測試中表現(xiàn)良好(準(zhǔn)確率85%–95%),但人類表現(xiàn)與包括V-JEPA 2在內(nèi)的頂級模型之間存在明顯差距,這表明模型需要改進(jìn)的重要方向。

IntPhys 2是專門設(shè)計(jì)用來衡量模型區(qū)分物理上可能和不可能場景的能力,并在早期的IntPhys基準(zhǔn)測試基礎(chǔ)上進(jìn)行構(gòu)建和擴(kuò)展。

團(tuán)隊(duì)通過一個(gè)游戲引擎生成視頻對,其中兩個(gè)視頻在某個(gè)點(diǎn)之前完全相同,然后其中一個(gè)視頻發(fā)生物理破壞事件。

模型必須識別出哪個(gè)視頻發(fā)生了物理破壞事件。

雖然人類在這一任務(wù)上在多種場景和條件下幾乎達(dá)到完美準(zhǔn)確率,但當(dāng)前的視頻模型處于或接近隨機(jī)水平。



Minimal Video Pairs (MVPBench)通過多項(xiàng)選擇題測量視頻語言模型的物理理解能力。

旨在減輕視頻語言模型中常見的捷徑解決方案,例如依賴表面視覺或文本線索以及偏見。

MVPBench中的每個(gè)示例都有一個(gè)最小變化對:一個(gè)視覺上相似的視頻,以及相同的問題但答案相反。

為了獲得一個(gè)示例的分?jǐn)?shù),模型必須正確回答其最小變化對。



CausalVQA測量視頻語言模型回答與物理因果關(guān)系相關(guān)問題的能力。

該基準(zhǔn)旨在專注于物理世界視頻中的因果關(guān)系理解,包括反事實(shí)(如果……會發(fā)生什么)、預(yù)期(接下來可能發(fā)生什么)和計(jì)劃(為了實(shí)現(xiàn)目標(biāo)下一步應(yīng)該采取什么行動(dòng))相關(guān)的問題。

雖然大型多模態(tài)模型在回答視頻中“發(fā)生了什么”的問題方面能力越來越強(qiáng),但在回答“可能發(fā)生了什么”和“接下來可能發(fā)生什么”的問題時(shí)仍然存在困難。

這表明在給定行動(dòng)和事件空間的情況下,預(yù)測物理世界可能如何演變方面,與人類表現(xiàn)存在巨大差距。



One More Thing

Meta還透露了公司在通往高級機(jī)器智能之路上的下一步計(jì)劃。

目前,V-JEPA 2只能在單一時(shí)間尺度上學(xué)習(xí)和進(jìn)行預(yù)測。

然而,許多任務(wù)需要跨多個(gè)時(shí)間尺度的規(guī)劃。

所以一個(gè)重要的方向是發(fā)展專注于訓(xùn)練能夠在多個(gè)時(shí)間和空間尺度上學(xué)習(xí)、推理和規(guī)劃的分層次JEPA模型。

另一個(gè)重要的方向是多模態(tài)JEPA模型,這些模型能夠使用多種感官(包括視覺、音頻和觸覺)進(jìn)行預(yù)測。

項(xiàng)目地址:
GitHub:https://github.com/facebookresearch/vjepa2
Hugging Face:https://huggingface.co/collections/facebook/v-jepa-2-6841bad8413014e185b497a6


[1]https://ai.meta.com/blog/v-jepa-2-world-model-benchmarks/
[2]https://x.com/AIatMeta/status/1932808881627148450
[3]https://ai.meta.com/research/publications/v-jepa-2-self-supervised-video-models-enable-understanding-prediction-and-planning/

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鄭欽文1-2出局,無緣倫敦站決賽!仍獲56萬獎(jiǎng)金,輸球原因揭曉

鄭欽文1-2出局,無緣倫敦站決賽!仍獲56萬獎(jiǎng)金,輸球原因揭曉

小火箭愛體育
2025-06-15 01:09:17
顛覆認(rèn)知!男優(yōu)嚴(yán)選「最想合作」女優(yōu)紅黑榜揭曉 (2)

顛覆認(rèn)知!男優(yōu)嚴(yán)選「最想合作」女優(yōu)紅黑榜揭曉 (2)

TVB的四小花
2025-06-15 05:56:17
95年等待終結(jié)!安切洛蒂讓巴西覺醒,2026世界杯冠軍已在囊中?

95年等待終結(jié)!安切洛蒂讓巴西覺醒,2026世界杯冠軍已在囊中?

去山野間追風(fēng)
2025-06-15 06:06:39
剛剛!泡泡瑪特宣布:暫停銷售!

剛剛!泡泡瑪特宣布:暫停銷售!

證券時(shí)報(bào)
2025-06-14 21:17:21
中國社會內(nèi)卷的真正原因!(深度好文)

中國社會內(nèi)卷的真正原因!(深度好文)

霹靂炮
2025-06-09 22:16:09
拉杜卡努:我和鄭欽文青少年時(shí)期就認(rèn)識了;我們走的路不一樣

拉杜卡努:我和鄭欽文青少年時(shí)期就認(rèn)識了;我們走的路不一樣

懂球帝
2025-06-15 01:13:10
國家動(dòng)真格?刺激買房無效后,黃奇帆提“好方案”,獲得網(wǎng)友支持

國家動(dòng)真格?刺激買房無效后,黃奇帆提“好方案”,獲得網(wǎng)友支持

墜入二次元的海洋
2025-06-15 05:46:15
下一個(gè)鄭欽文!10后中國小花崛起,連贏7場進(jìn)決賽創(chuàng)造歷史

下一個(gè)鄭欽文!10后中國小花崛起,連贏7場進(jìn)決賽創(chuàng)造歷史

全景體育V
2025-06-14 19:41:12
退休10年后被徹查,71歲崔國潮,被開除黨籍!

退休10年后被徹查,71歲崔國潮,被開除黨籍!

五月的書房
2025-06-10 15:50:46
是福是禍?中國2億老人混吃等死,陷入“廢物式”養(yǎng)老怪圈

是福是禍?中國2億老人混吃等死,陷入“廢物式”養(yǎng)老怪圈

訪史
2025-06-13 18:22:57
全市停辦!東莞公安最新通告

全市停辦!東莞公安最新通告

東莞紀(jì)實(shí)
2025-06-14 18:57:47
以色列軍方:已確認(rèn)伊朗在生產(chǎn)核彈的武器零部件方面取得具體進(jìn)展,表明伊朗政權(quán)正在接近無法回頭的地步

以色列軍方:已確認(rèn)伊朗在生產(chǎn)核彈的武器零部件方面取得具體進(jìn)展,表明伊朗政權(quán)正在接近無法回頭的地步

和訊網(wǎng)
2025-06-13 12:01:03
風(fēng)仍在吹:內(nèi)伊說要終結(jié)以色列政權(quán),但結(jié)果即便神權(quán)保住也···

風(fēng)仍在吹:內(nèi)伊說要終結(jié)以色列政權(quán),但結(jié)果即便神權(quán)保住也···

邵旭峰域
2025-06-14 12:12:16
特朗普提交其任內(nèi)首份公開財(cái)務(wù)披露報(bào)告:持股加密貨幣平臺獲超5700萬美元收益,234頁報(bào)告有145頁為股票債券投資記錄!

特朗普提交其任內(nèi)首份公開財(cái)務(wù)披露報(bào)告:持股加密貨幣平臺獲超5700萬美元收益,234頁報(bào)告有145頁為股票債券投資記錄!

每日經(jīng)濟(jì)新聞
2025-06-14 14:29:23
官宣!李月汝正式交易!中國女籃迎三好消息,打日本隊(duì)兩大殺手锏

官宣!李月汝正式交易!中國女籃迎三好消息,打日本隊(duì)兩大殺手锏

老吳說體育
2025-06-15 00:18:57
臺獨(dú)急先鋒賴清德突然改口:兩岸可以統(tǒng)一,國臺辦一句話讓其啞火

臺獨(dú)急先鋒賴清德突然改口:兩岸可以統(tǒng)一,國臺辦一句話讓其啞火

藍(lán)色海邊
2025-06-14 21:53:27
惡魔醫(yī)生劉翔峰,罪行累累,喪心病狂!

惡魔醫(yī)生劉翔峰,罪行累累,喪心病狂!

燕梳樓頻道
2025-06-12 22:49:14
現(xiàn)身邁阿密,Speed身穿C羅T恤觀戰(zhàn)世俱杯揭幕戰(zhàn)

現(xiàn)身邁阿密,Speed身穿C羅T恤觀戰(zhàn)世俱杯揭幕戰(zhàn)

懂球帝
2025-06-15 08:29:12
絲路古道煥新機(jī)

絲路古道煥新機(jī)

新華社
2025-06-13 13:31:36
羅馬仕發(fā)布公開聲明致歉

羅馬仕發(fā)布公開聲明致歉

最江陰
2025-06-14 21:27:30
2025-06-15 08:43:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
10666文章數(shù) 176167關(guān)注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴(yán)重缺貨

頭條要聞

伊朗近200枚導(dǎo)彈飛以色列 哈梅內(nèi)伊重要顧問傷重離世

頭條要聞

伊朗近200枚導(dǎo)彈飛以色列 哈梅內(nèi)伊重要顧問傷重離世

體育要聞

約戰(zhàn)天王山,步行者G4輸在了哪?

娛樂要聞

小S迎47歲生日,首個(gè)生日沒大S陪伴

財(cái)經(jīng)要聞

以伊沖突持續(xù)升級,對全球市場影響多大

汽車要聞

長城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

旅游
時(shí)尚
本地
房產(chǎn)
教育

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

夏天最值得入手的6件單品,全在這了

本地新聞

最近的打工人,都在熬夜看這劇逐幀學(xué)習(xí)職場小技巧

房產(chǎn)要聞

又一城購房補(bǔ)貼!買房就發(fā)錢,正在海南樓市瘋狂擴(kuò)散!

教育要聞

老師深夜邀約之謎:老師在群里要求四位家長,帶著撲克晚九點(diǎn)到校

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 加勒比无码人妻东京热| 亚洲乱码日产精品bd| 色综合无码av网站| 丰满无码人妻热妇无码区| 国内精品久久久久影院亚瑟| 久久av在线影院| 免费99精品国产人妻自在现线| 日韩av无码一区二区三区不卡| 亚洲熟女乱综合一区二区| 成人免费视频?国产免费| 欧美人与动牲交a免费观看| 国产无套乱子伦精彩是白视频| 男男跪床??被?视频| 国产亚洲精品电影网站在线观看| 粉嫩少妇内射浓精videos| 久久99亚洲精品久久69| 成人亚洲性情网站www在线观看| 国产精品美女久久久免费| 国产亚洲精品久久一区二区三区| 久久精品www人人爽人人| 国产精品福利自产拍久久| 国产午夜免费高清久久影院| 亚洲熟妇无码av不卡在线播放| 无码区日韩特区永久免费系列| 野花社区在线观看视频| 夜夜高潮次次欢爽av女| 午夜无码区在线观看亚洲| 四虎影视88aa久久人妻| 少妇高潮喷水久久久影院| 日韩亚洲欧美久久久www综合| 一道久久爱综合久久爱| 伊人久久亚洲精品一区| 日韩人妻一区二区三区免费| 亚洲香蕉成人av网站在线观看| ,亚洲AV午夜精品无码专区| 久久老子午夜精品无码| 在线播放亚洲人成电影| 97在线无码免费人妻短视频| 久久精品国产亚洲不av麻豆| 国产成人精品午夜福利在线播放| 亚洲精品久久无码av片软件|