大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

比離散擴(kuò)散更通用,首個(gè)純Discrete Flow Matching多模態(tài)巨獸降臨

0
分享至



王勁,香港大學(xué)計(jì)算機(jī)系二年級(jí)博士生,導(dǎo)師為羅平老師。研究興趣包括多模態(tài)大模型訓(xùn)練與評(píng)測(cè)、偽造檢測(cè)等,有多項(xiàng)工作發(fā)表于 ICML、CVPR、ICCV、ECCV 等國(guó)際學(xué)術(shù)會(huì)議。

近年來,大型語言模型(LLMs)在多模態(tài)任務(wù)中取得了顯著進(jìn)展,在人工通用智能(AGI)的兩大核心支柱(即理解與生成)方面展現(xiàn)出強(qiáng)大潛力。然而,目前大多數(shù)多模態(tài)大模型仍采用自回歸(Autoregressive, AR)架構(gòu),通過從左到右逐步處理多模態(tài) token 來完成任務(wù),推理缺乏靈活性。

與此同時(shí),基于掩碼的離散擴(kuò)散模型憑借雙向建模能力也逐漸興起,該架構(gòu)通過雙向信息建模顯著提升了模型的建模能力。例如,DeepMind 的 Gemini Diffusion 驗(yàn)證了離散擴(kuò)散在文本建模領(lǐng)域的潛力;在開源社區(qū),LLaDA、Dream 等擴(kuò)散式大語言模型(dLLM)也催生了如 MMaDA、LaViDA、Dimple 和 LLaDA-V 等多模態(tài)模型。基于掩碼(mask)離散擴(kuò)散為多模態(tài)任務(wù)提供了一種重要的建模范式。

然而,生成模型的實(shí)現(xiàn)方式并不局限于上述兩類架構(gòu),探索新的生成建模范式對(duì)于推動(dòng)多模態(tài)模型的發(fā)展同樣具有重要意義。

基于這一理念,來自香港大學(xué)和華為諾亞方舟實(shí)驗(yàn)室的研究團(tuán)隊(duì)提出了FUDOKI,一個(gè)基于全新非掩碼(mask-free)離散流匹配(Discrete Flow Matching)架構(gòu)的通用多模態(tài)模型。

與傳統(tǒng)的自回歸方法不同,F(xiàn)UDOKI 通過并行去噪機(jī)制實(shí)現(xiàn)了高效的雙向信息整合,顯著提升了模型的復(fù)雜推理和生成能力。與離散擴(kuò)散架構(gòu)相比,F(xiàn)UDOKI 采用更加通用的概率路徑建模框架,從均勻分布出發(fā),允許模型在推理過程中不斷更新和修正生成結(jié)果,為多模態(tài)模型打開了一條嶄新的技術(shù)路徑。



  • 論文標(biāo)題:FUDOKI: Discrete Flow-based Unified Understanding and Generation via Kinetic-Optimal Velocities
  • 論文鏈接:https://arxiv.org/abs/2505.20147
  • 項(xiàng)目主頁(yè):https://fudoki-hku.github.io/

FUDOKI 的核心亮點(diǎn)包括如下:

  • 統(tǒng)一架構(gòu):一套簡(jiǎn)單直觀的框架搞定圖像生成與文本理解
  • 徹底去掩碼:無需掩碼(mask)策略,與 mask-based discrete diffusion 相比更通用
  • 支持動(dòng)態(tài)修正:生成過程可實(shí)時(shí)調(diào)整,更接近人類推理方式
  • 性能對(duì)標(biāo) / 超越同參數(shù) AR 模型(在 GenEval & 多模態(tài) QA 上有實(shí)測(cè))

我們先來看以下兩個(gè)效果展示:



圖片生成



圖片理解

在社媒上,F(xiàn)UDOKI 獲得了Meta Research Scientist/ Discrete Flow Matching 系列作者推薦:



統(tǒng)一的多模態(tài)能力

FUDOKI 對(duì)文本模態(tài)和圖像模態(tài)均采用通過統(tǒng)一的離散流匹配框架,實(shí)現(xiàn)了理解與生成任務(wù)的統(tǒng)一建模。

  • 圖像生成:文本到圖像生成任務(wù)上在 GenEval 基準(zhǔn)上達(dá)到 0.76,超過現(xiàn)有同尺寸 AR 模型的性能,展現(xiàn)出色的生成質(zhì)量和語義準(zhǔn)確性



文生圖樣例



GenEval 基準(zhǔn)評(píng)測(cè)結(jié)果



離散流生成過程

  • 視覺理解:在多模理解任務(wù)上接近同參數(shù)量 AR 模型的性能水平,并允許模型在推理過程不斷修復(fù)回答。



視覺理解樣例



視覺理解基準(zhǔn)評(píng)測(cè)



視覺理解案例的過程對(duì)比,F(xiàn)UDOKI 允許對(duì)已生成的回答進(jìn)行修正

架構(gòu)特色

FUDOKI 的核心創(chuàng)新在于將多模態(tài)建模統(tǒng)一到離散流匹配框架中。具體而言,F(xiàn)UDOKI 采用度量誘導(dǎo)的概率路徑(metric-induced probability paths)和動(dòng)力學(xué)最優(yōu)速度(kinetic optimal velocities),完成從源分布到目標(biāo)分布的離散流匹配。



結(jié)語

FUDOKI 的提出不僅挑戰(zhàn)了現(xiàn)有自回歸和掩碼擴(kuò)散范式,也為多模態(tài)生成與理解的統(tǒng)一架構(gòu)帶來了新的思路。通過離散流匹配的方法,它為通用人工智能的發(fā)展提供了更加靈活和高效的技術(shù)基礎(chǔ)。我們期待未來會(huì)有更多的探索和進(jìn)展。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
噩耗!國(guó)家級(jí)健身教練唐博濤去世,僅40歲滿身腱子肉,死因惹猜疑

噩耗!國(guó)家級(jí)健身教練唐博濤去世,僅40歲滿身腱子肉,死因惹猜疑

南南說娛
2025-06-14 14:44:25
蔡崇信:DeepSeek取得突破后,阿里員工春節(jié)期間加班加點(diǎn)趕AI

蔡崇信:DeepSeek取得突破后,阿里員工春節(jié)期間加班加點(diǎn)趕AI

獵云網(wǎng)
2025-06-13 10:38:13
退休老人商場(chǎng)打碎茅臺(tái)賠25萬,笑著付款轉(zhuǎn)身就走,老板:壞了快追

退休老人商場(chǎng)打碎茅臺(tái)賠25萬,笑著付款轉(zhuǎn)身就走,老板:壞了快追

秋風(fēng)專欄
2025-06-06 11:28:19
我國(guó)最大燃機(jī)完成吊裝 計(jì)劃2025年底投產(chǎn)

我國(guó)最大燃機(jī)完成吊裝 計(jì)劃2025年底投產(chǎn)

財(cái)聯(lián)社
2025-06-14 17:31:08
凌晨四點(diǎn)多,惠州博羅一棟3層的大別墅拍賣,被人撿漏148萬就買下

凌晨四點(diǎn)多,惠州博羅一棟3層的大別墅拍賣,被人撿漏148萬就買下

天天話事
2025-06-15 09:56:05
太開放了!凌晨2點(diǎn)多,老外帶07年女孩打車約會(huì),被司機(jī)成功制止

太開放了!凌晨2點(diǎn)多,老外帶07年女孩打車約會(huì),被司機(jī)成功制止

火山詩(shī)話
2025-06-14 07:08:28
不出意外,接下來3個(gè)月,A股會(huì)復(fù)“924行情”了

不出意外,接下來3個(gè)月,A股會(huì)復(fù)“924行情”了

郭小凡財(cái)經(jīng)
2025-06-15 11:50:23
魔獸芬森BIG3賽場(chǎng)互毆!兩人扭打在一起摔進(jìn)觀眾席:雙雙被驅(qū)逐

魔獸芬森BIG3賽場(chǎng)互毆!兩人扭打在一起摔進(jìn)觀眾席:雙雙被驅(qū)逐

羅說NBA
2025-06-15 07:19:31
伊朗發(fā)動(dòng)打擊 以色列進(jìn)入“前所未有緊急狀態(tài)”

伊朗發(fā)動(dòng)打擊 以色列進(jìn)入“前所未有緊急狀態(tài)”

看看新聞Knews
2025-06-15 12:29:49
王中磊摟腰馬筱梅風(fēng)波升級(jí),男方更多過往被扒,還牽連霍思燕!

王中磊摟腰馬筱梅風(fēng)波升級(jí),男方更多過往被扒,還牽連霍思燕!

古希臘掌管月桂的神
2025-06-15 09:35:20
火藥味拉滿喬丹-克勞福德將手指插入師弟鼻子 后者揮拳反擊!

火藥味拉滿喬丹-克勞福德將手指插入師弟鼻子 后者揮拳反擊!

直播吧
2025-06-15 08:16:46
以突襲伊朗當(dāng)晚,五角大樓“披薩定律”生效,以官員:襲擊前美以“唱雙簧”欺騙伊朗

以突襲伊朗當(dāng)晚,五角大樓“披薩定律”生效,以官員:襲擊前美以“唱雙簧”欺騙伊朗

紅星新聞
2025-06-14 15:02:14
無需催生!中國(guó)最愿意生孩子的省,連續(xù)六年全國(guó)第一,根本不用催

無需催生!中國(guó)最愿意生孩子的省,連續(xù)六年全國(guó)第一,根本不用催

青眼財(cái)經(jīng)
2025-06-13 13:05:29
《醬園弄》首播評(píng)價(jià)來了!楊冪成功上桌,趙麗穎臺(tái)詞惹爭(zhēng)議!

《醬園弄》首播評(píng)價(jià)來了!楊冪成功上桌,趙麗穎臺(tái)詞惹爭(zhēng)議!

古希臘掌管月桂的神
2025-06-15 11:30:00
以色列暗殺胡塞武裝高層失敗!“吃過中藥”的胡塞,如此能打?

以色列暗殺胡塞武裝高層失敗!“吃過中藥”的胡塞,如此能打?

鐵血米爾
2025-06-15 12:49:58
上海63歲阿姨未婚未育,尋找40年前的空軍戀人,見到他后淚流滿面

上海63歲阿姨未婚未育,尋找40年前的空軍戀人,見到他后淚流滿面

夜闌故事集
2025-06-10 14:10:02
比汪小菲還慘?王思聰突傳噩耗,他也走上了父親王健林老路

比汪小菲還慘?王思聰突傳噩耗,他也走上了父親王健林老路

小新說娛
2025-06-13 18:17:41
6月15日,券商給予評(píng)級(jí)并且給出目標(biāo)價(jià)的公司一覽

6月15日,券商給予評(píng)級(jí)并且給出目標(biāo)價(jià)的公司一覽

A股數(shù)據(jù)表
2025-06-15 05:55:03
燃油車天要塌了!國(guó)產(chǎn)固態(tài)電池宣布量產(chǎn),充電6分鐘跑1000km

燃油車天要塌了!國(guó)產(chǎn)固態(tài)電池宣布量產(chǎn),充電6分鐘跑1000km

小李車評(píng)李建紅
2025-06-13 06:53:10
伊朗新一輪導(dǎo)彈襲擊已致以色列超200人死傷

伊朗新一輪導(dǎo)彈襲擊已致以色列超200人死傷

新京報(bào)
2025-06-15 11:58:06
2025-06-15 13:48:50
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
10640文章數(shù) 142338關(guān)注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴(yán)重缺貨

頭條要聞

以色列遭伊朗近200枚彈道導(dǎo)彈襲擊 大片別墅變廢墟

頭條要聞

以色列遭伊朗近200枚彈道導(dǎo)彈襲擊 大片別墅變廢墟

體育要聞

裁判可以噴,但也從步行者自身找找問題?

娛樂要聞

鳳凰傳奇曾毅塌房?網(wǎng)友:別連累玲花

財(cái)經(jīng)要聞

以伊沖突持續(xù)升級(jí),對(duì)全球市場(chǎng)影響多大

汽車要聞

長(zhǎng)城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

健康
手機(jī)
時(shí)尚
本地
數(shù)碼

呼吸科專家破解呼吸道九大謠言!

手機(jī)要聞

羅巍建議榮耀 400 系列手機(jī)用戶不貼鏡頭膜

“大+小”穿法太火了!夏天這樣穿時(shí)髦又顯高

本地新聞

最近的打工人,都在熬夜看這劇逐幀學(xué)習(xí)職場(chǎng)小技巧

數(shù)碼要聞

全球獨(dú)此一份!黃仁勛簽名RTX 5090黃金版拍出17萬元天價(jià)

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲美免无码中文字幕在线| 亚洲av伊人久久综合密臀性色| 久久久久久国产精品免费免费男同| 久久国产劲爆∧v内射-百度| 啦啦啦www在线观看免费视频| 免费女人高潮流视频在线| 国精产品一区二区三区| 无码中文字幕加勒比一本二本| 午夜福利视频合集1000| 国精产品一品二品国精品69xx| 久久精品人人爽人人爽| 躁躁躁日日躁| 免费大片黄国产在线观看| 国产黄a三级三级三级av在线看| 97久久综合区小说区图片区| 日本高清无卡码一区二区| 亚洲爱婷婷色婷婷五月| 精品久久国产综合婷婷五月| 国产成人无码a区在线观看视频| 48沈阳熟女高潮嗷嗷叫| 未满十八18禁止午夜免费网站| 亚洲国产一区二区三区四区电影网| 蜜臀av在线观看| 欧美国产成人精品二区芒果视频| 国产精品久久久久久久久软件| 日本一区二区三区高清无卡| 少妇精品视频无码专区| 免费视频成人片在线观看| 免费精品国产人妻国语| 国产黑色丝袜在线播放| 青青草视频在线观看| 国产精品欧美亚洲韩国日本久久| 日本熟妇hdsex视频| 日韩精品人妻系列无码专区免费| 久久影院九九被窝爽爽| 亚洲成av人片久久| 小蜜被两老头吸奶头在线观看| 成人av无码一区二区三区| 人妻夜夜爽天天爽欧美色院| 国产做a爰片久久毛片a片美国| 无码ol丝袜高跟秘书在线观看|