大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

何愷明改進了謝賽寧的REPA:極大簡化但性能依舊強悍

0
分享至



機器之心報道

編輯:Panda

在建模復雜的數據分布方面,擴散生成模型表現出色,不過它的成果大體上與表征學習(representation learning)領域關聯不大。

通常來說,擴散模型的訓練目標包含一個專注于重構(例如去噪)的回歸項,但缺乏為生成學習到的表征的顯式正則化項。這種圖像生成范式與圖像識別范式差異明顯 —— 過去十年來,圖像識別領域的核心主題和驅動力一直是表征學習。

在表征學習領域,自監督學習常被用于學習適用于各種下游任務的通用表征。在這些方法中,對比學習提供了一個概念簡單但有效的框架,可從樣本對中學習表征。

直觀地講,這些方法會鼓勵相似的樣本對(正例對)之間相互吸引,而相異的樣本對(負例對)之間相互排斥。研究已經證明,通過對比學習進行表征學習,可以有效地解決多種識別任務,包括分類、檢測和分割。然而,還沒有人探索過這些學習范式在生成模型中的有效性。

鑒于表征學習在生成模型中的潛力,謝賽寧團隊提出了表征對齊 (REPA)。該方法可以利用預訓練得到的現成表征模型的能力。在訓練生成模型的同時,該方法會鼓勵其內部表征與外部預訓練表征之間對齊。有關 REPA 的更多介紹可閱讀我們之前的報道《擴散模型訓練方法一直錯了!謝賽寧:Representation matters》。

REPA 這項開創性的成果揭示了表征學習在生成模型中的重要性;然而,它的已有實例依賴于額外的預訓練、額外的模型參數以及對外部數據的訪問。

簡而言之,REPA 比較麻煩,要真正讓基于表征的生成模型實用,必需一種獨立且極簡的方法。

這一次,MIT 本科生 Runqian Wang 與超 70 萬引用的何愷明出手了。他們共同提出了Dispersive Loss,可譯為「分散損失」。這是一種靈活且通用的即插即用正則化器,可將自監督學習集成到基于擴散的生成模型中。



  • 論文標題:Diffuse and Disperse: Image Generation with Representation Regularization
  • 論文鏈接:https://arxiv.org/abs/2506.09027v1

分散損失的核心思想其實很簡單:除了模型輸出的標準回歸損失之外,再引入了一個用于正則化模型的內部表征的目標(圖 1)。



直覺上看,分散損失會鼓勵內部表征在隱藏空間中散開,類似于對比學習中的排斥效應。同時,原始的回歸損失(去噪)則自然地充當了對齊機制,從而無需像對比學習那樣手動定義正例對。

一言以蔽之:分散損失的行為類似于「沒有正例對的對比損失」

因此,與對比學習不同,它既不需要雙視圖采樣、專門的數據增強,也不需要額外的編碼器。訓練流程完全可以遵循基于擴散的模型(及基于流的對應模型)中使用的標準做法,唯一的區別在于增加了一個開銷可忽略不計的正則化損失。

與 REPA 機制相比,這種新方法無需預訓練、無需額外的模型參數,也無需外部數據。憑借其獨立且極簡的設計,該方法清晰地證明:表征學習無需依賴外部信息源也可助益生成式建模。

帶點數學的方法詳解

分散損失

新方法的核心是通過鼓勵生成模型的內部表征在隱藏空間中的分散來對其進行正則化。這里,將基于擴散的模型中的原始回歸損失稱為擴散損失(diffusion loss),將新引入的正則化項稱為分散損失(Dispersive Loss)

如果令 X = {x_i} 為有噪聲圖像 x_i 構成的一批數據,則該數據批次的目標函數為:







等式 (6) 中定義的基于 InfoNCE 的分散損失類似于前述先前關于自監督學習的論文中的均勻性損失(盡管這里沒有對表示進行 ?? 正則化)。在那篇論文中的對比表示學習,均勻性損失被應用于輸出表示,并且必須與對齊損失(即正則項)配對。而這里的新公式則更進一步,移除了中間表示上的對齊項,從而僅關注正則化視角。

該團隊注意到,當 j = i 時,就不需要明確排除項 D (z_i,z_j)。由于不會在一個批次中使用同一圖像的多個視圖,因此該項始終對應于一個恒定且最小的差異度,例如在?? 的情況下為 0,在余弦情況下為 -1。因此,當批次大小足夠大時,這個項在那個對數中的作用是充當一個常數偏差,其貢獻會變小。在實踐中,無需排除該項,這也簡化了實現。

分散損失的其他變體

分散損失的概念可以自然延伸到 InfoNCE 之外的一類對比損失函數。

任何鼓勵排斥負例的目標都可以被視為分散目標,并實例化為分散損失的一種變體。基于其他類型的對比損失函數,該團隊構建了另外兩種變體。表 1 總結了所有三種變體,并比較了對比損失函數和分散損失函數。



鉸鏈損失(Hinge Loss)



使用分散損失的擴散模型

如表 1 所示,所有分散損失的變體都比其對應的分散損失更簡潔。更重要的是,所有分散損失函數都適用于單視圖批次,這樣就無需進行多視圖數據增強。因此,分散損失可以在現有的生成模型中充當即插即用的正則化器,而無需修改回歸損失的實現

在實踐中,引入分散損失只需進行少量調整:

  1. 指定應用正則化器的中間層;
  2. 計算該層的分散損失并將其添加到原始擴散損失中。

算法 2 給出了訓練偽代碼,其中包含算法 1 中定義的分散損失的具體形式。



該團隊表示:「我們相信,這種簡化可極大地促進我們方法的實際應用,使其能夠應用于各種生成模型。」

分散損失的實際表現如何?

表 2 比較了分散損失的不同變體及相應的對比損失。



可以看到,在使用獨立噪聲時,對比損失在所有研究案例中均未能提高生成質量。該團隊猜想對齊兩個噪聲水平差異很大的視圖會損害學習效果。

而分散損失的表現總是比相應的對比損失好,而前者還避免了雙視圖采樣帶來的復雜性。



另外,該團隊還研究了不同模塊選擇以及不同 λ(控制正則化強度)和 τ(InfoNCE 中的溫度)值的影響。詳見原論文。

另外,不管是在 DiT(Diffusion Transformer)還是 SiT(Scalable Interpolant Transformers)上,分散損失在所有場景下都比基線方法更好。有趣的是,他們還觀察到,當基線性能更強時,相對改進甚至絕對改進往往還會更大。



總體而言,這種趨勢有力地證明了分散損失的主要作用在于正則化。由于規模更大、性能更強的模型更容易過擬合,因此有效的正則化往往會使它們受益更多。

圖 5 展示了 SiT-XL/2 模型生成的一些示例圖像。



當然,該團隊也將新方法與 REPA 進行了比較。新方法的正則化器直接作用于模型的內部表示,而 REPA 會將其與外部模型的表示對齊。因此,為了公平起見,應同時考慮額外的計算開銷和外部信息源,如表 6 所示。



REPA 依賴于一個預訓練的 DINOv2 模型,該模型本身是從已在 1.42 億張精選圖像上訓練過的 11B 參數主干網絡中蒸餾出來的。

相比之下,新提出的方法完全不需要這些:無需預訓練、外部數據和額外的模型參數。新方法在將訓練擴展到更大的模型和數據集時非常適用,并且該團隊預計在這種情況下正則化效果會非常好。

最后,新提出的方法可以直接泛化用于基于一步式擴散的生成模型。



在表 7(左)中,該團隊將分散損失應用于最新的 MeanFlow 模型,然后觀察到了穩定持續的改進。表 7(右)將這些結果與最新的一步擴散 / 基于流的模型進行了比較,表明新方法可增強 MeanFlow 的性能并達到了新的 SOTA。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
網上曝光!六代機空中加油已開練,美國咋追得上?

網上曝光!六代機空中加油已開練,美國咋追得上?

武器鑒賞
2025-06-13 08:58:29
杭州文旅再次破防!“天價”飯店還有衛生問題,老板態度囂張至極

杭州文旅再次破防!“天價”飯店還有衛生問題,老板態度囂張至極

云景侃記
2025-06-14 07:45:07
上海女子不上班,但卻住豪宅開豪車,警察:她家現金堆成山了

上海女子不上班,但卻住豪宅開豪車,警察:她家現金堆成山了

懸案解密檔案
2025-05-09 18:00:29
扁擔女孩后續:哥哥給學費,爸爸給生活費,長相與網傳的有差距!

扁擔女孩后續:哥哥給學費,爸爸給生活費,長相與網傳的有差距!

大笑江湖史
2025-06-14 07:47:18
博主好心幫粉絲收羊后續:到手才知吃草羊沒人要,160頭僅賣5萬5

博主好心幫粉絲收羊后續:到手才知吃草羊沒人要,160頭僅賣5萬5

奇思妙想草葉君
2025-06-13 23:18:43
波黑女籃主帥:張子宇是從沒見過的優秀隊員,在球隊起到主導作用

波黑女籃主帥:張子宇是從沒見過的優秀隊員,在球隊起到主導作用

懂球帝
2025-06-14 07:51:32
女生杭州萬象城遭挾制被捅20余刀,歹徒現場磨刀,假體成護身符

女生杭州萬象城遭挾制被捅20余刀,歹徒現場磨刀,假體成護身符

小人物看盡人間百態
2025-06-14 05:30:05
觸目驚心的數據,房價的加速下跌即將失控

觸目驚心的數據,房價的加速下跌即將失控

重遠投資觀
2025-06-14 11:22:33
學醫后才明白,增強骨密度最好的運動,并非散步游泳,或許是它!

學醫后才明白,增強骨密度最好的運動,并非散步游泳,或許是它!

荷蘭豆愛健康
2025-06-14 08:39:34
伊朗伊斯蘭共和國廣播電視臺:伊朗伊斯蘭革命衛隊總司令侯賽因·薩拉米13日凌晨被以色列暗殺

伊朗伊斯蘭共和國廣播電視臺:伊朗伊斯蘭革命衛隊總司令侯賽因·薩拉米13日凌晨被以色列暗殺

上觀新聞
2025-06-13 10:22:46
上海63歲阿姨未婚未育,尋找40年前的空軍戀人,見到他后淚流滿面

上海63歲阿姨未婚未育,尋找40年前的空軍戀人,見到他后淚流滿面

夜闌故事集
2025-06-10 14:10:02
高血壓可以做手術治療了?重慶已完成4例

高血壓可以做手術治療了?重慶已完成4例

上游新聞
2025-06-13 18:35:04
烏克蘭收復蘇梅四塊失地!擊退俄軍大規模攻勢

烏克蘭收復蘇梅四塊失地!擊退俄軍大規模攻勢

項鵬飛
2025-06-13 20:46:06
清洗水臟如泥漿、蒼蠅亂飛!你花錢用的消毒餐具也塌房了

清洗水臟如泥漿、蒼蠅亂飛!你花錢用的消毒餐具也塌房了

柴狗夫斯基
2025-06-13 11:43:25
疑似伊朗導彈襲擊以色列特拉維夫,外媒曝光現場畫面

疑似伊朗導彈襲擊以色列特拉維夫,外媒曝光現場畫面

環球網資訊
2025-06-14 09:03:44
以色列沒有打醒阿拉伯人。卻打醒了中國人!

以色列沒有打醒阿拉伯人。卻打醒了中國人!

boss外傳
2025-05-24 18:15:06
17死傷!京滬高速一大巴車側翻,現場畫面流出,上海瑞金醫院發聲

17死傷!京滬高速一大巴車側翻,現場畫面流出,上海瑞金醫院發聲

博士觀察
2025-06-13 19:01:31
太慘了!這個小三真的被白嫖,千萬資產被追回,還給別人生了孩子

太慘了!這個小三真的被白嫖,千萬資產被追回,還給別人生了孩子

火山詩話
2025-06-13 07:09:01
已停售!內地頂流奶茶入港翻車了?細菌超標70%,網友:屎尿水

已停售!內地頂流奶茶入港翻車了?細菌超標70%,網友:屎尿水

素衣讀史
2025-06-13 09:38:51
電線里驚現“買路錢”?塞張一塊錢,居然是防偽黑科技!

電線里驚現“買路錢”?塞張一塊錢,居然是防偽黑科技!

一絲不茍的法律人
2025-06-08 23:28:44
2025-06-14 13:20:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10640文章數 142338關注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業陪葬?

頭條要聞

牛彈琴:中東大戰開啟 以色列遭受幾十年來最猛烈攻擊

頭條要聞

牛彈琴:中東大戰開啟 以色列遭受幾十年來最猛烈攻擊

體育要聞

32隊爭10億獎金,全新世俱杯來了!

娛樂要聞

鳳凰傳奇曾毅手表引爭議 含性暗示元素

財經要聞

樓市權威發聲

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

本地
家居
旅游
時尚
公開課

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

家居要聞

森林幾何 極簡灰調原木風

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

在時尚中國之夜,共赴榮耀東方時刻

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 午夜高清在线无码| 国产 亚洲 中文在线 字幕| 男人用嘴添女人私密视频| 6080亚洲人久久精品| 伊人久久精品无码二区麻豆| 国模无码视频一区| 爱性久久久久久久久| 国产美女口爆吞精普通话| 伊人久久大香线蕉午夜| 人成午夜免费视频在线观看| 亚洲国产欧美国产综合久久| 伊人蕉久中文字幕无码专区| 国产av一区最新精品| 久久人妻内射无码一区三区| 免费午夜爽爽爽www视频十八禁| 国产在视频精品线观看| 天天天欲色欲色www免费| 国产一卡2卡3卡四卡精品网站| 日本无码v视频一区二区| 中文字幕人妻无码视频| 天堂国产一区二区三区| 红杏亚洲影院一区二区三区| 青青青爽在线视频观看| 婷婷五月开心亚洲综合在线| 亚洲精品无码人妻无码| 麻豆 美女 丝袜 人妻 中文| 国产熟女精品视频大全| 成年午夜性影院免费观看| 亚洲中文字幕aⅴ无码天堂| 丰满人妻被黑人猛烈进入| 女人夜夜春高潮爽a∨片传媒| 精品久久久久久无码国产| 免费无码又爽又黄又刺激网站| 亚洲高清揄拍自拍| 成人无码视频在线观看网址| 人妻无码手机在线中文| 国产高清乱码又大又圆| 久久精品99无色码中文字幕| 狠狠色丁香婷婷久久综合不卡| 十八禁午夜私人在线影院| 色狠狠av一区二区三区|