大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

256塊NPU訓成8B視頻模型,抖音內(nèi)容技術(shù)團隊開源ContentV

0
分享至



近日,抖音內(nèi)容技術(shù)團隊開源了 ContentV,一種面向視頻生成任務(wù)的高效訓練方案。該方案在多項技術(shù)優(yōu)化的基礎(chǔ)上,使用 256 塊 NPU,在約 4 周內(nèi)完成了一個 8B 參數(shù)模型的訓練。盡管資源有限,ContentV 在多個評估維度上取得了與現(xiàn)有主流方案相近的生成效果。

該工作探索了在有限算力條件下訓練視頻生成模型的可行路徑。目前,推理代碼與模型權(quán)重已對外開放。



  • 論文標題:ContentV: Efficient Training of Video Generation Models with Limited Compute
  • 技術(shù)報告:https://arxiv.org/abs/2506.05343
  • 代碼倉庫:https://github.com/bytedance/ContentV
  • 模型權(quán)重:https://huggingface.co/ByteDance/ContentV-8B
  • 項目主頁:https://contentv.github.io

我們先來看一些效果展示視頻:





? 核心亮點

極簡設(shè)計

CogVideoX、HunyuanVideo 和 Wan2.1 等一系列優(yōu)秀的開源工作表明,視頻生成的關(guān)鍵并不在于架構(gòu)上的特殊設(shè)計,而在于如何高效利用有限的數(shù)據(jù)資源,并有效對齊人類偏好。

為驗證 ContentV 方案的通用性,本次開源的版本在擴散模型部分采用了經(jīng)典的文生圖模型 Stable Diffusion 3.5 Large。為了適配視頻模態(tài),模型在結(jié)構(gòu)上僅做了以下兩項必要調(diào)整:

  • 將原始圖像 VAE 替換為 Wan2.1 中使用的 3D-VAE;
  • 將 2D 位置編碼升級為 3D 版本。在具體編碼方式上,團隊對比了傳統(tǒng)的絕對位置編碼與主流的旋轉(zhuǎn)位置編碼。評估結(jié)果顯示,兩者在客觀指標和主觀感受上差異較小,因此保留了計算更高效的絕對位置編碼方案。



ContentV模型結(jié)構(gòu)

多階段漸進訓練策略

上述的最小化結(jié)構(gòu)改動,在解鎖了視頻生成能力的同時,也最大限度地保留了原模型的圖像生成能力。實驗證明,在新的 VAE 和位置編碼的適配階段,沿用 Flow Matching 的訓練方式,僅需 1000 步左右的微調(diào),就能基本還原模型的圖片生成能力,大幅節(jié)省圖片預訓練階段的訓練成本。

在視頻生成的預訓練階段,為加速收斂實現(xiàn)高效訓練,研究團隊設(shè)計了一套從「低清短片」到「高清長片」的多階段漸進式訓練流程,逐步引導模型學習時間維度與空間維度上的動態(tài)表征,從而提升視頻的連續(xù)性、動態(tài)表現(xiàn)力和畫面細節(jié)。

此外,實驗證明,在推理階段引入非線性采樣步長機制(Flow Shift)能夠顯著提升視頻的整體生成質(zhì)量。通過多組對比實驗,團隊最終確定了最優(yōu)的采樣策略,進一步優(yōu)化了生成效果。



VAE適配過程

? 輕量級 RLHF 強化訓練



RLHF顯著提升畫面質(zhì)感

在后訓練階段,除了使用高質(zhì)量數(shù)據(jù)集進行微調(diào)外,通過 RLHF 或 DPO 等對齊人類偏好的監(jiān)督訓練,也能顯著提升視頻生成質(zhì)量。然而,這類方法通常依賴大量人工標注,用于訓練獎勵模型或直接監(jiān)督擴散模型。同時,相較于圖像,視頻的序列長度顯著增加了 RLHF 和 DPO 的訓練資源需求。

為此,ContentV 研究團隊提出了一種輕量級的 RLHF 訓練方案,旨在不依賴人工標注的前提下,低成本提升視頻質(zhì)量:

  • 利用開源的圖像獎勵模型對生成視頻的單幀進行監(jiān)督。相較于視頻場景,目前圖像獎勵模型的訓練數(shù)據(jù)更易獲取,且在實際效果中表現(xiàn)更佳。實驗證明,由于 MM DiT 采用全局注意力機制,僅優(yōu)化單幀即可帶動整體視頻質(zhì)量的提升;
  • 將監(jiān)督范圍限制在生成視頻的前 1 秒,相較于對完整視頻進行監(jiān)督,可大幅減少訓練資源的消耗,同時獲得相近的質(zhì)量提升效果。

采用上述策略后,在無需人工標注的情況下,僅使用少量訓練資源,便可顯著提升畫面質(zhì)量。RLHF 微調(diào)后,模型在視覺質(zhì)量(VQ)指標上的表現(xiàn)大幅提升,評估勝率高達 89.38%。

效果對比

在 VBench 這一主流視頻生成評測基準上,ContentV(8B)取得了 85.14 的綜合得分,表現(xiàn)優(yōu)于多個現(xiàn)有的商業(yè)閉源模型,包括 Sora、Kling 1.6 和 Gen-3 等。



VBench 榜單 (按照 Overall 分數(shù)降序排列)

為更貼近真實用戶偏好,研究團隊圍繞感知質(zhì)量、指令跟隨、物理一致性和視覺效果四個維度開展了人類偏好評估。結(jié)果顯示,ContentV 在整體表現(xiàn)上與 CogVideoX-5B、HunyuanVideo-13B 和 Wan2.1-14B 等主流開源模型相比具有一定優(yōu)勢。



人類偏好評估指標

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
重逢故敵,梅西與佩佩在球員通道互相握手致意

重逢故敵,梅西與佩佩在球員通道互相握手致意

懂球帝
2025-06-15 11:49:14
女生杭州萬象城遭挾制被捅20余刀,歹徒現(xiàn)場磨刀,假體成護身符

女生杭州萬象城遭挾制被捅20余刀,歹徒現(xiàn)場磨刀,假體成護身符

小人物看盡人間百態(tài)
2025-06-14 05:30:05
我在巴西旅居了10個月,說幾句,可能很多人不愛聽的大實話

我在巴西旅居了10個月,說幾句,可能很多人不愛聽的大實話

i書與房
2025-06-09 08:20:07
以色列最高明的一招,放過哈梅內(nèi)伊

以色列最高明的一招,放過哈梅內(nèi)伊

超級學爸蛋總
2025-06-14 07:51:30
女籃深夜重磅交易!李月汝被連夜打包送走:將聯(lián)手WNBA狀元秀?

女籃深夜重磅交易!李月汝被連夜打包送走:將聯(lián)手WNBA狀元秀?

籃球快餐車
2025-06-15 06:33:40
5月銷量暴跌58%!“雪崩”的廣汽本田,“神仙”都難救!

5月銷量暴跌58%!“雪崩”的廣汽本田,“神仙”都難救!

玩車情報
2025-06-13 20:32:43
中東地區(qū),為何總是爭斗不休?根本原因:老祖宗去世忘記交代一事

中東地區(qū),為何總是爭斗不休?根本原因:老祖宗去世忘記交代一事

文史達觀
2023-09-09 18:02:18
越臟越安全?哈佛團隊最新研究:10%毒性訓練讓大模型百毒不侵

越臟越安全?哈佛團隊最新研究:10%毒性訓練讓大模型百毒不侵

大數(shù)據(jù)文摘
2025-06-13 14:05:18
某大廠被曝大規(guī)模裁員,比例高達30%,神奇工廠5+8是哪一家?

某大廠被曝大規(guī)模裁員,比例高達30%,神奇工廠5+8是哪一家?

小人物看盡人間百態(tài)
2025-06-14 22:35:03
一個孩子覺醒最快的方式:從吃“高級苦”開始

一個孩子覺醒最快的方式:從吃“高級苦”開始

諾媽家有男寶娃
2025-06-13 09:19:36
誰錯了?我藏南國土并非9萬、印度實際只控制了6.8萬,冤枉它了?

誰錯了?我藏南國土并非9萬、印度實際只控制了6.8萬,冤枉它了?

阿燕姐說育兒
2025-06-14 13:46:52
喜歡嫖娼的男人一定不知道的三件事!

喜歡嫖娼的男人一定不知道的三件事!

小虎新車推薦員
2025-06-15 07:19:45
新總理剛上臺,邀請函立馬遞到北京!解放軍行動,美軍也下場了?

新總理剛上臺,邀請函立馬遞到北京!解放軍行動,美軍也下場了?

寰球視聽
2025-06-14 10:32:57
薄一波的兩位親家,一位開國將軍,另一位官至副國級,分別是誰?

薄一波的兩位親家,一位開國將軍,另一位官至副國級,分別是誰?

獵火照狼山
2025-05-28 18:04:02
浙江2-2上海海港,賽后評分:不是王鈺棟第一,上海海港30號第一

浙江2-2上海海港,賽后評分:不是王鈺棟第一,上海海港30號第一

側(cè)身凌空斬
2025-06-14 17:37:52
張穎穎孟賀杯具落幕!平臺重拳整治,網(wǎng)紅“內(nèi)涵”文化走到盡頭

張穎穎孟賀杯具落幕!平臺重拳整治,網(wǎng)紅“內(nèi)涵”文化走到盡頭

樂悠悠娛樂
2025-06-15 08:18:19
“手臂脫臼,醫(yī)生扭一下就要收85元?”:比貧窮更可怕的,是心窮

“手臂脫臼,醫(yī)生扭一下就要收85元?”:比貧窮更可怕的,是心窮

精讀君
2025-06-13 10:30:12
曝詹皇豪宅重建已初見雛形!12億巨富大手筆 拒大幅減薪將重簽1+1

曝詹皇豪宅重建已初見雛形!12億巨富大手筆 拒大幅減薪將重簽1+1

顏小白的籃球夢
2025-06-14 09:07:04
他像種豬一樣被圈養(yǎng),為主人生下了250個小黑奴,據(jù)傳活到了130歲

他像種豬一樣被圈養(yǎng),為主人生下了250個小黑奴,據(jù)傳活到了130歲

談史論天地
2025-06-14 20:00:02
洪晃:一嫁美國律師,二嫁陳凱歌,三嫁法國外交官,43歲遇第四任

洪晃:一嫁美國律師,二嫁陳凱歌,三嫁法國外交官,43歲遇第四任

七公子娛樂
2025-06-15 11:20:03
2025-06-15 13:51:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
10640文章數(shù) 142338關(guān)注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

以色列遭伊朗近200枚彈道導彈襲擊 大片別墅變廢墟

頭條要聞

以色列遭伊朗近200枚彈道導彈襲擊 大片別墅變廢墟

體育要聞

裁判可以噴,但也從步行者自身找找問題?

娛樂要聞

鳳凰傳奇曾毅塌房?網(wǎng)友:別連累玲花

財經(jīng)要聞

以伊沖突持續(xù)升級,對全球市場影響多大

汽車要聞

長城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

親子
本地
數(shù)碼
教育
公開課

親子要聞

周末天氣這么好,必須帶娃感受下大自然的氣息

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

數(shù)碼要聞

全球獨此一份!黃仁勛簽名RTX 5090黃金版拍出17萬元天價

教育要聞

黑龍江頂尖高分考生想報哈工大,哪些專業(yè)值得推薦?省排名多少?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 亚洲无亚洲人成网站77777| 波多野结衣 黑人| 欧美大屁股xxxx高跟欧美黑人| 777米奇色狠狠俺去啦| 欧美精品高清在线观看| 亚洲女线av影视宅男宅女天堂| 中文字幕人妻丝袜乱一区三区| 亚洲人成网址在线播放小说| 女人夜夜春高潮爽a∨片传媒| 中文字幕人妻伦伦| 亚洲欧美黑人猛交群| 久久久精品人妻无码专区不卡| 一本久久久综合狠狠躁| 老子影院午夜伦手机不四虎卡| 92成人午夜福利一区二区| 国产午夜人做人免费视频| 国产精品香蕉视频在线| 亚洲成本人无码薄码区| 玩弄japan白嫩少妇hd小说| 国产午夜鲁丝片av无码| 亚洲色欲色欲77777小说网站| 欧美一进一出抽搐大尺度视频| 两个人看的www在线观看| 成年女人毛片免费视频| 99久久精品国产第一页| 老熟女重囗味hdxx69| 99re视频热这里只有精品7| 乱子轮熟睡1区| 久久综合亚洲鲁鲁九月天| 东京热无码av一区二区| 熟妇人妻不卡无码一区| 亚洲精品综合网在线8050影院| 亚洲中文久久精品无码ww16| 天干天干天啪啪夜爽爽av| 99精品久久久中文字幕| 精品人妻系列无码人妻在线不卡| 起碰免费公开97在线视频| 久久这里只精品国产免费9| 久久精品一区二区三区四区| 成人免费ā片在线观看| 日本被黑人强伦姧人妻完整版|