這屆大模型內卷到什么程度了?
回看今年的節奏,字節幾乎月月有新招,甚至一月多更,一個個模型砸出來,不只是上新,也都有實打實的升級,持續把行業的競爭門檻推高一大截。
1 月,豆包 1.5 Pro 模型上線。
4 月,豆包 1.5 深度思考模型、文生圖模型 3.0、視覺理解模型同步升級。
5 月,Seedance 1.0 lite 視頻生成模型 、豆包 1.5·視覺深度思考模型以及音樂模型,文字、圖像、聲音,字節全都想卷。
到了今天火山引擎舉辦的 Force 原動力大會上,字節系 AI 產品線繼續輸出,不整玄學,主打一個量大管飽,開箱即用。
豆包大模型 1.6、視頻生成模型 Seedance 1.0 pro 等新模型,能寫行業報告的 DeepResearch 以及 Agent 開發平臺等 AI 云原生服務接連登場。
說到底,你可以不懂 Transformer,但你一定能感受到這些 AI 產品真能替人干事了。
產品更新重點如下:
豆包 1.6 系列模型
- 推理能力增強,支持「邊想邊搜」與「DeepResearch」
- 多模態理解能力優秀,更好理解和處理真實世界問題
- GUI 操作更加智能,與其他工具流暢交互
- 性價比超高
視頻生成模型 Seedance 1.0 pro
- 多鏡頭、不同景別切換,信息量與敘事性增強
- 運動連貫性、畫面穩定性與整體質感提高
本次發布會的重頭戲,就是豆包大模型 1.6 系列,由三個模型組成。
Doubao-Seed-1.6:一款「All-in-One」的綜合模型
它支持深度思考、多模態理解,還能操作圖形界面。深度思考有三種模式:開、關和自動。在自適應模式下,模型會根據任務難度自動決定是否啟用深度思考,既能省時間又省 token。而且,它還是國內第一個支持 256k 上下文的模型。
Doubao-Seed-1.6-thinking:在深度思考方面的強化版本
1.6- thinking 是本次升級的重點,思考能力得到強化,能更準確地理解和處理復雜任務。在 coding、數學、邏輯推理、指令遵循等方面都有進一步的提升,同樣也支持 256k 上下文和多模態推理。
Doubao-Seed-1.6-flash:1.6 系列的極速版本
延遲極低,非常適用于低延遲敏感場景。文本理解比豆包 1.5-lite 強,視覺理解也能媲美其他廠商的頂級產品。
在會議上,豆包 1.6 系列模型公布了多項權威測評成績。特別是豆包 1.6-thinking 的表現,已經躋身全球頂尖行列。
推理能力
模型會考試已經不是新鮮事,但能考清北的分數,還真不多見。
拿推理能力來說,豆包 1.6 相較于之前的模型進步很明顯,做今年高考全國新一卷的數學題,豆包拿到了 144 分,位居全國第一。用海淀模擬全卷去測,相較于去年的 500 到 600多分,今年不管是文科還是理科,豆包 1.6 都超過了 700 分。
豆包在進行邏輯推理時的一個亮點在于,它不僅會自己思考,還懂得「邊想邊搜」。先拆解問題,找到關鍵信息,先做一輪思考,然后根據缺失的信息再做多輪的搜索。
比如,向豆包提問「詳細梳理廣東省內的昆蟲分布狀況、常見品種等,并以研究報告的形式呈現」。它在深度思考過程中首先考慮到了研究報告的格式要求,然后很快確定了梳理的框架。接著,豆包考慮到「內容需要具體的數據和例子支撐」,所以開始自主搜索廣東省的自然環境數據,以及以往相關研究。
會上還提到,豆包正在進行 DeepResearch 功能測試。過去需要專業人士花費數小時或者數天寫的專業報告,豆包可以在 5 到 30 分鐘內完成。而且還能自動的提煉信息,總結成網頁,方便人們進行查閱。
另外,為方便企業用戶使用「邊想邊搜」和 「DeepResearch」功能,火山引擎官網上線了大模型應用實驗室,并開源了代碼,可以搭建自己的 AI 應用原型,靈活編排自己的智能體。
多模態理解能力
豆包 1.6 全系列均原生支持多模態思考能力,讓模型更好地理解和處理真實世界的問題。
多模態理解支持了豆包最新的「實時視頻通話」功能。而在企業端,則可廣泛應用于電商商品審核、自動駕駛標注、安全巡檢等場景。
比如,可以用模型對商家上傳的圖片進行規范審查,也可以用模型快速對同類商品進行比價。
在汽車領域,可以通過模型來更準確的識別汽車行駛方向和駕駛意圖,從海量的路采數據中選出特定的片段,用于下游的自動駕駛模型的訓練。
在更多線下場景中,豆包可以準確地對圖片中的信息進行定位和計數,從而完成安全巡檢、門店巡檢等任務。
比如,讓豆包 1.6-thinking 檢查一張洞穴探險的照片中是否存在因未戴頭盔而可能引發的安全隱患。通過深度思考,它不僅能夠對圖片中的頭盔佩戴情況進行準確計數,更讓人驚喜的是,它還能進一步思考「戴頭盔就算安全嗎」的問題,從而接著分析圖片中頭盔佩戴是否規范、穿衣是否合適、照明設備是否齊全、行走的安全距離是否恰當等等,并在最終提出了整改的優先級。
GUI 操作能力
憑借領先的視覺深度思考能力和精確的視覺定位能力,豆包 1.6 能夠讓智能體與瀏覽器和其他工具進行流暢的交互和操作,高效地執行任務,比如,酒店預定篩選、票據整理等。
模型對 GUI 的操作,絕不僅僅只是替代人去解決手指點擊 APP 的那幾下的便利,而是能夠突破傳統的 APP 和 GUI 的限制,去更加智能、自動地去滿足人本質的需求。
性價比
豆包大模型 1.6 采用統一定價模式,無論是否開啟深度思考模式,無論是文本還是視覺,tokens 價格均一致,按照輸入上下文長度區間定價。
在絕大部分企業使用的輸入區間 0-32k 范圍內,價格是輸入 0.8 元/百萬 tokens,輸出 8 元/百萬 tokens。
在輸入區間 32k-128k 的范圍內,價格是輸入 1.2 元/百萬 tokens,輸出 16 元/百萬 tokens。
在輸入區間 128k-256k 的范圍內,價格是輸入 2.4 元/百萬 tokens,輸出 24 元/百萬 tokens。
從綜合成本來看,絕大部分請求輸入都在 32k 以內,輸入輸出占比在 3:1,豆包大模型 1.6 的綜合成本(2.6元)比豆包大模型 1.5 ·深度思考模型、DeepSeek R1 的綜合成本(7元)下降 63%,相當于只需原來三分之一的價格,就能使用能力更強、原生多模態的新模型。
此次火山引擎還增設特惠區,對于輸入 32k、輸出 200 tokens 以內的請求,豆包大模型 1.6 的價格將進一步降低到輸入 0.8元/百萬 tokens、輸出 2 元/百萬 tokens。相當于絕大部分非思考模型的需求,也可以安心使用更好效果的新模型。
Seedance 1.0 pro 上線:不燒錢也能「拍」出大片
除了豆包大模型 1.6 系列模型,在本次發布會上,火山引擎還帶來了一個:全新視頻生成模型 Seedance 1.0 pro。
這款模型首先值得談的變化,是它在鏡頭語言上的突破。
該模型支持文字與圖片輸入,可生成多鏡頭無縫切換的 1080P 高品質視頻。Seedance 1.0 pro 主打一個多動作用例 & 隨心運鏡,不僅支持 2-3 個鏡頭切換的 10 秒視頻生成,還能切換遠景、中景、近景,并借此大幅提升視頻的信息量與敘事性。
而且,配合后訓練階段引入的多維數據集與反饋學習機制,新模型在運動連貫性、畫面穩定性與整體質感都維持在一個相當高的水準。
沒有停留在 demo 階段,無論是打造商品廣告片,還是快速跑出分鏡草圖;亦或著為客戶提供游戲角色與劇情視頻創作的能力,豆包新視頻模型一步步走向這些最具生產力的場景。
來自第三方評測機構 Artificial Analysis 的榜單顯示,Seedance 1.0 是目前中英文雙榜第一的模型。
在文生視頻榜中,Seedance 1.0 ELO 得分為 1299,超越了 Google 的 Veo 3 Preview、Veo 2 和快手可靈系列。在圖生視頻榜單中,Seedance 1.0 ELO 得分為 1343,超越了 Runway Gen 4、可靈 2.0 等,主打一個所向披靡。
性能拉滿的同時,價格卻意外地接地氣。
1 萬元預算可以用 Seedance 1.0 pro 生成 2725 條視頻(5 秒 1080P),等價于用 Seedance 1.0 lite 生成 9708 條視頻(5s 720P)。相比之下,可靈 v2.1 大師版、Veo2 等競品的產出量(5 秒 1080P)都在 1000 條以內。
除視頻生成模型,豆包還同步推出全量上線的實時語音模型,將擬人感和語義控制推向了新高度。
它能根據語境靈活調整語調、音量等;支持唱歌、低語等富有表現力的語音互動;甚至支持包括四川話等地方方言,現場演示環節中,豆包語音模型還演唱了《月亮代表我的心》,你別說,聽上去確實有點意思。
在實際應用場景方面,除了與奔馳合作開發車載語音交互,豆包還在實時語音技術的基礎上推出了「播客生成模型」,支持多人自然對話、插話、停頓等復雜語音結構。
它能自動識別輸入內容(prompt、網頁鏈接、長文本),接著自動生成完整播客腳本 + 擬人音頻內容。現場演示的一段播客片段從節奏到插話,再到語氣,幾乎都挑不出 AI 感。
2025 年是 Agent 元年,如何把一個 Agent 真正跑進企業系統里,成了擺在所有廠商面前的現實問題。
為了更好地支持 Agent 開發與應用,從 MCP 服務、PromptPilot 智能提示工具、AI 知識管理系統到 veRL 強化學習框架,再到多模態數據湖、AICC 私密計算、大模型應用防火墻,火山引擎一口氣推出了一整套 AI 云原生全棧產品。
火山引擎總裁譚待特別強調了「安全」對于 Agentic AI 的重要性,并介紹了即將上線的兩款 AI 安全產品:「AICC 密態計算」和「大模型應用防火墻」。
其中,AICC 密態計算可以在保障推理效果的前提下,讓企業能夠像用私有化模型一樣,安全合規地去使用云端服務。
大模型應用防火墻脫胎于「火山方舟」,能夠低延遲、高精度地攔截攻擊變種,為企業智能體應用構建一個安全可信的推理空間。
縱觀整場發布會,火山引擎沒有沿著 AGI 的敘事繼續拔高,相反,他們把視角拉回到當下,聚焦在那些今天能落地、能部署、能跑在生產環境里的 AI 產品上。
過去半年,行業的共識越來越清晰,AI 的下半場其實就是產品的上半場。參數差異會被不斷抹平,但產品的調用效率,集成路徑和使用成本,會決定用戶的留存率。
這也是為什么,在今天這場發布會上,除了豆包大模型 1.6 和視頻生成模型 Seedance 1.0 pro,火山引擎還同步推出了一批聽起來不那么炸場,卻極其關鍵的產品能力。
從模型調用、到具體場景組合、再到安全穩定地執行閉環,這些能力彼此打通之后,才構成了真正能用起來的 AI 生產系統。
不一定是最吸睛,但這可能是最可落地,最接近「用起來」的那條路。
作者:王馨、莫崇宇
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.