“你問我愛你有多深,我愛你有幾分,我的情也真,我的愛也真,月亮代表我的心。”2025年6月11日,在國家會議中心的會場,一首老歌響了起來。這并不是某位歌手的演唱會,而是豆包大模型的AI演唱。如今的豆包大模型,既可自動操作瀏覽器完成酒店預定,識別購物小票并整理成Excel表格等任務,還讓瑞幸咖啡基于它打造了首個AI點單智能體,能夠實現語音下單、猜你喜歡、點單更省時等功能,為用戶帶來“動動嘴就能點咖啡”的全新咖啡消費體驗。
就在當天的會場,字節跳動旗下火山引擎舉辦了Force原動力大會。會上,火山引擎總裁譚待展示了豆包大模型的更多功能,他表示:“有媒體針對高考全國新一卷數學單科做了測評,豆包的成績是144分,全國第一。而在高考前,我們針對海淀區模擬全卷進行了測評,豆包1.6相對2024年理科成績顯著提升了154分,文科提升了90分。”與此同時,本次會上火山引擎還為大模型做了“上新”。當天,其發布了豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型,并升級了Agent開發平臺等AI云原生服務。
性能躋身全球前排,價格“便宜大碗”
豆包1.6系列當前由三個模型組成,分別是doubao-seed-1.6;doubao-seed-1.6-thinking和doubao-seed-1.6-flash。
doubao-seed-1.6是all-in-one的綜合模型,也是國內首個支持256K上下文的思考模型,它支持深度思考、多模態理解、圖形界面操作等多項能力。特別是在深度思考方面,開發者可以選擇關閉深度思考、開啟深度思考和自適應思考三種方式。在自適應思考模式之下,模型可以根據prompt難度自動決定是否開啟thinking,在提升效果的前提之下可以大幅減少tokens開銷。
doubao-seed-1.6-thinking,是1.6系列在深度思考方面的強化版本,它只支持深度思考模式,但在coding、math、邏輯推理等基礎能力上都有進一步提升,同時也支持256K上下文。
doubao-seed-1.6-flash,是1.6系列的極速版本。它同樣支持深度思考、多模態理解和256K窗口。但是,它的延遲極低輸出每個 Token 的時間僅需10ms,適用于延遲敏感場景。其文本理解能力超過doubao 1.5 lite,視覺理解能力可以比肩友商旗艦模型。
會上,火山引擎披露了豆包1.6模型的多項權威測評成績。在復雜推理、競賽級數學、多輪對話和指令遵循等測試集上,豆包1.6-thinking的表現已躋身全球前列。據譚待介紹,豆包1.6系列模型支持多模態理解和圖形界面操作,能夠理解和處理真實世界問題。此前,豆包1.5的多模態能力在60個公開評測基準中取得38項最佳成績,并已廣泛用于電商識圖、自動駕駛數據標注、門店巡檢等場景。圖形界面操作能力則讓豆包1.6進一步具備“行動力”。與此同時,譚待還獨家揭秘了豆包APP的小流量DeepResearch功能。通過該功能,過去需要多名專業人士花費數小時或者幾天寫成的調研報告,豆包可以在5-30分鐘內完成,報告不僅內容扎實、結構嚴謹,還能自動提煉信息總結成網頁方便查閱。
豆包視頻生成模型Seedance 1.0 pro也在本次會上亮相。該模型支持文字與圖片輸入,能夠生成多鏡頭無縫切換的1080P高品質視頻,主體運動穩定性與畫面自然度較高。該模型還具備無縫多鏡頭的能力,這讓它能在幾秒的視頻中生成2個以上鏡頭的切換,并能伴隨著遠中近景畫面變化,讓畫面的信息量和敘事能力大幅提升。基于以上模型特點,火山引擎在電商、游戲和影視等場景使用Seedance 1.0 pro 分別做了嘗試。比如,在電商領域,無縫多鏡頭、多動作多主體互動等能力可以讓產品展示更加豐富。在影視領域,可以幫助從業人員快速驗證分鏡與敘事邏輯,減少前期籌備成本。在游戲領域,其用網易出品的常青仙俠游戲《逆水寒》做了嘗試,讓用戶創作自己的角色故事“親身”演繹劇情。在國際知名評測榜單 Artificial Analysis 上,Seedance在文生視頻、圖生視頻兩項任務上均排名首位。
目前,豆包大模型已涵蓋多模態、視頻、圖像、語音、音樂等模型品類,全方位推進智能提升和應用落地。在行業應用上,豆包大模型服務著全球TOP10手機廠商中的9家、8成主流汽車品牌、70%的系統重要性銀行及超5成985高校。譚待表示:“在手機行業,全球Top10手機廠商有9家和火山引擎深度合作。在汽車行業,在剛剛過去的上海車展,豆包大模型是被最多提及的名詞,我們還攜手長安汽車解決大模型安全測評的合規風險,護航智能化發展。在金融行業,火山引擎已經服務華泰證券、國信證券等數十家券商和基金公司,以及已經服務招商銀行、浦發銀行、民生銀行等70%的重要性銀行。在教育行業,火山引擎已與北京大學、浙江大學、南開大學等超五成985高校達成合作,持續推動高等教育智能化轉型。”數據顯示,豆包大模型日均tokens使用量超過16.4萬億,較2024年5月首次發布時增長137倍。另據IDC報告,豆包大模型在中國公有云大模型市場份額排名第一,占比高達46.4%。與此同時,豆包1.6成本下降了63%,企業只需要原來三分之一左右價格,就能獲得一個能力更強的原生多模態新模型。
譚待表示,深度思考、多模態和工具調用等模型能力的提升,是構建Agent的關鍵要素。同時,由于Agent每次執行任務都會消耗大量tokens,因此只有把模型使用成本也降下來,才能推動Agent的規模化應用。而通過技術和商業的雙重創新,豆包1.6首創按“輸入長度”區間定價,深度思考、多模態能力與基礎語言模型統一價格。在企業使用量最大的0-32K輸入區間,豆包1.6的輸入價格為0.8元/百萬tokens、輸出8元/百萬tokens,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,為目前的行業最低。“另外,我們還觀察到一個數據,那就是仍然存在大規模non-thinking模型的需求,而且這些請求的輸出都非常短。所以,這次我們還特別增設了一個特惠區,對于輸入32K、輸出200以內的請求,豆包1.6的價格將進一步降低到每百萬tokens輸入0.8元和輸出2元。這意味著絕大部分的non-thinking需求,仍然可以繼續享受和豆包1.0一樣的超低價格。AI普惠,我們這次盡全力了。”譚待表示。
圖:火山引擎總裁譚待
發布兩款AI安全產品和三款Agent方案,讓Agent規模化應用提速
為應對Agent運行的各類挑戰,火山引擎發布了兩款AI安全產品:一是AICC密態計算,它通過用戶個人密鑰加密、CPU/GPU硬件可信環境計算推理、數據流轉落盤全密文的方式,在保障推理效果的前提下,讓企業像使用私部模型一樣安全合規的使用云端模型。二是大模型應用防火墻,它脫胎于火山方舟每天十六萬億tokens服務的防護過程,通過精調的小參數模型、分層漏斗策略和流式送檢機制,低延遲、高精度的攔截攻擊變種,為企業智能體應用構建安全可信的大模型推理空間。通過這兩款產品,企業不僅可以安全的使用云上AI服務構建端云協同體系,還能有效保障AI資產和服務資源。
與此同時,火山引擎還發布了三個Agent方案:AgentKit,TrainingKit和ServingKit,幫助企業更高效地做好Agent服務、模型訓練和模型推理。
AgentKit,是一套為企業級Agent打造的全棧開發和服務工具鏈。AgentKit 集成了豆包大模型,支持開源UI-Tars模型和最新豆包1.6模型,能夠幫助企業通過模型快速生成Agent邏輯和工具調用。針對Agent Sandbox環境,通過火山引擎veFaaS預置應用模版可以實現開箱即用,并通過容器服務實現了分鐘級的 10 萬核高速擴容能力,保障了應用的可用性。與此同時,火山引擎開發套件構建了完整的工具生態體系,支持Computer Use、Browser Use、Phone Use等Tool Use,并覆蓋了數十類三方MCP Server,從而能夠大幅降低Agent開發的工程復雜性。
TrainingKit,是一款云原生訓練套件,能實現高達 60%+ 的MFU(算力利用率),在萬卡集群、千億參數模型訓練的集群上,算力利用率相比提升了30%。同時面向后訓練環節,Training Kit通過 veRL 框架、 Sandbox 百萬核秒并發能力,能夠有效提升后訓練效率,為 AI 訓練全流程筑牢技術底座。
ServingKit,是面向模型部署與推理的AI云原生推理套件,能從模型部署、在線推理、服務運維三個階段進行加速和提效。特別是在推理優化階段,它能始終保持開放兼容,廣泛地支持開源推理框架,并能針對主流模型進行算子優化,性能相比社區最新版本提升2-3倍。
字節跳動技術副總裁洪定坤認為,隨著模型能力的持續進步,AI將有機會成為調度者,通過調用不同的 Agent 和工具,讓軟件開發“all in one”,從而能夠更大幅度地降低開發門檻,提升開發效率。洪定坤表示,豆包1.6模型在編程能力上進步很大,目前已經接入字節的AI編程產品TRAE內測,新模型將很快推送給用戶。據洪定坤透露,在字節內部,超過80%的工程師在使用TRAE輔助開發。TRAE 的整體月活用戶已經超過了 100 萬。在演講中洪定坤舉例稱:“我們一位研發同事的孩子大概11歲,最近這個孩子在做一些奧數題目,他覺得用紙做的方式不是很方便,而網上有各種不同題目,于是他想有沒有可能做一個小網站把這些題目自動抓下來。于是,這名孩子使用TRAE開發了一個網站,這是一個真實的網站,可以在上面做題。由此可見,一個11歲的小朋友,在AI的幫助下也能很快地通過自己學習完成一次開發和生成一個應用。”
圖:字節跳動技術副總裁洪定坤
可以說,在AI時代,開發范式將首先發生重大變化。過去,無論是LAMP、SOA還是容器化、微服務,本質都是通過程序員來編寫算法和規則。而在AI時代,調用中心從程序員轉移到大模型。大模型和Agent開發平臺是AI時代的關鍵要素。模型只有實現強推理、多模態和低成本,才能支撐好Agent的大規模應用。同時,需要提供強化學習、Prompt優化、MCP Hub、知識庫、運行沙盒等開發平臺,以便基于模型開發出更好的Agent。
譚待認為,技術主體經歷了三個時代變化,AI時代會推動開發范式與技術架構全面升級。他說:“PC時代主體是Web,移動時代是APP,AI時代則是Agent。Agent能夠自主感知、規劃和反思,完成復雜任務。從被動工具轉變為主動執行者。豆包大模型和AI云原生將持續迭代,助力企業構建和大規模應用Agent。”他總結稱:“我們(得到認可)的訣竅就是心誠,就是你真心想做這件事情,不是把不好的模型免費賺一個吆喝說你看我賦能了多少開發者,而是要讓更多人運用AI創造價值。這之中主要涉及到三件事:把模型做好、把成本做低、以及把應用性和落地性工具做好”。同時,譚待還表示:“目前模型帶來的業績增長在所有產品中是最快的,同時也遠超其他產品,而且也是毛利最好的產品之一,我覺得這個業務還是非常值得期待的。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.