網易首頁 > 網易號 > 正文申請入駐

火山引擎譚待：“AI普惠，我們這次盡全力了”

2025-06-13 16:44:17　來源: DeepTech深科技

北京舉報

分享至

“你問我愛你有多深，我愛你有幾分，我的情也真，我的愛也真，月亮代表我的心。”2025年6月11日，在國家會議中心的會場，一首老歌響了起來。這并不是某位歌手的演唱會，而是豆包大模型的AI演唱。如今的豆包大模型，既可自動操作瀏覽器完成酒店預定，識別購物小票并整理成Excel表格等任務，還讓瑞幸咖啡基于它打造了首個AI點單智能體，能夠實現語音下單、猜你喜歡、點單更省時等功能，為用戶帶來“動動嘴就能點咖啡”的全新咖啡消費體驗。

就在當天的會場，字節跳動旗下火山引擎舉辦了Force原動力大會。會上，火山引擎總裁譚待展示了豆包大模型的更多功能，他表示：“有媒體針對高考全國新一卷數學單科做了測評，豆包的成績是144分，全國第一。而在高考前，我們針對海淀區模擬全卷進行了測評，豆包1.6相對2024年理科成績顯著提升了154分，文科提升了90分。”與此同時，本次會上火山引擎還為大模型做了“上新”。當天，其發布了豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型，并升級了Agent開發平臺等AI云原生服務。

性能躋身全球前排，價格“便宜大碗”

豆包1.6系列當前由三個模型組成，分別是doubao-seed-1.6；doubao-seed-1.6-thinking和doubao-seed-1.6-flash。

doubao-seed-1.6是all-in-one的綜合模型，也是國內首個支持256K上下文的思考模型，它支持深度思考、多模態理解、圖形界面操作等多項能力。特別是在深度思考方面，開發者可以選擇關閉深度思考、開啟深度思考和自適應思考三種方式。在自適應思考模式之下，模型可以根據prompt難度自動決定是否開啟thinking，在提升效果的前提之下可以大幅減少tokens開銷。

doubao-seed-1.6-thinking，是1.6系列在深度思考方面的強化版本，它只支持深度思考模式，但在coding、math、邏輯推理等基礎能力上都有進一步提升，同時也支持256K上下文。

doubao-seed-1.6-flash，是1.6系列的極速版本。它同樣支持深度思考、多模態理解和256K窗口。但是，它的延遲極低輸出每個 Token 的時間僅需10ms，適用于延遲敏感場景。其文本理解能力超過doubao 1.5 lite，視覺理解能力可以比肩友商旗艦模型。

會上，火山引擎披露了豆包1.6模型的多項權威測評成績。在復雜推理、競賽級數學、多輪對話和指令遵循等測試集上，豆包1.6-thinking的表現已躋身全球前列。據譚待介紹，豆包1.6系列模型支持多模態理解和圖形界面操作，能夠理解和處理真實世界問題。此前，豆包1.5的多模態能力在60個公開評測基準中取得38項最佳成績，并已廣泛用于電商識圖、自動駕駛數據標注、門店巡檢等場景。圖形界面操作能力則讓豆包1.6進一步具備“行動力”。與此同時，譚待還獨家揭秘了豆包APP的小流量DeepResearch功能。通過該功能，過去需要多名專業人士花費數小時或者幾天寫成的調研報告，豆包可以在5-30分鐘內完成，報告不僅內容扎實、結構嚴謹，還能自動提煉信息總結成網頁方便查閱。

豆包視頻生成模型Seedance 1.0 pro也在本次會上亮相。該模型支持文字與圖片輸入，能夠生成多鏡頭無縫切換的1080P高品質視頻，主體運動穩定性與畫面自然度較高。該模型還具備無縫多鏡頭的能力，這讓它能在幾秒的視頻中生成2個以上鏡頭的切換，并能伴隨著遠中近景畫面變化，讓畫面的信息量和敘事能力大幅提升。基于以上模型特點，火山引擎在電商、游戲和影視等場景使用Seedance 1.0 pro 分別做了嘗試。比如，在電商領域，無縫多鏡頭、多動作多主體互動等能力可以讓產品展示更加豐富。在影視領域，可以幫助從業人員快速驗證分鏡與敘事邏輯，減少前期籌備成本。在游戲領域，其用網易出品的常青仙俠游戲《逆水寒》做了嘗試，讓用戶創作自己的角色故事“親身”演繹劇情。在國際知名評測榜單 Artificial Analysis 上，Seedance在文生視頻、圖生視頻兩項任務上均排名首位。

目前，豆包大模型已涵蓋多模態、視頻、圖像、語音、音樂等模型品類，全方位推進智能提升和應用落地。在行業應用上，豆包大模型服務著全球TOP10手機廠商中的9家、8成主流汽車品牌、70%的系統重要性銀行及超5成985高校。譚待表示：“在手機行業，全球Top10手機廠商有9家和火山引擎深度合作。在汽車行業，在剛剛過去的上海車展，豆包大模型是被最多提及的名詞，我們還攜手長安汽車解決大模型安全測評的合規風險，護航智能化發展。在金融行業，火山引擎已經服務華泰證券、國信證券等數十家券商和基金公司，以及已經服務招商銀行、浦發銀行、民生銀行等70%的重要性銀行。在教育行業，火山引擎已與北京大學、浙江大學、南開大學等超五成985高校達成合作，持續推動高等教育智能化轉型。”數據顯示，豆包大模型日均tokens使用量超過16.4萬億，較2024年5月首次發布時增長137倍。另據IDC報告，豆包大模型在中國公有云大模型市場份額排名第一，占比高達46.4%。與此同時，豆包1.6成本下降了63%，企業只需要原來三分之一左右價格，就能獲得一個能力更強的原生多模態新模型。

譚待表示，深度思考、多模態和工具調用等模型能力的提升，是構建Agent的關鍵要素。同時，由于Agent每次執行任務都會消耗大量tokens，因此只有把模型使用成本也降下來，才能推動Agent的規模化應用。而通過技術和商業的雙重創新，豆包1.6首創按“輸入長度”區間定價，深度思考、多模態能力與基礎語言模型統一價格。在企業使用量最大的0-32K輸入區間，豆包1.6的輸入價格為0.8元/百萬tokens、輸出8元/百萬tokens，綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens僅0.015元，每生成一條5秒的1080P視頻只需3.67元，為目前的行業最低。“另外，我們還觀察到一個數據，那就是仍然存在大規模non-thinking模型的需求，而且這些請求的輸出都非常短。所以，這次我們還特別增設了一個特惠區，對于輸入32K、輸出200以內的請求，豆包1.6的價格將進一步降低到每百萬tokens輸入0.8元和輸出2元。這意味著絕大部分的non-thinking需求，仍然可以繼續享受和豆包1.0一樣的超低價格。AI普惠，我們這次盡全力了。”譚待表示。

圖：火山引擎總裁譚待

發布兩款AI安全產品和三款Agent方案，讓Agent規模化應用提速

為應對Agent運行的各類挑戰，火山引擎發布了兩款AI安全產品：一是AICC密態計算，它通過用戶個人密鑰加密、CPU/GPU硬件可信環境計算推理、數據流轉落盤全密文的方式，在保障推理效果的前提下，讓企業像使用私部模型一樣安全合規的使用云端模型。二是大模型應用防火墻，它脫胎于火山方舟每天十六萬億tokens服務的防護過程，通過精調的小參數模型、分層漏斗策略和流式送檢機制，低延遲、高精度的攔截攻擊變種，為企業智能體應用構建安全可信的大模型推理空間。通過這兩款產品，企業不僅可以安全的使用云上AI服務構建端云協同體系，還能有效保障AI資產和服務資源。

與此同時，火山引擎還發布了三個Agent方案：AgentKit，TrainingKit和ServingKit，幫助企業更高效地做好Agent服務、模型訓練和模型推理。

AgentKit，是一套為企業級Agent打造的全棧開發和服務工具鏈。AgentKit 集成了豆包大模型，支持開源UI-Tars模型和最新豆包1.6模型，能夠幫助企業通過模型快速生成Agent邏輯和工具調用。針對Agent Sandbox環境，通過火山引擎veFaaS預置應用模版可以實現開箱即用，并通過容器服務實現了分鐘級的 10 萬核高速擴容能力，保障了應用的可用性。與此同時，火山引擎開發套件構建了完整的工具生態體系，支持Computer Use、Browser Use、Phone Use等Tool Use，并覆蓋了數十類三方MCP Server，從而能夠大幅降低Agent開發的工程復雜性。

TrainingKit，是一款云原生訓練套件，能實現高達 60%+ 的MFU（算力利用率），在萬卡集群、千億參數模型訓練的集群上，算力利用率相比提升了30%。同時面向后訓練環節，Training Kit通過 veRL 框架、 Sandbox 百萬核秒并發能力，能夠有效提升后訓練效率，為 AI 訓練全流程筑牢技術底座。

ServingKit，是面向模型部署與推理的AI云原生推理套件，能從模型部署、在線推理、服務運維三個階段進行加速和提效。特別是在推理優化階段，它能始終保持開放兼容，廣泛地支持開源推理框架，并能針對主流模型進行算子優化，性能相比社區最新版本提升2-3倍。

字節跳動技術副總裁洪定坤認為，隨著模型能力的持續進步，AI將有機會成為調度者，通過調用不同的 Agent 和工具，讓軟件開發“all in one”，從而能夠更大幅度地降低開發門檻，提升開發效率。洪定坤表示，豆包1.6模型在編程能力上進步很大，目前已經接入字節的AI編程產品TRAE內測，新模型將很快推送給用戶。據洪定坤透露，在字節內部，超過80%的工程師在使用TRAE輔助開發。TRAE 的整體月活用戶已經超過了 100 萬。在演講中洪定坤舉例稱：“我們一位研發同事的孩子大概11歲，最近這個孩子在做一些奧數題目，他覺得用紙做的方式不是很方便，而網上有各種不同題目，于是他想有沒有可能做一個小網站把這些題目自動抓下來。于是，這名孩子使用TRAE開發了一個網站，這是一個真實的網站，可以在上面做題。由此可見，一個11歲的小朋友，在AI的幫助下也能很快地通過自己學習完成一次開發和生成一個應用。”

圖：字節跳動技術副總裁洪定坤

可以說，在AI時代，開發范式將首先發生重大變化。過去，無論是LAMP、SOA還是容器化、微服務，本質都是通過程序員來編寫算法和規則。而在AI時代，調用中心從程序員轉移到大模型。大模型和Agent開發平臺是AI時代的關鍵要素。模型只有實現強推理、多模態和低成本，才能支撐好Agent的大規模應用。同時，需要提供強化學習、Prompt優化、MCP Hub、知識庫、運行沙盒等開發平臺，以便基于模型開發出更好的Agent。

譚待認為，技術主體經歷了三個時代變化，AI時代會推動開發范式與技術架構全面升級。他說：“PC時代主體是Web，移動時代是APP，AI時代則是Agent。Agent能夠自主感知、規劃和反思，完成復雜任務。從被動工具轉變為主動執行者。豆包大模型和AI云原生將持續迭代，助力企業構建和大規模應用Agent。”他總結稱：“我們（得到認可）的訣竅就是心誠，就是你真心想做這件事情，不是把不好的模型免費賺一個吆喝說你看我賦能了多少開發者，而是要讓更多人運用AI創造價值。這之中主要涉及到三件事：把模型做好、把成本做低、以及把應用性和落地性工具做好”。同時，譚待還表示：“目前模型帶來的業績增長在所有產品中是最快的，同時也遠超其他產品，而且也是毛利最好的產品之一，我覺得這個業務還是非常值得期待的。”

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.