出品|網(wǎng)易科技《態(tài)度》欄目
作者|丁廣勝
意圖明確,Agent爆發(fā)的火候如果卡在「成本高」,豆包1.6要解決它。
剛剛,字節(jié)跳動(dòng)旗下火山引擎發(fā)布豆包大模型1.6系列,以及視頻生成模型Seedance 1.0 pro等新模型。
- doubao-seed-1.6:All-in-One 的綜合模型,是國(guó)內(nèi)首個(gè)支持256K 上下文的思考模型,支持深度思考、多模態(tài)理解、圖形界面操作等多項(xiàng)能力。支持選擇開(kāi)啟或關(guān)閉深度思考、自適應(yīng)思考三種方式,其中自適應(yīng)思考模式可根據(jù)提示詞難度自動(dòng)決定是否開(kāi)啟思考,提升效果的同時(shí)大幅減少 tokens 消耗。
- doubao-seed-1.6-thinking:豆包大模型1.6系列在深度思考方面的強(qiáng)化版本;在代碼、數(shù)學(xué)、邏輯推理等基礎(chǔ)能力上進(jìn)一步提升;支持256K 上下文。
- doubao-seed-1.6-flash:豆包大模型1.6系列的極速版本,支持深度思考、多模態(tài)理解、256K 上下文;延遲極低,TOPT 僅需10ms;視覺(jué)理解能力比肩友商旗艦?zāi)P汀?/li>
豆包1.6主要兩大變化,其一是豆包1.6成為國(guó)內(nèi)首款支持256K上下文的推理模型,這使得豆包能夠處理更復(fù)雜、更長(zhǎng)的文本輸入,從而更好地理解和生成內(nèi)容。其二是定價(jià)策略,其提出“區(qū)間定價(jià)”方案,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。
火山引擎總裁譚待在會(huì)后訪談中回應(yīng),區(qū)間定價(jià)是火山引擎的創(chuàng)新,豆包大模型很“誠(chéng)心”,價(jià)格不是為了賺吆喝,豆包一直在做持續(xù)性的、正毛利的事情,是通過(guò)模型結(jié)構(gòu)、效果、工程等的優(yōu)化,使得價(jià)格進(jìn)一步降低,從而去解決Agent產(chǎn)業(yè)的問(wèn)題——定價(jià)策略也參考了之前火山引擎做的客戶調(diào)研,客戶心中理想的價(jià)格是怎樣的至關(guān)重要。
當(dāng)然,視頻生成模型Seedance 1.0 pro也引發(fā)關(guān)注,實(shí)現(xiàn)了無(wú)縫多鏡頭敘事、多動(dòng)作及隨心運(yùn)鏡、穩(wěn)定運(yùn)動(dòng)與真實(shí)美感。重要關(guān)注點(diǎn)同樣是「價(jià)格」。Seedance 1.0 pro模型每千 tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,來(lái)到行業(yè)最低。
為了把價(jià)格卷到極致,今天的One more thing是豆包大模型“特惠區(qū)”,即對(duì)于輸入32K,輸出200以內(nèi)的請(qǐng)求,豆包1.6價(jià)格將進(jìn)一步降低到每百萬(wàn)tokens輸入0.8元,輸出2元。
這意味,絕大部分non-thinking(不用思考)的需求,仍然可以繼續(xù)享受和豆包1.0一樣的“地板價(jià)”。
“卷價(jià)格”只為Agent走向規(guī)模化
譚待表示,深度思考、多模態(tài)和工具調(diào)用等模型能力提升,是構(gòu)建Agent的關(guān)鍵要素。同時(shí),由于Agent每次執(zhí)行任務(wù)都會(huì)消耗大量tokens,模型使用成本也要降下來(lái),才能推動(dòng)Agent的規(guī)模化應(yīng)用。
基于這樣的考量,火山引擎計(jì)劃按“輸入長(zhǎng)度”區(qū)間定價(jià),深度思考、多模態(tài)能力與基礎(chǔ)語(yǔ)言模型統(tǒng)一價(jià)格。比如,在企業(yè)使用量最大的0-32K輸入?yún)^(qū)間,豆包1.6的輸入價(jià)格為0.8元/百萬(wàn)tokens、輸出8元/百萬(wàn)tokens,從而實(shí)現(xiàn)綜合成本只有豆包1.5深度思考模型的三分之一,即60%多。
成本一降再降,勢(shì)必助推Agent的生態(tài)的進(jìn)一步繁榮,探訪豆包大模型展區(qū)網(wǎng)易科技發(fā)現(xiàn),Agent應(yīng)用占據(jù)篇幅最多,人群也更為聚集,沒(méi)有人再討論大模型的能力極限在哪里?所有人都在問(wèn),這個(gè)Agent能干什么?能產(chǎn)生什么真正的價(jià)值?
火山引擎的“陽(yáng)謀”越來(lái)越明顯,Agent發(fā)展勢(shì)不可擋,那盡可能讓這個(gè)生態(tài)圍繞自己展開(kāi)。
從數(shù)據(jù)來(lái)看,豆包大模型日均tokens使用量超過(guò)16.4萬(wàn)億,較去年5月首次發(fā)布時(shí)增長(zhǎng)137倍。其中AI搜索增長(zhǎng)10倍,AI 編程增長(zhǎng)了8.4倍。視覺(jué)理解模型則是另一個(gè)助推器。比如,K12的在線教育,由于VLM模型能力不斷提升,Tokens消耗5個(gè)月增長(zhǎng)了12倍,而新出現(xiàn)的智能巡檢,視頻檢索等數(shù)個(gè)場(chǎng)景也快速實(shí)現(xiàn)日均百億tokens的突破。
據(jù)IDC報(bào)告,豆包大模型在中國(guó)公有云大模型市場(chǎng)份額排名第一,占比46.4%。很明顯,豆包不滿足于此。
我們看到,豆包大模型已經(jīng)涵蓋多模態(tài)、視頻、圖像、語(yǔ)音、音樂(lè)等模型品類。在行業(yè)應(yīng)用上也在跑馬圈地,譚待透露,他們服務(wù)著全球TOP10手機(jī)廠商中的9家、8成主流汽車品牌、70%的系統(tǒng)重要性銀行及超5成985高校。
1.6能力如何?拿下高考數(shù)學(xué)全國(guó)狀元
據(jù)譚待披露,在復(fù)雜推理、競(jìng)賽級(jí)數(shù)學(xué)、多輪對(duì)話和指令遵循等測(cè)試集上,豆包1.6-thinking的表現(xiàn)已躋身全球前列。(在GPQA Diamond測(cè)評(píng)集上取得了81.5分,在AIME25獲得了86.3分。MultiChallenge上得分48分)
與此同時(shí),豆包1.6模型支持多模態(tài)理解和圖形界面操作,能夠理解和處理真實(shí)世界問(wèn)題。換句話說(shuō),這讓豆包1.6具備了“行動(dòng)力”。案例顯示,豆包1.6可以自動(dòng)操作瀏覽器完成酒店預(yù)定,識(shí)別購(gòu)物小票并整理成Excel表格等任務(wù)。
而在大家更有體感的大模型做高考題環(huán)節(jié),譚待提到,豆包1.6做高考全國(guó)新一卷數(shù)學(xué)單科成績(jī)是144分,全國(guó)第一。“而在高考前,我們針對(duì)海淀區(qū)模擬全卷進(jìn)行了測(cè)評(píng),豆包1.6相對(duì)去年的表現(xiàn),理科成績(jī)顯著提升了154分,文科提升了90分。”譚待說(shuō)。
“安全才是一切 Agent 運(yùn)行的基礎(chǔ)”
講完價(jià)格和能力,再來(lái)看看開(kāi)發(fā)者生態(tài)。
火山引擎針對(duì)開(kāi)發(fā)者發(fā)布了一系列的順手工具。有火山引擎MCP服務(wù)、PromptPilot 智能提示工具、AI知識(shí)管理系統(tǒng)、veRL強(qiáng)化學(xué)習(xí)框架等,還有多模態(tài)數(shù)據(jù)湖、AICC私密計(jì)算、大模型應(yīng)用防火墻,以及一系列AI Infra套件。
特別是針對(duì)企業(yè)數(shù)據(jù)和用戶隱私保護(hù),如何防止惡意攻擊等安全挑戰(zhàn),火山引擎發(fā)布的AICC私密計(jì)算、大模型應(yīng)用防火墻已經(jīng)開(kāi)始落地,出現(xiàn)在聯(lián)想、中國(guó)銀聯(lián)、長(zhǎng)安汽車等企業(yè)案例中。
字節(jié)跳動(dòng)技術(shù)副總裁洪定坤認(rèn)為,隨著模型能力的持續(xù)進(jìn)步,AI有機(jī)會(huì)成為調(diào)度者,通過(guò)調(diào)用不同的 Agent 和工具,讓軟件開(kāi)發(fā)“all in one”,更大幅度地降低開(kāi)發(fā)門(mén)檻,提升開(kāi)發(fā)效率。
洪定坤透露,豆包1.6模型在編程能力上進(jìn)步很大,已經(jīng)接入字節(jié)的AI編程產(chǎn)品TRAE內(nèi)測(cè),新模型將很快推送給用戶。洪定坤說(shuō),在字節(jié)內(nèi)部,超過(guò)80%的工程師在使用TRAE輔助開(kāi)發(fā)。TRAE 的整體月活用戶已經(jīng)超過(guò)了100萬(wàn)。
這一切都在推動(dòng) Agent 爆發(fā)提速。
譚待說(shuō),如果說(shuō)24年是中國(guó)大模型應(yīng)用的元年,那25年將很可能是中國(guó)Agent落地的元年。他認(rèn)為技術(shù)主體經(jīng)歷了三個(gè)時(shí)代變化,“PC時(shí)代主體是Web,移動(dòng)時(shí)代是APP,AI時(shí)代則是Agent。”
而現(xiàn)在,軟件第一次從被動(dòng)的工具,變成主動(dòng)的執(zhí)行者。