圖片系A(chǔ)I生成
“火山引擎,你的下一朵云?!辈恢螘r(shí)起,火山引擎的宣傳語(yǔ)霸占了一線城市的機(jī)場(chǎng)大屏。
商務(wù)人士出行必經(jīng)之路,也是政企業(yè)務(wù)營(yíng)銷必爭(zhēng)之地,與之并列的往往是另外幾家云廠或者IT企業(yè),有時(shí)為了搶一塊牌子,或者誰(shuí)的牌子更靠前一點(diǎn),還免不了一些暗中較勁。
彼時(shí)火山引擎作為后進(jìn)者,“下一朵云”的定位正合時(shí)宜,到了最近一年,宣傳語(yǔ)傳播的意思就沒(méi)那么到位。“還是下一朵么,那不就相當(dāng)于客戶一直沒(méi)用上么?”,朋友們私下討論,火山引擎主打的就是AI云,沒(méi)必要再做下一朵云。
也許是火山引擎也意識(shí)到了其中的bug,火山引擎總裁譚待透露,最近已經(jīng)打算更換logo語(yǔ)為“火山引擎,你的 AI 云。”AI云,對(duì)于所有云廠商來(lái)說(shuō)都是大機(jī)會(huì),對(duì)于火山引擎尤為特別,在通用計(jì)算搶客戶,那是存量市場(chǎng),在智算市場(chǎng)拓新,則是指數(shù)級(jí)增長(zhǎng)市場(chǎng)。
2025年,譚待用“激進(jìn)”來(lái)形容火山引擎的增長(zhǎng)目標(biāo)。雖然譚待沒(méi)有直接言明,有消息指出,火山引擎今年的營(yíng)收目標(biāo)是翻倍,其中很大一部分要靠AI相關(guān)的云服務(wù)來(lái)來(lái)實(shí)現(xiàn)。
火山引擎“激進(jìn)”的目標(biāo)如何實(shí)現(xiàn),要看兩個(gè)大方面,其一是模型本身的效價(jià)比,在提供第一梯隊(duì)大模型效果的同時(shí)供給極低的價(jià)格,其二是卷Agent,不是只做Agent開(kāi)發(fā)工具或者平臺(tái),而是補(bǔ)全Agent落地生產(chǎn)場(chǎng)景的全鏈路。
6月11日,字節(jié)跳動(dòng)旗下火山引擎舉辦Force原動(dòng)力大會(huì),發(fā)布豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型,并升級(jí)了Agent開(kāi)發(fā)平臺(tái)等AI云原生服務(wù)。
豆包1.6,做更適合Agent的大模型
本次大會(huì)上,譚待透露,去年12月,豆包大模型的日均tokens調(diào)用量是4萬(wàn)億。今年3月份,豆包大模型的日均調(diào)用數(shù)是12.7萬(wàn)億。而截至今年5月底,這個(gè)數(shù)字已經(jīng)超過(guò)了16.4萬(wàn)億,仍然保持著高速增長(zhǎng)。
大模型調(diào)用量激增,很大程度來(lái)源于非聊天以外的新場(chǎng)景。如果對(duì)比今年5月份和去年12月的火山引擎Tokens消耗構(gòu)成數(shù)據(jù),可以看到,隨著深度推理模型的發(fā)布,AI工具的Tokens消耗在快速增長(zhǎng),5個(gè)月增長(zhǎng)了4.4倍。
其中AI搜索增長(zhǎng)10倍,AI 編程增長(zhǎng)了8.4倍,視覺(jué)理解模型則是另一個(gè)助推器。比如,K12的在線教育,由于VLM模型能力不斷提升,Tokens消耗5個(gè)月增長(zhǎng)了12倍,而新出現(xiàn)的智能巡檢,視頻檢索等數(shù)個(gè)場(chǎng)景也快速實(shí)現(xiàn)日均百億tokens的突破。
在企業(yè)級(jí)市場(chǎng),大模型的應(yīng)用也在不斷深化,遍布消費(fèi)電子、汽車、金融和教育等行業(yè),以在金融行業(yè)為例,火山引擎為客戶提供智能展業(yè)、投顧、投研等大模型應(yīng)用方案,已服務(wù)華泰證券、國(guó)信證券等數(shù)十家券商和基金公司,招商銀行、浦發(fā)、民生等70%的系統(tǒng)重要性銀行。
“做好Agent最重要的是底層模型,一定是一個(gè)多模態(tài)深度思考的模型,如果不是基于多模態(tài)深度思考模型,Agent能做出來(lái)的事情很有限而且很初級(jí),豆包1.6就把這件事情做好了。”譚待說(shuō)。
本次升級(jí)的豆包1.6系列由三個(gè)模型組成,分別是doubao-seed-1.6;doubao-seed-1.6-thinking和doubao-seed-1.6-flash。
doubao-seed-1.6是all-in-one的綜合模型,支持深度思考,多模態(tài)理解,圖形界面操作等多項(xiàng)能力。特別是在深度思考方面,支持多種模式,開(kāi)發(fā)者可以選擇關(guān)閉深度思考、開(kāi)啟深度思考和自適應(yīng)思考三種方式。
其中自適應(yīng)思考下,模型可以根據(jù)prompt難度自動(dòng)決定是否開(kāi)啟thinking,在提升效果情況下,大幅減少tokens開(kāi)銷。doubao-seed-1.6也是國(guó)內(nèi)首個(gè)支持256K上下文的思考模型,這對(duì)于復(fù)雜agent的構(gòu)建來(lái)說(shuō)非常重要。
doubao-seed-1.6-thinking,則是1.6系列在深度思考方面的強(qiáng)化版本,它只支持深度思考模式, 但在coding、math、 邏輯推理等基礎(chǔ)能力上都有進(jìn)一步提升,同樣也支持256K上下文。
doubao-seed-1.6-flash,則是1.6系列的極速版本。1.6 flash同樣支持深度思考,多模態(tài)理解,256K窗口;但延遲極低,tpot僅需10ms,適用于延遲敏感場(chǎng)景。flash仍然有不錯(cuò)的性能,文本理解能力超過(guò)doubao 1.5 lite,視覺(jué)理解能力可以比肩其他旗艦?zāi)P汀?/p>
此外,豆包視頻生成模型Seedance 1.0 pro也正式亮相。該模型支持文字與圖片輸入,可生成多鏡頭無(wú)縫切換的1080P高品質(zhì)視頻,主體運(yùn)動(dòng)穩(wěn)定性與畫面自然度較高。在國(guó)際知名評(píng)測(cè)榜單 Artificial Analysis 上,Seedance在文生視頻、圖生視頻兩項(xiàng)任務(wù)上均排名首位,超越Veo3、可靈2.0等優(yōu)秀模型。
降價(jià),帶著一點(diǎn)激進(jìn)
云計(jì)算行業(yè)的價(jià)格戰(zhàn)并不少見(jiàn),數(shù)年前行業(yè)也曾掀起此起彼伏的低價(jià)競(jìng)爭(zhēng),當(dāng)利潤(rùn)空間被極致壓縮,價(jià)格戰(zhàn)變成惡意降價(jià),云計(jì)算的商業(yè)生態(tài)也就失去正向循環(huán),行業(yè)都不想再次重演這一幕。
火山引擎沒(méi)有經(jīng)歷過(guò)上一次通算時(shí)代的價(jià)格戰(zhàn),但是譚待并不想用低價(jià)卷市場(chǎng)。在他看來(lái),降價(jià)是技術(shù)和規(guī)模的體現(xiàn)。
在技術(shù)層面,目前火山引擎降本很大程度都是在工程上的優(yōu)化;在規(guī)模層面,火山引擎的市場(chǎng)規(guī)模不算第一梯隊(duì),但是距離頭部也很近,如果算上字節(jié)跳動(dòng)集團(tuán)海量的用云規(guī)模,規(guī)模效應(yīng)已經(jīng)能夠帶來(lái)足夠的降本空間。
值得一提的是,火山引擎將用戶成本拆開(kāi)來(lái)看,給出了針對(duì)性降本的策略。譚待指出,首先,大模型按tokens來(lái)收費(fèi),市面上有不同類型的模型,支持深度思考的,不支持深度思考的,支持多模態(tài)的等等,但實(shí)際上對(duì)于同結(jié)構(gòu)同參數(shù)的模型而言,對(duì)成本真正影響的是上下文長(zhǎng)度長(zhǎng)度,而不是是否開(kāi)啟了思考和多模態(tài)功能?!?/p>
其次,上下文長(zhǎng)度對(duì)成本的影響是累加的,上下文越長(zhǎng),或者簡(jiǎn)單說(shuō)輸入越長(zhǎng),每一個(gè)輸出的成本就會(huì)遞增累加。
最后,模型輸入輸出長(zhǎng)度的分布是有一定規(guī)律的。當(dāng)前,大部分的調(diào)用,其輸入范圍都在32K以內(nèi)。
基于這些觀察,如果大模型能在推理層做好按照上下文長(zhǎng)度進(jìn)行調(diào)度,就能夠讓占大比例的模型請(qǐng)求,實(shí)現(xiàn)更低的成本和更快的速度。
豆包1.6的的定向降價(jià)也以此為基礎(chǔ),首創(chuàng)按“輸入長(zhǎng)度”區(qū)間定價(jià),深度思考、多模態(tài)能力與基礎(chǔ)語(yǔ)言模型統(tǒng)一價(jià)格。在企業(yè)使用量最大的0-32K輸入?yún)^(qū)間,豆包1.6的輸入價(jià)格為0.8元/百萬(wàn)tokens、輸出8元/百萬(wàn)tokens,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,為行業(yè)最低。
譚待表示,Agent的Token消耗量很大,以前AI大模型最早的應(yīng)用就是聊天,一個(gè)人和模型聊一個(gè)小時(shí)也就是20多萬(wàn)Token,現(xiàn)在Agent做一個(gè)復(fù)雜任務(wù)就要消耗20萬(wàn)Token。深度思考、多模態(tài)和工具調(diào)用等模型能力提升,是構(gòu)建Agent的關(guān)鍵要素,同時(shí),由于Agent每次執(zhí)行任務(wù)都會(huì)消耗大量tokens,模型使用成本也要降下來(lái),才能推動(dòng)Agent的規(guī)?;瘧?yīng)用。
此外,為了更好地支持Agent開(kāi)發(fā)與應(yīng)用,火山引擎AI云原生全棧服務(wù)升級(jí),發(fā)布了火山引擎MCP服務(wù)、PromptPilot 智能提示工具、AI知識(shí)管理系統(tǒng)、veRL強(qiáng)化學(xué)習(xí)框架等產(chǎn)品,并推出多模態(tài)數(shù)據(jù)湖、AICC私密計(jì)算、大模型應(yīng)用防火墻,以及一系列AI Infra套件。
譚待認(rèn)為,技術(shù)主體經(jīng)歷了三個(gè)時(shí)代變化,AI時(shí)代會(huì)推動(dòng)開(kāi)發(fā)范式與技術(shù)架構(gòu)全面升級(jí)。他說(shuō):“PC時(shí)代主體是Web,移動(dòng)時(shí)代是APP,AI時(shí)代則是Agent。Agent能夠自主感知、規(guī)劃和反思,完成復(fù)雜任務(wù)。從被動(dòng)工具轉(zhuǎn)變?yōu)橹鲃?dòng)執(zhí)行者。豆包大模型和AI云原生將持續(xù)迭代,助力企業(yè)構(gòu)建和大規(guī)模應(yīng)用Agent?!?strong>(本文首發(fā)于鈦媒體APP,作者 | 張帥,編輯 | 蓋虹達(dá))
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.