網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI云，火山引擎如何“激進(jìn)”？

2025-06-13 19:09:03　來(lái)源: 鈦媒體APP

北京舉報(bào)

分享至

圖片系A(chǔ)I生成

“火山引擎，你的下一朵云?！辈恢螘r(shí)起，火山引擎的宣傳語(yǔ)霸占了一線城市的機(jī)場(chǎng)大屏。

商務(wù)人士出行必經(jīng)之路，也是政企業(yè)務(wù)營(yíng)銷必爭(zhēng)之地，與之并列的往往是另外幾家云廠或者IT企業(yè)，有時(shí)為了搶一塊牌子，或者誰(shuí)的牌子更靠前一點(diǎn)，還免不了一些暗中較勁。

彼時(shí)火山引擎作為后進(jìn)者，“下一朵云”的定位正合時(shí)宜，到了最近一年，宣傳語(yǔ)傳播的意思就沒(méi)那么到位。“還是下一朵么，那不就相當(dāng)于客戶一直沒(méi)用上么？”，朋友們私下討論，火山引擎主打的就是AI云，沒(méi)必要再做下一朵云。

也許是火山引擎也意識(shí)到了其中的bug，火山引擎總裁譚待透露，最近已經(jīng)打算更換logo語(yǔ)為“火山引擎，你的 AI 云。”AI云，對(duì)于所有云廠商來(lái)說(shuō)都是大機(jī)會(huì)，對(duì)于火山引擎尤為特別，在通用計(jì)算搶客戶，那是存量市場(chǎng)，在智算市場(chǎng)拓新，則是指數(shù)級(jí)增長(zhǎng)市場(chǎng)。

2025年，譚待用“激進(jìn)”來(lái)形容火山引擎的增長(zhǎng)目標(biāo)。雖然譚待沒(méi)有直接言明，有消息指出，火山引擎今年的營(yíng)收目標(biāo)是翻倍，其中很大一部分要靠AI相關(guān)的云服務(wù)來(lái)來(lái)實(shí)現(xiàn)。

火山引擎“激進(jìn)”的目標(biāo)如何實(shí)現(xiàn)，要看兩個(gè)大方面，其一是模型本身的效價(jià)比，在提供第一梯隊(duì)大模型效果的同時(shí)供給極低的價(jià)格，其二是卷Agent，不是只做Agent開(kāi)發(fā)工具或者平臺(tái)，而是補(bǔ)全Agent落地生產(chǎn)場(chǎng)景的全鏈路。

6月11日，字節(jié)跳動(dòng)旗下火山引擎舉辦Force原動(dòng)力大會(huì)，發(fā)布豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型，并升級(jí)了Agent開(kāi)發(fā)平臺(tái)等AI云原生服務(wù)。

豆包1.6，做更適合Agent的大模型

本次大會(huì)上，譚待透露，去年12月，豆包大模型的日均tokens調(diào)用量是4萬(wàn)億。今年3月份，豆包大模型的日均調(diào)用數(shù)是12.7萬(wàn)億。而截至今年5月底，這個(gè)數(shù)字已經(jīng)超過(guò)了16.4萬(wàn)億，仍然保持著高速增長(zhǎng)。

大模型調(diào)用量激增，很大程度來(lái)源于非聊天以外的新場(chǎng)景。如果對(duì)比今年5月份和去年12月的火山引擎Tokens消耗構(gòu)成數(shù)據(jù)，可以看到，隨著深度推理模型的發(fā)布，AI工具的Tokens消耗在快速增長(zhǎng)，5個(gè)月增長(zhǎng)了4.4倍。

其中AI搜索增長(zhǎng)10倍，AI 編程增長(zhǎng)了8.4倍，視覺(jué)理解模型則是另一個(gè)助推器。比如，K12的在線教育，由于VLM模型能力不斷提升，Tokens消耗5個(gè)月增長(zhǎng)了12倍，而新出現(xiàn)的智能巡檢，視頻檢索等數(shù)個(gè)場(chǎng)景也快速實(shí)現(xiàn)日均百億tokens的突破。

在企業(yè)級(jí)市場(chǎng)，大模型的應(yīng)用也在不斷深化，遍布消費(fèi)電子、汽車、金融和教育等行業(yè)，以在金融行業(yè)為例，火山引擎為客戶提供智能展業(yè)、投顧、投研等大模型應(yīng)用方案，已服務(wù)華泰證券、國(guó)信證券等數(shù)十家券商和基金公司，招商銀行、浦發(fā)、民生等70%的系統(tǒng)重要性銀行。

“做好Agent最重要的是底層模型，一定是一個(gè)多模態(tài)深度思考的模型，如果不是基于多模態(tài)深度思考模型，Agent能做出來(lái)的事情很有限而且很初級(jí)，豆包1.6就把這件事情做好了。”譚待說(shuō)。

本次升級(jí)的豆包1.6系列由三個(gè)模型組成，分別是doubao-seed-1.6；doubao-seed-1.6-thinking和doubao-seed-1.6-flash。

doubao-seed-1.6是all-in-one的綜合模型，支持深度思考，多模態(tài)理解，圖形界面操作等多項(xiàng)能力。特別是在深度思考方面，支持多種模式，開(kāi)發(fā)者可以選擇關(guān)閉深度思考、開(kāi)啟深度思考和自適應(yīng)思考三種方式。

其中自適應(yīng)思考下，模型可以根據(jù)prompt難度自動(dòng)決定是否開(kāi)啟thinking，在提升效果情況下，大幅減少tokens開(kāi)銷。doubao-seed-1.6也是國(guó)內(nèi)首個(gè)支持256K上下文的思考模型，這對(duì)于復(fù)雜agent的構(gòu)建來(lái)說(shuō)非常重要。

doubao-seed-1.6-thinking，則是1.6系列在深度思考方面的強(qiáng)化版本，它只支持深度思考模式，但在coding、math、邏輯推理等基礎(chǔ)能力上都有進(jìn)一步提升，同樣也支持256K上下文。

doubao-seed-1.6-flash，則是1.6系列的極速版本。1.6 flash同樣支持深度思考，多模態(tài)理解，256K窗口；但延遲極低，tpot僅需10ms，適用于延遲敏感場(chǎng)景。flash仍然有不錯(cuò)的性能，文本理解能力超過(guò)doubao 1.5 lite，視覺(jué)理解能力可以比肩其他旗艦?zāi)Ｐ汀?/p>

此外，豆包視頻生成模型Seedance 1.0 pro也正式亮相。該模型支持文字與圖片輸入，可生成多鏡頭無(wú)縫切換的1080P高品質(zhì)視頻，主體運(yùn)動(dòng)穩(wěn)定性與畫面自然度較高。在國(guó)際知名評(píng)測(cè)榜單 Artificial Analysis 上，Seedance在文生視頻、圖生視頻兩項(xiàng)任務(wù)上均排名首位，超越Veo3、可靈2.0等優(yōu)秀模型。

降價(jià)，帶著一點(diǎn)激進(jìn)

云計(jì)算行業(yè)的價(jià)格戰(zhàn)并不少見(jiàn)，數(shù)年前行業(yè)也曾掀起此起彼伏的低價(jià)競(jìng)爭(zhēng)，當(dāng)利潤(rùn)空間被極致壓縮，價(jià)格戰(zhàn)變成惡意降價(jià)，云計(jì)算的商業(yè)生態(tài)也就失去正向循環(huán)，行業(yè)都不想再次重演這一幕。

火山引擎沒(méi)有經(jīng)歷過(guò)上一次通算時(shí)代的價(jià)格戰(zhàn)，但是譚待并不想用低價(jià)卷市場(chǎng)。在他看來(lái)，降價(jià)是技術(shù)和規(guī)模的體現(xiàn)。

在技術(shù)層面，目前火山引擎降本很大程度都是在工程上的優(yōu)化；在規(guī)模層面，火山引擎的市場(chǎng)規(guī)模不算第一梯隊(duì)，但是距離頭部也很近，如果算上字節(jié)跳動(dòng)集團(tuán)海量的用云規(guī)模，規(guī)模效應(yīng)已經(jīng)能夠帶來(lái)足夠的降本空間。

值得一提的是，火山引擎將用戶成本拆開(kāi)來(lái)看，給出了針對(duì)性降本的策略。譚待指出，首先，大模型按tokens來(lái)收費(fèi)，市面上有不同類型的模型，支持深度思考的，不支持深度思考的，支持多模態(tài)的等等，但實(shí)際上對(duì)于同結(jié)構(gòu)同參數(shù)的模型而言，對(duì)成本真正影響的是上下文長(zhǎng)度長(zhǎng)度，而不是是否開(kāi)啟了思考和多模態(tài)功能?！?/p>

其次，上下文長(zhǎng)度對(duì)成本的影響是累加的，上下文越長(zhǎng)，或者簡(jiǎn)單說(shuō)輸入越長(zhǎng)，每一個(gè)輸出的成本就會(huì)遞增累加。

最后，模型輸入輸出長(zhǎng)度的分布是有一定規(guī)律的。當(dāng)前，大部分的調(diào)用，其輸入范圍都在32K以內(nèi)。

基于這些觀察，如果大模型能在推理層做好按照上下文長(zhǎng)度進(jìn)行調(diào)度，就能夠讓占大比例的模型請(qǐng)求，實(shí)現(xiàn)更低的成本和更快的速度。

豆包1.6的的定向降價(jià)也以此為基礎(chǔ)，首創(chuàng)按“輸入長(zhǎng)度”區(qū)間定價(jià)，深度思考、多模態(tài)能力與基礎(chǔ)語(yǔ)言模型統(tǒng)一價(jià)格。在企業(yè)使用量最大的0-32K輸入?yún)^(qū)間，豆包1.6的輸入價(jià)格為0.8元/百萬(wàn)tokens、輸出8元/百萬(wàn)tokens，綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens僅0.015元，每生成一條5秒的1080P視頻只需3.67元，為行業(yè)最低。

譚待表示，Agent的Token消耗量很大，以前AI大模型最早的應(yīng)用就是聊天，一個(gè)人和模型聊一個(gè)小時(shí)也就是20多萬(wàn)Token，現(xiàn)在Agent做一個(gè)復(fù)雜任務(wù)就要消耗20萬(wàn)Token。深度思考、多模態(tài)和工具調(diào)用等模型能力提升，是構(gòu)建Agent的關(guān)鍵要素，同時(shí)，由于Agent每次執(zhí)行任務(wù)都會(huì)消耗大量tokens，模型使用成本也要降下來(lái)，才能推動(dòng)Agent的規(guī)?；瘧?yīng)用。

此外，為了更好地支持Agent開(kāi)發(fā)與應(yīng)用，火山引擎AI云原生全棧服務(wù)升級(jí)，發(fā)布了火山引擎MCP服務(wù)、PromptPilot 智能提示工具、AI知識(shí)管理系統(tǒng)、veRL強(qiáng)化學(xué)習(xí)框架等產(chǎn)品，并推出多模態(tài)數(shù)據(jù)湖、AICC私密計(jì)算、大模型應(yīng)用防火墻，以及一系列AI Infra套件。

譚待認(rèn)為，技術(shù)主體經(jīng)歷了三個(gè)時(shí)代變化，AI時(shí)代會(huì)推動(dòng)開(kāi)發(fā)范式與技術(shù)架構(gòu)全面升級(jí)。他說(shuō)：“PC時(shí)代主體是Web，移動(dòng)時(shí)代是APP，AI時(shí)代則是Agent。Agent能夠自主感知、規(guī)劃和反思，完成復(fù)雜任務(wù)。從被動(dòng)工具轉(zhuǎn)變?yōu)橹鲃?dòng)執(zhí)行者。豆包大模型和AI云原生將持續(xù)迭代，助力企業(yè)構(gòu)建和大規(guī)模應(yīng)用Agent?！?strong>（本文首發(fā)于鈦媒體APP，作者 | 張帥，編輯 | 蓋虹達(dá)）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.