“你問(wèn)我愛(ài)你有多深,我愛(ài)你有幾分,我的情也真,我的愛(ài)也真,月亮代表我的心。”2025年6月11日,在國(guó)家會(huì)議中心的會(huì)場(chǎng),一首老歌響了起來(lái)。這并不是某位歌手的演唱會(huì),而是豆包大模型的AI演唱。如今的豆包大模型,既可自動(dòng)操作瀏覽器完成酒店預(yù)定,識(shí)別購(gòu)物小票并整理成Excel表格等任務(wù),還讓瑞幸咖啡基于它打造了首個(gè)AI點(diǎn)單智能體,能夠?qū)崿F(xiàn)語(yǔ)音下單、猜你喜歡、點(diǎn)單更省時(shí)等功能,為用戶帶來(lái)“動(dòng)動(dòng)嘴就能點(diǎn)咖啡”的全新咖啡消費(fèi)體驗(yàn)。
就在當(dāng)天的會(huì)場(chǎng),字節(jié)跳動(dòng)旗下火山引擎舉辦了Force原動(dòng)力大會(huì)。會(huì)上,火山引擎總裁譚待展示了豆包大模型的更多功能,他表示:“有媒體針對(duì)高考全國(guó)新一卷數(shù)學(xué)單科做了測(cè)評(píng),豆包的成績(jī)是144分,全國(guó)第一。而在高考前,我們針對(duì)海淀區(qū)模擬全卷進(jìn)行了測(cè)評(píng),豆包1.6相對(duì)2024年理科成績(jī)顯著提升了154分,文科提升了90分。”與此同時(shí),本次會(huì)上火山引擎還為大模型做了“上新”。當(dāng)天,其發(fā)布了豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型,并升級(jí)了Agent開(kāi)發(fā)平臺(tái)等AI云原生服務(wù)。
性能躋身全球前排,價(jià)格“便宜大碗”
豆包1.6系列當(dāng)前由三個(gè)模型組成,分別是doubao-seed-1.6;doubao-seed-1.6-thinking和doubao-seed-1.6-flash。
doubao-seed-1.6是all-in-one的綜合模型,也是國(guó)內(nèi)首個(gè)支持256K上下文的思考模型,它支持深度思考、多模態(tài)理解、圖形界面操作等多項(xiàng)能力。特別是在深度思考方面,開(kāi)發(fā)者可以選擇關(guān)閉深度思考、開(kāi)啟深度思考和自適應(yīng)思考三種方式。在自適應(yīng)思考模式之下,模型可以根據(jù)prompt難度自動(dòng)決定是否開(kāi)啟thinking,在提升效果的前提之下可以大幅減少tokens開(kāi)銷。
doubao-seed-1.6-thinking,是1.6系列在深度思考方面的強(qiáng)化版本,它只支持深度思考模式,但在coding、math、邏輯推理等基礎(chǔ)能力上都有進(jìn)一步提升,同時(shí)也支持256K上下文。
doubao-seed-1.6-flash,是1.6系列的極速版本。它同樣支持深度思考、多模態(tài)理解和256K窗口。但是,它的延遲極低輸出每個(gè) Token 的時(shí)間僅需10ms,適用于延遲敏感場(chǎng)景。其文本理解能力超過(guò)doubao 1.5 lite,視覺(jué)理解能力可以比肩友商旗艦?zāi)P汀?/p>
會(huì)上,火山引擎披露了豆包1.6模型的多項(xiàng)權(quán)威測(cè)評(píng)成績(jī)。在復(fù)雜推理、競(jìng)賽級(jí)數(shù)學(xué)、多輪對(duì)話和指令遵循等測(cè)試集上,豆包1.6-thinking的表現(xiàn)已躋身全球前列。據(jù)譚待介紹,豆包1.6系列模型支持多模態(tài)理解和圖形界面操作,能夠理解和處理真實(shí)世界問(wèn)題。此前,豆包1.5的多模態(tài)能力在60個(gè)公開(kāi)評(píng)測(cè)基準(zhǔn)中取得38項(xiàng)最佳成績(jī),并已廣泛用于電商識(shí)圖、自動(dòng)駕駛數(shù)據(jù)標(biāo)注、門(mén)店巡檢等場(chǎng)景。圖形界面操作能力則讓豆包1.6進(jìn)一步具備“行動(dòng)力”。與此同時(shí),譚待還獨(dú)家揭秘了豆包APP的小流量DeepResearch功能。通過(guò)該功能,過(guò)去需要多名專業(yè)人士花費(fèi)數(shù)小時(shí)或者幾天寫(xiě)成的調(diào)研報(bào)告,豆包可以在5-30分鐘內(nèi)完成,報(bào)告不僅內(nèi)容扎實(shí)、結(jié)構(gòu)嚴(yán)謹(jǐn),還能自動(dòng)提煉信息總結(jié)成網(wǎng)頁(yè)方便查閱。
豆包視頻生成模型Seedance 1.0 pro也在本次會(huì)上亮相。該模型支持文字與圖片輸入,能夠生成多鏡頭無(wú)縫切換的1080P高品質(zhì)視頻,主體運(yùn)動(dòng)穩(wěn)定性與畫(huà)面自然度較高。該模型還具備無(wú)縫多鏡頭的能力,這讓它能在幾秒的視頻中生成2個(gè)以上鏡頭的切換,并能伴隨著遠(yuǎn)中近景畫(huà)面變化,讓畫(huà)面的信息量和敘事能力大幅提升。基于以上模型特點(diǎn),火山引擎在電商、游戲和影視等場(chǎng)景使用Seedance 1.0 pro 分別做了嘗試。比如,在電商領(lǐng)域,無(wú)縫多鏡頭、多動(dòng)作多主體互動(dòng)等能力可以讓產(chǎn)品展示更加豐富。在影視領(lǐng)域,可以幫助從業(yè)人員快速驗(yàn)證分鏡與敘事邏輯,減少前期籌備成本。在游戲領(lǐng)域,其用網(wǎng)易出品的常青仙俠游戲《逆水寒》做了嘗試,讓用戶創(chuàng)作自己的角色故事“親身”演繹劇情。在國(guó)際知名評(píng)測(cè)榜單 Artificial Analysis 上,Seedance在文生視頻、圖生視頻兩項(xiàng)任務(wù)上均排名首位。
目前,豆包大模型已涵蓋多模態(tài)、視頻、圖像、語(yǔ)音、音樂(lè)等模型品類,全方位推進(jìn)智能提升和應(yīng)用落地。在行業(yè)應(yīng)用上,豆包大模型服務(wù)著全球TOP10手機(jī)廠商中的9家、8成主流汽車(chē)品牌、70%的系統(tǒng)重要性銀行及超5成985高校。譚待表示:“在手機(jī)行業(yè),全球Top10手機(jī)廠商有9家和火山引擎深度合作。在汽車(chē)行業(yè),在剛剛過(guò)去的上海車(chē)展,豆包大模型是被最多提及的名詞,我們還攜手長(zhǎng)安汽車(chē)解決大模型安全測(cè)評(píng)的合規(guī)風(fēng)險(xiǎn),護(hù)航智能化發(fā)展。在金融行業(yè),火山引擎已經(jīng)服務(wù)華泰證券、國(guó)信證券等數(shù)十家券商和基金公司,以及已經(jīng)服務(wù)招商銀行、浦發(fā)銀行、民生銀行等70%的重要性銀行。在教育行業(yè),火山引擎已與北京大學(xué)、浙江大學(xué)、南開(kāi)大學(xué)等超五成985高校達(dá)成合作,持續(xù)推動(dòng)高等教育智能化轉(zhuǎn)型。”數(shù)據(jù)顯示,豆包大模型日均tokens使用量超過(guò)16.4萬(wàn)億,較2024年5月首次發(fā)布時(shí)增長(zhǎng)137倍。另?yè)?jù)IDC報(bào)告,豆包大模型在中國(guó)公有云大模型市場(chǎng)份額排名第一,占比高達(dá)46.4%。與此同時(shí),豆包1.6成本下降了63%,企業(yè)只需要原來(lái)三分之一左右價(jià)格,就能獲得一個(gè)能力更強(qiáng)的原生多模態(tài)新模型。
譚待表示,深度思考、多模態(tài)和工具調(diào)用等模型能力的提升,是構(gòu)建Agent的關(guān)鍵要素。同時(shí),由于Agent每次執(zhí)行任務(wù)都會(huì)消耗大量tokens,因此只有把模型使用成本也降下來(lái),才能推動(dòng)Agent的規(guī)模化應(yīng)用。而通過(guò)技術(shù)和商業(yè)的雙重創(chuàng)新,豆包1.6首創(chuàng)按“輸入長(zhǎng)度”區(qū)間定價(jià),深度思考、多模態(tài)能力與基礎(chǔ)語(yǔ)言模型統(tǒng)一價(jià)格。在企業(yè)使用量最大的0-32K輸入?yún)^(qū)間,豆包1.6的輸入價(jià)格為0.8元/百萬(wàn)tokens、輸出8元/百萬(wàn)tokens,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,為目前的行業(yè)最低。“另外,我們還觀察到一個(gè)數(shù)據(jù),那就是仍然存在大規(guī)模non-thinking模型的需求,而且這些請(qǐng)求的輸出都非常短。所以,這次我們還特別增設(shè)了一個(gè)特惠區(qū),對(duì)于輸入32K、輸出200以內(nèi)的請(qǐng)求,豆包1.6的價(jià)格將進(jìn)一步降低到每百萬(wàn)tokens輸入0.8元和輸出2元。這意味著絕大部分的non-thinking需求,仍然可以繼續(xù)享受和豆包1.0一樣的超低價(jià)格。AI普惠,我們這次盡全力了。”譚待表示。
圖:火山引擎總裁譚待
發(fā)布兩款A(yù)I安全產(chǎn)品和三款A(yù)gent方案,讓Agent規(guī)模化應(yīng)用提速
為應(yīng)對(duì)Agent運(yùn)行的各類挑戰(zhàn),火山引擎發(fā)布了兩款A(yù)I安全產(chǎn)品:一是AICC密態(tài)計(jì)算,它通過(guò)用戶個(gè)人密鑰加密、CPU/GPU硬件可信環(huán)境計(jì)算推理、數(shù)據(jù)流轉(zhuǎn)落盤(pán)全密文的方式,在保障推理效果的前提下,讓企業(yè)像使用私部模型一樣安全合規(guī)的使用云端模型。二是大模型應(yīng)用防火墻,它脫胎于火山方舟每天十六萬(wàn)億tokens服務(wù)的防護(hù)過(guò)程,通過(guò)精調(diào)的小參數(shù)模型、分層漏斗策略和流式送檢機(jī)制,低延遲、高精度的攔截攻擊變種,為企業(yè)智能體應(yīng)用構(gòu)建安全可信的大模型推理空間。通過(guò)這兩款產(chǎn)品,企業(yè)不僅可以安全的使用云上AI服務(wù)構(gòu)建端云協(xié)同體系,還能有效保障AI資產(chǎn)和服務(wù)資源。
與此同時(shí),火山引擎還發(fā)布了三個(gè)Agent方案:AgentKit,TrainingKit和ServingKit,幫助企業(yè)更高效地做好Agent服務(wù)、模型訓(xùn)練和模型推理。
AgentKit,是一套為企業(yè)級(jí)Agent打造的全棧開(kāi)發(fā)和服務(wù)工具鏈。AgentKit 集成了豆包大模型,支持開(kāi)源UI-Tars模型和最新豆包1.6模型,能夠幫助企業(yè)通過(guò)模型快速生成Agent邏輯和工具調(diào)用。針對(duì)Agent Sandbox環(huán)境,通過(guò)火山引擎veFaaS預(yù)置應(yīng)用模版可以實(shí)現(xiàn)開(kāi)箱即用,并通過(guò)容器服務(wù)實(shí)現(xiàn)了分鐘級(jí)的 10 萬(wàn)核高速擴(kuò)容能力,保障了應(yīng)用的可用性。與此同時(shí),火山引擎開(kāi)發(fā)套件構(gòu)建了完整的工具生態(tài)體系,支持Computer Use、Browser Use、Phone Use等Tool Use,并覆蓋了數(shù)十類三方MCP Server,從而能夠大幅降低Agent開(kāi)發(fā)的工程復(fù)雜性。
TrainingKit,是一款云原生訓(xùn)練套件,能實(shí)現(xiàn)高達(dá) 60%+ 的MFU(算力利用率),在萬(wàn)卡集群、千億參數(shù)模型訓(xùn)練的集群上,算力利用率相比提升了30%。同時(shí)面向后訓(xùn)練環(huán)節(jié),Training Kit通過(guò) veRL 框架、 Sandbox 百萬(wàn)核秒并發(fā)能力,能夠有效提升后訓(xùn)練效率,為 AI 訓(xùn)練全流程筑牢技術(shù)底座。
ServingKit,是面向模型部署與推理的AI云原生推理套件,能從模型部署、在線推理、服務(wù)運(yùn)維三個(gè)階段進(jìn)行加速和提效。特別是在推理優(yōu)化階段,它能始終保持開(kāi)放兼容,廣泛地支持開(kāi)源推理框架,并能針對(duì)主流模型進(jìn)行算子優(yōu)化,性能相比社區(qū)最新版本提升2-3倍。
字節(jié)跳動(dòng)技術(shù)副總裁洪定坤認(rèn)為,隨著模型能力的持續(xù)進(jìn)步,AI將有機(jī)會(huì)成為調(diào)度者,通過(guò)調(diào)用不同的 Agent 和工具,讓軟件開(kāi)發(fā)“all in one”,從而能夠更大幅度地降低開(kāi)發(fā)門(mén)檻,提升開(kāi)發(fā)效率。洪定坤表示,豆包1.6模型在編程能力上進(jìn)步很大,目前已經(jīng)接入字節(jié)的AI編程產(chǎn)品TRAE內(nèi)測(cè),新模型將很快推送給用戶。據(jù)洪定坤透露,在字節(jié)內(nèi)部,超過(guò)80%的工程師在使用TRAE輔助開(kāi)發(fā)。TRAE 的整體月活用戶已經(jīng)超過(guò)了 100 萬(wàn)。在演講中洪定坤舉例稱:“我們一位研發(fā)同事的孩子大概11歲,最近這個(gè)孩子在做一些奧數(shù)題目,他覺(jué)得用紙做的方式不是很方便,而網(wǎng)上有各種不同題目,于是他想有沒(méi)有可能做一個(gè)小網(wǎng)站把這些題目自動(dòng)抓下來(lái)。于是,這名孩子使用TRAE開(kāi)發(fā)了一個(gè)網(wǎng)站,這是一個(gè)真實(shí)的網(wǎng)站,可以在上面做題。由此可見(jiàn),一個(gè)11歲的小朋友,在AI的幫助下也能很快地通過(guò)自己學(xué)習(xí)完成一次開(kāi)發(fā)和生成一個(gè)應(yīng)用。”
圖:字節(jié)跳動(dòng)技術(shù)副總裁洪定坤
可以說(shuō),在AI時(shí)代,開(kāi)發(fā)范式將首先發(fā)生重大變化。過(guò)去,無(wú)論是LAMP、SOA還是容器化、微服務(wù),本質(zhì)都是通過(guò)程序員來(lái)編寫(xiě)算法和規(guī)則。而在AI時(shí)代,調(diào)用中心從程序員轉(zhuǎn)移到大模型。大模型和Agent開(kāi)發(fā)平臺(tái)是AI時(shí)代的關(guān)鍵要素。模型只有實(shí)現(xiàn)強(qiáng)推理、多模態(tài)和低成本,才能支撐好Agent的大規(guī)模應(yīng)用。同時(shí),需要提供強(qiáng)化學(xué)習(xí)、Prompt優(yōu)化、MCP Hub、知識(shí)庫(kù)、運(yùn)行沙盒等開(kāi)發(fā)平臺(tái),以便基于模型開(kāi)發(fā)出更好的Agent。
譚待認(rèn)為,技術(shù)主體經(jīng)歷了三個(gè)時(shí)代變化,AI時(shí)代會(huì)推動(dòng)開(kāi)發(fā)范式與技術(shù)架構(gòu)全面升級(jí)。他說(shuō):“PC時(shí)代主體是Web,移動(dòng)時(shí)代是APP,AI時(shí)代則是Agent。Agent能夠自主感知、規(guī)劃和反思,完成復(fù)雜任務(wù)。從被動(dòng)工具轉(zhuǎn)變?yōu)橹鲃?dòng)執(zhí)行者。豆包大模型和AI云原生將持續(xù)迭代,助力企業(yè)構(gòu)建和大規(guī)模應(yīng)用Agent。”他總結(jié)稱:“我們(得到認(rèn)可)的訣竅就是心誠(chéng),就是你真心想做這件事情,不是把不好的模型免費(fèi)賺一個(gè)吆喝說(shuō)你看我賦能了多少開(kāi)發(fā)者,而是要讓更多人運(yùn)用AI創(chuàng)造價(jià)值。這之中主要涉及到三件事:把模型做好、把成本做低、以及把應(yīng)用性和落地性工具做好”。同時(shí),譚待還表示:“目前模型帶來(lái)的業(yè)績(jī)?cè)鲩L(zhǎng)在所有產(chǎn)品中是最快的,同時(shí)也遠(yuǎn)超其他產(chǎn)品,而且也是毛利最好的產(chǎn)品之一,我覺(jué)得這個(gè)業(yè)務(wù)還是非常值得期待的。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.