財(cái)聯(lián)社6月14日訊(記者 付靜)“正如去年豆包1.0開啟了大模型規(guī)模調(diào)用一樣,我也相信豆包1.6和區(qū)間定價的新模式,能夠讓多模態(tài)深度思考得到更廣泛的調(diào)用,讓Agent的大規(guī)模應(yīng)用進(jìn)一步加速。”火山引擎總裁譚待在最新召開的Force原動力大會上表示。
今年以來AI智能體迎來爆發(fā),火山引擎日前最新升級豆包大模型,通過“區(qū)間定價”將其使用成本降至三分之一,以期使智能體規(guī)模化應(yīng)用提速。財(cái)聯(lián)社記者獲悉,智能體目前已在B端多場景率先落地,模型的智能水平和性價比提升將進(jìn)一步加速其大規(guī)模應(yīng)用。雖然業(yè)內(nèi)還在針對智能體進(jìn)行效果評估和持續(xù)迭代,但隨著智能體爆發(fā),強(qiáng)化學(xué)習(xí)的算力消耗正在快速攀升,為此軟硬件廠商通過生態(tài)協(xié)作,已推出了云邊一體的智算一體機(jī)方案。
智能體規(guī)模化應(yīng)用提速
去年底,豆包大模型曾一度引爆AI玩具板塊在內(nèi)的豆包概念股行情,本次Force原動力大會亦受到業(yè)內(nèi)期待,大會召開前夕二級市場上豆包概念股亦出現(xiàn)震蕩拉升。而財(cái)聯(lián)社記者在此次大會上看到,在豆包再度升級的基礎(chǔ)上,智能體作為重點(diǎn)方向被頻繁提及。
“我們實(shí)際正處于PC到移動到AI三個時代的變化之中。這三個時代里技術(shù)主體在發(fā)生變化,PC時代的主體是web,移動時代是APP,AI時代是Agent。”譚待表示。
據(jù)了解,深度思考、多模態(tài)和工具調(diào)用等模型能力提升,是構(gòu)建智能體的關(guān)鍵要素。火山引擎方面預(yù)計(jì),隨著大模型智能水平持續(xù)提升,智能體正逐漸進(jìn)入企業(yè)核心業(yè)務(wù),兩到三年之內(nèi)將帶來巨大的生產(chǎn)力提升。
同時火山引擎方面認(rèn)為,模型更優(yōu)的性價比將使智能體規(guī)模化應(yīng)用提速。
財(cái)聯(lián)社記者最新獲悉,豆包1.6按“輸入長度”區(qū)間定價,深度思考、多模態(tài)能力與基礎(chǔ)語言模型統(tǒng)一價格。在0-32K輸入?yún)^(qū)間,豆包1.6的輸入價格為0.8元/百萬tokens、輸出價格為8元/百萬tokens,綜合成本約為豆包1.5深度思考模型或DeepSeek R1的三分之一。
談及模型成本,譚待亦對其原理進(jìn)行了解釋:“大模型是按tokens來收費(fèi)。市面上有不同類型的模型,支持深度思考的、不支持深度思考的、支持多模態(tài)的等等,但實(shí)際上對于同結(jié)構(gòu)同參數(shù)的模型而言,對成本真正影響的是上下文長度,而不是是否開啟了思考和多模態(tài)功能。”
(大模型成本原理 財(cái)聯(lián)社記者攝)
目前火山引擎已經(jīng)推出了AI Agent平臺“扣子”、企業(yè)級智能體構(gòu)建平臺HiAgent等,支持智能體開發(fā)應(yīng)用。大會期間,財(cái)聯(lián)社記者亦注意到了“扣子”與產(chǎn)業(yè)鏈廠商共同推出的多款細(xì)分領(lǐng)域應(yīng)用。具體的應(yīng)用場景方面,智能體目前已涉足金融風(fēng)控審核、教育場景輔助教學(xué)、制造業(yè)等泛企業(yè)場景做流程的打通等。
實(shí)際上,智能體當(dāng)下已受到眾多廠商的積極加碼布局。5月,價格曾炒到10萬、一碼難求的AI智能體平臺Manus宣布開放注冊,騰訊、京東、榮耀、昆侖萬維(300418.SZ)等隨后陸續(xù)宣布各自智能體新進(jìn)展。5月22日上午天工超級智能體上線不久后,昆侖萬維更是發(fā)布了限流通知。
火山引擎AI生態(tài)與智能終端資深解決方案架構(gòu)師朱成剛表示,火山引擎目前主要聚焦的場景一是大模型核心能力,二是Agent開發(fā)支持能力。“在私有化場景里,模型的迭代速度沒有那么快,我們重點(diǎn)關(guān)注的還是企業(yè)如何能在內(nèi)部私有化場景里落地并發(fā)揮價值,因此關(guān)鍵點(diǎn)就成為做一套持續(xù)運(yùn)營、可優(yōu)化可迭代的智能體體系。”
一位從業(yè)者告訴財(cái)聯(lián)社記者,“現(xiàn)在我們看到,如果把大模型只當(dāng)成Chat bot來聊天的話,其實(shí)它真正幫助我們的效果并不見得很好。而Agent to B的利用效果會更好一些,尤其在跨多個不同的IT系統(tǒng)時幫助會更大。”
“真正面向企業(yè)的業(yè)務(wù),絕對不是一個大模型就能全部解決的。”另有業(yè)內(nèi)人士在現(xiàn)場這樣表示。
據(jù)朱成剛介紹,“我們最終提供的服務(wù)就是一個智能體應(yīng)用,想做出這樣的應(yīng)用需要大量工具和能力的支持,最簡單的方式就是大模型外部工具,目前是RAG、Function call和MCP。當(dāng)前階段MCP和A2A等開放智能體生態(tài)雖然有了標(biāo)準(zhǔn),在實(shí)際使用中還是存在一些問題,所以還是多種接入形態(tài)共存。”
火山引擎方面同時認(rèn)為,針對智能體的效果評估和持續(xù)迭代,將是長期的重要方向。
算力端催生一體機(jī)新需求
AI應(yīng)用端智能體的落地提速,將如何推動算力端演進(jìn)?
財(cái)聯(lián)社記者在大會現(xiàn)場注意到一個基于AI PC的案例:英特爾和“扣子”打造了基于AI PC的端云協(xié)同智能體,其典型應(yīng)用場景如執(zhí)行報銷、掛號、訂票等任務(wù)的事務(wù)助手。
一位英特爾展臺人士向財(cái)聯(lián)社記者展示了借助這一智能體在“微醫(yī)”平臺掛號的流程。該展臺人士稱,面對智能體爆發(fā)趨勢,“我們在AI PC上提供了更多工具鏈,幫助ISV(注:指獨(dú)立軟件供應(yīng)商)的應(yīng)用跑在AI PC上,不用耗費(fèi)云端算力,就實(shí)現(xiàn)在輕薄本上跑比較重的AI應(yīng)用。”
(英特爾AI PC掛號助手 財(cái)聯(lián)社記者攝)
不過實(shí)際場景中的算力需求不僅限于此。
“在過去的幾個月,我們看到強(qiáng)化學(xué)習(xí)的算力消耗正在快速攀升。我們也做一個大膽的預(yù)測,強(qiáng)化學(xué)習(xí)帶來的算力和資金消耗,有可能在2027年附近,逼近整個行業(yè)在預(yù)訓(xùn)練上的投入。”火山引擎智能算法負(fù)責(zé)人吳迪在大會期間透露。
財(cái)聯(lián)社記者從火山引擎方面獲悉,隨著大量智能體加速進(jìn)入現(xiàn)實(shí)世界,強(qiáng)化學(xué)習(xí)愈加重要,需考慮GPU/CPU資源混合編排、異構(gòu)算力調(diào)度、異步推理等。
一位英特爾技術(shù)專家現(xiàn)場告訴財(cái)聯(lián)社記者,“一些企業(yè)級客戶的需求是在本地部署模型,又擔(dān)心能力演進(jìn)無法跟上模型快速迭代的步伐。但若使用云上模型,又需考慮隱私數(shù)據(jù)、保密信息。另外,當(dāng)企業(yè)決定內(nèi)部部署時,一定會考慮性價比。”
財(cái)聯(lián)社記者注意到,英特爾、火山引擎HiAgent、華勝天成(600410.SH)三方聯(lián)合打造了智算一體機(jī)方案。
據(jù)了解,算力方面,該方案基于英特爾至強(qiáng)處理器和多張英特爾銳炫顯卡,銳炫Pro B60單卡可提供24GB顯存;平臺層面,HiAgent 2.0覆蓋了模型精調(diào)、推理優(yōu)化到智能體開發(fā)、編排、運(yùn)行的全生命周期;服務(wù)方面,華勝天成提供需求分析、方案設(shè)計(jì)、落地實(shí)施、運(yùn)維支持等服務(wù)。
值得一提的是,銳炫Pro B60系英特爾近期于臺北電腦展上最新發(fā)布,相比2023年發(fā)布的銳炫A770,顯存從16GB增加至24GB。
“一年前大家做企業(yè)里的知識問答,上下文長度只要10K就夠,我們現(xiàn)在接觸到的客戶需求超過32K的非常多。這提出了更大的顯存需求,因?yàn)殚L的上下文會消耗更多顯存,顯存對整個應(yīng)用性能及能夠支持的場景也有非常大的幫助。”英特爾方面向財(cái)聯(lián)社記者表示。
財(cái)聯(lián)社記者獲悉,一體機(jī)形態(tài)可分為純本地部署、云邊一體兩種。由于云上大模型按tokens收費(fèi),商業(yè)模式較簡單,因此相比需要考慮平臺整體成本的本地部署方案,云邊一體的一體機(jī)勝在性價比。據(jù)了解,前述一體機(jī)平臺既支持7B-72B主流模型,也支持Deepseek V3/R1 671B本地部署。
另外朱成剛提到,一體機(jī)客戶的重點(diǎn)投入會在硬件方面,軟件的預(yù)算和成本偏低,建議一體機(jī)分成兩端進(jìn)行。“首先提供開發(fā)端的核心開發(fā)和運(yùn)營管理能力,然后通過容器鏡像或其他打包方式分發(fā)到用戶客戶端,連接顯示器就可以完成應(yīng)用的調(diào)用。如果在單個或多個部門的辦公或協(xié)同場景,也可以做一些簡單的規(guī)劃隔離,保證用戶數(shù)據(jù)隔離,就可以在極低算力成本下跑通整個智能體平臺的核心能力。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.