智東西
作者 ZeR0
編輯 漠影
智東西5月21日報道,今日,騰訊云披露最新AI戰略布局,全面升級騰訊大模型矩陣產品,并詳細分享新發布的視覺理解模型、圖像2.0模型、3D生成模型、語音端到端模型、游戲視覺模型,并預告了多款即將發布的新模型、新工具、新功能。
混元Voice在元寶已灰度上線,近期將推出實時視頻通話AI體驗。大規模、可漫游的3D場景生成模型也將于近期發布。騰訊還將持續開源多個不同尺寸的企業級混合推理模型、端側混合推理模型、多模態基礎模型以及配套插件模型。
騰訊云發布語音PaaS解決方案,并將大模型知識引擎全面升級為騰訊云智能體開發平臺,幫助企業構建懂業務、能執行、給結果、強安全的智能體(Agent)。截至7月7日12點,騰訊云智能體開發平臺企業新用戶可免費領取DeepSeek 300萬tokens。
騰訊集團高級執行副總裁,云與智慧產業事業群CEO湯道生談道,模型深度思考的突破,推動生成式AI的可用性從“量變”發展到“質變”,騰訊持續加大AI投入力度,各項業務全面擁抱AI,同時以大模型、智能體、知識庫、基礎設施“四個加速”,打造“好用的AI”,助力AI走進千行百業,走近每個人的生活。
優化模型可以提升性能和交互體驗;智能體可以賦予模型獨立執行任務的能力;知識庫能幫助減少模型幻覺,更懂企業和用戶;基礎設施和工程優化可以降低訓推成本、提升響應速度。
一、湯道生:各項業務全面擁抱AI,“四個加速”助力AI落地
騰訊集團高級執行副總裁,云與智慧產業事業群CEO湯道生分享說,騰訊各項業務已全面擁抱AI。
在AI驅動下,廣告業務定向能力和創意解決方案不斷增強,收入實現雙位數增長;游戲業務通過AI優化匹配體驗,提升了長青游戲的用戶粘性;在視頻與音樂服務中,AI大幅提升了動畫制作、實拍內容、視頻及音樂創作的效率。
在騰訊云上,產業對大模型API調用量激增;語音交互的需求帶動了ASR(自動語音識別)與TTS(文本轉語音)模型的API調用;AI應用的普及,不僅帶動算力增長,還帶動了存儲、網絡、數據庫,以及大數據基礎設施的能力升級。
隨著AI持續落地,每個企業正在成為AI公司,每個人也正在成為AI加持的“超級個體”。
湯道生提到AI落地的幾個關鍵問題:與系統的交互,能不能通過AI變得更簡單?模型能不能直接執行一系列操作,然后給出結果?AI的使用成本,是不是可以更低?
對此,騰訊提出“四個加速”:加速大模型創新、加速智能體應用、加速知識庫建設、加速基礎設施升級。
第一,加速大模型創新,用更先進的模型、更自然的交互,降低AI應用門檻。
騰訊混元大模型矩陣包括混元Turbo 5、視覺深度推理模型混元T1、多模態模型混元Vision、端到端語音通話模型混元Voice、3D生成模型混元3D、商用級實時生圖模型混元Image。
騰訊混元T1和Turbo S能力持續迭代,在全球權威Chatbot Arena排行中,混元Turbo S已進入全球前8,中國大模型中僅次于DeepSeek。在多模態領域,騰訊混元的視覺理解、語音交互、3D、實時生圖等能力,也得到行業的廣泛認可。
騰訊混元大模型全面開源,覆蓋文本、圖像、視頻、3D等全模態,GitHub總Star超過3萬,多次登頂Hugging Face趨勢榜,廣泛落地30多個行業,與50多家生態伙伴進行場景共創,推動大模型在更多領域落地生根。
其次,加速智能體應用,讓AI從“會思考”到“能執行”,從“給想法”到“給結果”。
智能體讓AI有了“手和腳”,成為能直接干活的“智能員工”,極大拓展了AI的價值邊界。
今日,騰訊將大模型知識引擎全面升級為智能體開發平臺,幫助企業快速構建智能體應用。
騰訊云智能體開發平臺構建了完備的智能體工具體系,支持MCP協議、兼容OpenAI Agents SDK的關鍵定義,還預置了豐富的內、外部高質量插件,包括騰訊位置服務等生態MCP Server。這些能力能幫助智能體更好地調用工具,查詢專業數據,拓展服務邊界。
QQ瀏覽器、騰訊健康、騰訊云代碼助手CodeBuddy、騰訊企點營銷云等騰訊應用都借助這個平臺加入了智能體的能力。
比如QQ瀏覽器智能體QBot,用戶只需發一個任務指令,它就能直接進行搜索、瀏覽、查詢、下載、分析等一系列操作。
騰訊即將推出首個高考智能體「AI高考通」,結合考生專業能力、興趣及權威信息,快速生成與調整志愿填報的參考方案。
ima持續幫助個人增強知識庫能力,最近發布了“知識號”,推動各領域專業人士開設專業知識庫,提升用戶在垂直領域的問答精準度,也為創作者帶來高流量和高曝光。知識號上線至今,創作者貢獻了超過1000萬篇內容,服務了百萬級用戶的問答。
在醫療領域,騰訊推出了健康管理智能體「AI健康管理助手」。它可以自動解讀體檢報告,智能分析用戶健康狀況,及時發現潛在風險,還可以調動問答功能,深入解釋異常指標和應對方法,并為用戶指定個性化的多項健康管理計劃。
騰訊云代碼助手CodeBuddy推出了Craft軟件開發智能體。開發者用自然語言講出需求,它就能自動拆解任務,設計模塊,生成代碼,然后通過“檢驗-規劃-執行-再檢驗”的過程,不斷糾錯,實現能力持續進化。在騰訊,85%以上的開發崗員工都在使用騰訊云代碼助手,整體編程時間平均縮短了40%以上。
基于騰訊云智能體開發平臺,騰訊打造了騰訊企點營銷云智能體,幫助企業營銷全鏈路的智能升級。最近騰訊與客戶絕味食品啟動了一項試驗,由智能體發起的活動內容點擊率,比人工專家策劃的內容方案高出40%,轉化率提升了25%。
第三,很多企業在加速知識庫建設,打造AI產品專家,加強銷售轉化,為客戶提供更好服務。
騰訊不斷迭代知識庫產品,正式發布騰訊樂享企業AI知識庫。它打破了部門與層級壁壘,對知識的有效性、更新時間、權限進行管控,還支持多人在線編輯、互動,讓員工圍繞同一知識主題,共同完善內容,優化知識體系。
例如,機器人公司科沃斯利用樂享打造了AI助手,導購只需要講出需求,模型就能夠三句話總結產品賣點、生成營銷話術、制定營銷活動方案,推動全國門店人效實現兩位數提升,年運營成本節省數百萬元。
最后,加速基礎設施升級,用更少的資源,實現高性能的推理,提升性價比。
隨著模型應用的普及,智算需求從訓練驅動轉向推理主導。規?;评淼某杀緝灮蔀樵茝S商的核心競爭力。
騰訊云的AI Infra通過IaaS層與工具層協同優化,提升模型在推理場景下的響應速度、低延時能力和性價比。
騰訊云不斷迭代智算的HCC、高性能存儲的GooseFS、CFS Turbo、高速交換的星脈網絡,實現了顯存帶寬、存儲帶寬、互聯帶寬的全面提升,訓練Infra綜合性能提升30%。
騰訊云TI平臺的訓推一體、潮汐調度的解決方案,在同一集群支持白天推理,晚上訓練,實現了算力的靈活調度;同時適配了多個開源模型,覆蓋精調、蒸餾、強化學習等訓練模式。
在推理加速層面,騰訊云通過內核深度優化和分布式推理能力建設,顯著提升了模型的推理性能。
手機里的AI功能越來越多,大模型調用頻繁、并發量很高?;隍v訊云的加速能力,榮耀部署DeepSeek-R1滿血版服務,推理吞吐最高提效54%,大幅提升推理速度,也讓模型運行更快更穩,系統調度更順暢。
二、混元大模型矩陣全面升級:預告視頻通話模型、3D場景模型,將開源多尺寸模型
騰訊云副總裁、騰訊混元大模型技術負責人王迪談道,騰訊混元大模型向深度和廣度持續演進,已形成完整模型矩陣。
語言模型方面,基于創新混合Mamba MoE架構,混元旗艦快思考模型Turbo S在Chatbot Arena大模型競技場綜合排名全球第8,理科推理能力提升超10%,代碼能力提升24%,競賽數學能力提升39%。
混元自研深度思考模型T1擅長超長文本推理,輸出文風簡潔,其新升級包括獎勵系統全面升級、擴充執行沙盒的覆蓋、多階段強化學習訓練。相比前代版本,T1在競賽數學、知識問答、智能體能力等多個基準測試上效果提升明顯。
多模態模型方面,基于Turbo S基座,騰訊新推出混元視覺深度推理模型T1 Vision和端到端語音通話模型混元Voice。
T1 Vision是一個原生圖片長思維鏈深度模型,支持多頭輸入,可輕松實現邊看圖邊思考,視覺深度理解的整體效果提升5.3%。
混元Voice端到端延遲僅1.6秒,語音進,語音出,保留說話人的聲音、情緒,響應速度提升30%,回復的擬人性提升27%,情緒應用提升25%?;煸猇oice在元寶已灰度上線,近期將推出實時視頻通話AI體驗。
多模態生成方面,混元Image V2.0是首個毫秒級商用級生圖模型,出圖速度比前一代提升15倍,支持通過實時語音交互來進行動態圖像生成。用戶話還沒說完,模型就已經把修改圖顯示出來。用戶也可以上傳手繪草圖,再輸入修改指令,讓模型進行實時響應生成。
這背后得益于三項基礎創新:超高壓縮率編解碼器,對抗蒸餾加速技術,以及強大的基礎模型能力。
除了快,混元Image V2.0的生成畫面質感非常寫實,文生圖客觀指標大幅領先,最大限度降低AI味兒。
混元3D V2.5憑借業界首創的稀疏3D原生架構,實現了可控性與超高清生成能力,在文生3D領域17個類目的15個取得第一,在圖類3D的17個類目均取得第一?;煸?D在Hugging Face的模型下載量超過160萬。
除了3D物體生成外,騰訊近期將發布大規模、可漫游的3D場景生成模型。
混元游戲模型可生成工業級游戲資產,涵蓋角色動態立繪、特效生成等,滿足游戲產業多樣化需求。首個一站式AIGC游戲內容生產引擎昨日上線。
騰訊混元堅定擁抱開源,持續完善開源生態、開源工具和社區建設,已實現圖像、視頻、3D、文本等在內的全模態開源,未來將推出多尺寸混合推理模型,從0.5B到32B的dense模型,以及激活13B的MoE模型,適配企業與端側需求。混元圖像、視頻、3D等多模態基礎模型及配套插件模型也將持續開源。
大模型訓練營自年初以來已經累計報名超過200家企業,后續將在更多領域與合作伙伴一起孵化場景應用。
三、發布語音PaaS解決方案,升級智能體開發平臺
騰訊云副總裁、騰訊云智能負責人、騰訊優圖實驗室負責人吳運聲談道,騰訊將進一步提升AI應用滲透率、訓練和推理效率以及智能體開發工具。
為了實現更智能、更擬人的交互體驗,騰訊云將語音識別、輸出、實時傳輸等層面不斷優化:ASR大模型識別準確率更高,可適應復雜場景,真正做到讓AI聽得懂;TTS大模型能夠輸出擬人度更高、情感更豐富、自然度更接近真人的語音;TRTC確保端到端音視頻延遲<300ms,整體會話延遲<1000ms。
今日,騰訊云語音PaaS解決方案發布。該方案可接入混元、DeepSeek等大模型和實時通信能力深度融合,構建了從語音輸入到智能處理到自然輸出,還有實時交互的全面閉環,為企業提供低成本、可快速搭建的項目解決方案,幫助企業優化用戶銷售體驗。
面向企業大模型構建需求,騰訊云TI平臺全面升級了模型訓練能力,升級精調工具鏈,支持訓推一體潮汐調度,大幅增強企業資源利用率。某頭部消費電子企業基于TI平臺提供的協調工具鏈和資源管理能力,整體研發提效50%以上,GPU資源利用率提升80%以上。
技術升級方面,騰訊云通過深挖內核和架構延展,在精度幾乎無損情況下,大幅降低延遲,提升吞吐量,并在社區里提供了相關加速能力的貢獻?;谶@些優化,其推理加速效果業界領先,比如在保障首Token延遲≤2秒、吐字速率≥20tokens/s的前提下,QPM可超過100。
智能體的廣泛應用,將成為企業提效利器。大模型知識引擎全面升級為騰訊云智能體開發平臺。
升級后的平臺,整合騰訊云行業領先的RAG(檢索增強生成)技術、全面的智能體能力以及實戰打磨出來的貼合用戶需求的功能,幫助企業快速激活私域知識、構建專屬智能體。
企業智能化能力須建立在對知識的深度掌握之上。騰訊云在知識管理領域做了很多積累,RAG能力行業領先。騰訊云智能體開發平臺能準確從復雜Excel表里檢索答案,也支持從文檔自動生成問答對以及校對、管理,還支持文檔比對、比對后決策。
該平臺提供全面智能體能力支持,工作流創新加入具備全局視野的智能體,支持智能的節點回退。用戶可以讓智能體自主拆解任務和規劃路徑,主動選擇和調用工具。
該平臺首次實現了零代碼支持多Agent的轉交協同方式,兼容主流智能體框架進一步降低了智能體搭建的門檻。
面向確定性比較高的執行流程,用戶也可以采用工作流模式,拖拉拽各種原子能力,讓智能體基于固定流程運行,得到更確定性的結果。
插件方面,騰訊云智能體開發平臺智能體全面支持MCP,平臺預置豐富的內外部高質量插件,所有插件都經過了嚴格測試。
此外,該平臺通過實戰打磨,貼合客戶需求,支持平臺級、應用級、知識庫等完整權限體系配置,包括支持文檔、問答、工作流、系統等多種意圖達成方式的優先級配置,還提供全鏈路OP系統,支持發布后應用運營,支持私有化部署。
騰訊云智能體開發平臺已服務眾多內外部客戶。
通過多Agent協同,智能體能夠靈活、獨立地滿足各種復雜的用戶需求。知識庫、插件工具、多Agent框架等正在驅動著智能體不斷升級,成為懂企業知識、能調用工具、自主執行復雜任務的得力助手。
四、升級知識庫產品,企業+個人“雙打”
騰訊在知識庫賽道上持續加碼,認為“大模型+知識庫”是當前AI落地的最佳路徑。
會上,騰訊宣布升級知識庫系列產品,基于騰訊樂享和騰訊ima,為企業用戶、組織和個人用戶提供高效的知識管理體驗。ima面向個人及專業用戶、樂享面向企業用戶,滿足不同場景和用戶的需求。
騰訊ima作為一款以知識庫為核心的AI工作臺,可輔助用戶完成課程作業、論文寫作、方案策劃、工作總結等日常學習和工作任務,并長期沉淀為個人智能化的知識庫,高度適配政務、法律、教育等知識驅動領域。
騰訊樂享正式升級為樂享知識庫,在知識整合沉淀、知識更新、權限管理、AI問答等層面為企業用戶提供服務,提升知識流轉效率。
目前,騰訊樂享已經累計服務了超30萬客戶,包括比亞迪、中國五環、友邦保險、北京大學、清華大學、新東方、多樂士、科沃斯、同程旅行、用友暢捷通等各行業公司。
五、AI Infra、營銷增長、智能開發、辦公協同,大模型工具箱持續升級
無論是應用層還是模型層,均依賴性能領先的算力,智能時代的云計算正在從“資源供給”向“智能服務”轉型。
當前,騰訊云智算系列產品瞄準AI應用和模型爆發對基礎設施帶來的全新挑戰,在效能、可靠性、易用性三大方向上全面提升,為大模型和應用提供堅實基礎設施。
AI技術的發展,也在反哺研發工作環節。
騰訊云代碼助手CodeBuddy全新升級,推出Craft軟件開發智能體,開發者用自然語言講出需求,Craft就能夠自動拆解任務、設計模塊、生成代碼,并自我糾錯。
這意味著開發者“一句話開發應用”變為現實,同時升級了代碼補全、工程理解,代碼測試等功能。
營銷增長方面,騰訊企點營銷云正式發布“營銷云智能體”,以多Agent架構為核心,將騰訊積累多年的AI能力與營銷方法論深度融合,實現從人群洞察、商品匹配、內容生成到效果追蹤的全鏈路智能決策。
騰訊系辦公協同產品也迎來智能升級。
騰訊文檔企業版AI助手可實現文檔快速總結和問答,以及直接智能生成Word、PPT等可編輯內容。
騰訊會議AI小助手Pro即將接入DeepSeek,支持混元、DeepSeek雙模型自由切換,助力會前準備、會中決策、會后紀要生成。
騰訊電子簽實現AI驅動的合同管理閉環。
騰訊問卷通過AI提升問卷生成、數據分析及訪談洞察效率。
騰訊云ChatBI新增智能洞察與波動歸因功能,進一步簡化數據分析。
結語:大模型從“可用”到“好用”,還需多維度持續升級
今年以來,產業對大模型API的調用量、算力需求等快速增長。湯道生認為,生成式AI已經逐步跨過“可用性”的門檻,未來要從“可用”到“好用”,從“一部分人用”到“人人能用”,還需要在交互體驗、執行能力、內容準確性、落地成本等方面持續升級。
從自研的混元大模型、到AI云基礎設施,再到智能體開發工具、知識庫以及面向場景的應用,騰訊大模型矩陣產品全面升級。騰訊正通過持續打磨技術和產品能力,為企業和用戶在大模型時代打造真正“好用的AI”。
未來,騰訊計劃堅定推進混元大模型開源,深耕算法、打磨工具、突破場景,持續加速大模型創新、加速智能體應用、加速知識庫建設、加速基礎設施升級,推動AI技術走進千行百業,也走進每個人的生活。
“AI的星辰大海,絕不僅僅屬于科技的探索者,它屬于每一個用心服務用戶的經營者,屬于每一位致力于提升效率的開發者,也屬于每一個心懷夢想的普通人。”湯道生說。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.