記者|董溫淑
5月20日,百度于北京舉辦AI Day活動,百度集團副總裁吳甜現場分享了最新版文心大模型4.5及深度思考模型X1背后的技術細節。
據她分享,文心大模型4.5是多模態基礎大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升級到X1 Turbo,在性能提升的同時,實現更先進的思維鏈,進一步增強問答、創作、邏輯推理、工具調用和多模態能力。
多模態能力方面,文心4.5和4.5 Turbo實現了文本、圖像和視頻的混合訓練。針對不同模態數據在結構、規模、知識密度上的差異,通過多模態異構專家建模、自適應分辨率視覺編碼、時空重排列的三維旋轉位 置編碼、自適應模態感知損失計算等技術,提升跨模態學習效率和多模態融合效果,學習效率提高近2倍,多模態理解效果提升超過30%。
在深度思考方面,文心X1、X1 Turbo突破了僅基于思維鏈優化的范式,在思考路徑中結合工具調用,構建了融合思考和行動的復合思維鏈,旨在使模型輸出結果更優。
同時,結合多元統一的獎勵機制,文心X1、X1 Turb實現了思考和行動鏈的端到端優化,大幅提升了跨領域的問題解決能力。
吳甜稱,隨著大模型的能力進一步拓展、效率進一步提升,可以探索更前瞻、更有想象力的創新應用。
以數字人為例,超擬真數字人需要具備出色的表現力、吸引人的內容、數字人與場景、物品的互動等,綜合運用多模態AI技術。為此,百度研制了“劇本”驅動多模協同的超擬真數字人技術,實現了語言、聲音、形象的協調一致。
據稱目前該技術已經支持超過10萬數字人主播,直播轉化率達31%,降低80%直播開播成本。
在代碼場景上,基于文心大模型的語言和代碼能力,百度研制了代碼智能體和智能代碼助手“文心快碼”。百度每天新增的代碼中,文心快碼生成的代碼占比已超過40%。截至目前,文心快碼向全社會開放,累計服務760萬開發者。
此外,基于飛槳文心在框架模型、框架算力的聯合優化,文心4.5 Turbo的訓練吞吐已達到文心4.5的5.4倍,推理吞吐達到8倍。
公開數據顯示,飛槳文心開發者數量已超過2185萬,服務超過67萬家企業,創建的模型達到110萬。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.