DeepSeek爆火至今,有人說,現在華為每年的研發投入已經超過1600億了,為什么卻沒有做出類似于深度求索(DeepSeek)的通用人工智能模型?
客觀地說,這是好問題。但更關鍵的是,這一現象背后折射出科技巨頭與初創企業不同的戰略選擇和技術邏輯。
一、戰略定位
華為的人工智能布局以“業務協同性”為核心,其盤古大模型聚焦礦山、氣象、金融等垂直領域。
例如,礦山場景中通過AI實現井下設備智能調度,氣象領域完成全球7天預報僅需10秒。這種“產業AI”路徑需要與昇騰芯片、5G基站等硬件深度適配,而非追求通用模型的技術指標。
相比之下,DeepSeek作為初創企業選擇通用人工智能(AGI)賽道,通過MoE架構等技術突破快速建立行業標桿地位。其戰略更類似于OpenAI早期階段,以技術創新直接沖擊市場認知。
二、技術路線的差異
在模型架構選擇上,華為傾向于“稠密模型”,這類模型參數規模相對可控,更適配工業質檢、網絡優化等具體場景的算力條件。例如在手機端側部署的NPU芯片,就需要輕量化AI模型保障實時響應。
而DeepSeek V3采用的“稀疏MoE架構”,通過動態激活神經元模塊實現參數規模突破,但同時也帶來訓練成本指數級增長(單次訓練費用或超千萬美元)。這種技術路線對資源有限的商業公司存在較高風險。
三、全域作戰vs單點突破
華為的研發投入分布在“六大核心領域”:芯片(麒麟/昇騰)、操作系統(鴻蒙)、通信技術(5G/5G-A/6G)、云計算、智能網聯汽車、人工智能。
2024年僅芯片研發就耗資超300億元,鴻蒙系統生態建設投入超200億元。這種多線作戰模式導致AI研發投入占比不足總預算的15%。
而DeepSeek這類初創公司,可將“90%以上資源”集中投入模型創新,甚至通過開源策略(如DeepSeek-R1)快速構建開發者生態。這種“壓強式投入”使初創企業在特定技術點實現突破成為可能。
四、商業邏輯的差異
華為的AI商業化路徑依賴“企業服務閉環”,其技術需滿足運營商、制造業客戶對穩定性、可解釋性的嚴苛要求。例如在智慧城市項目中,AI算法誤報率必須控制在0.01%以下。這種強約束條件限制了前沿技術的快速應用。
DeepSeek則采用“模型即服務(MaaS)模式”,通過API接口或開源社區直接觸達開發者,其技術優勢可快速轉化為行業影響力。這種輕量化商業路徑更適配技術驅動型創新。
五、組織機制的制約
華為的研發體系具有“強流程管控”特征,從技術預研到產品落地需經歷超20個評審節點,單個AI模型的研發周期普遍在18個月以上。
而DeepSeek等初創公司采用“小步快跑”模式,重要技術決策可在48小時內完成。
這種差異在人才管理層面尤為顯著:華為研發人員需遵守嚴格的保密制度和流程規范,而DeepSeek等企業提供零食區、彈性工作制等創新友好型環境。組織機制的靈活性直接影響技術迭代速度。
六、資源整合下的彎道超車
盡管短期內在通用AI模型領域存在差距,但華為的“全棧技術儲備”具備后發優勢。其昇騰910B芯片算力已達1024 TFLOPS,在建的武漢人工智能計算中心規劃算力達4000P。
若能將行業數據、硬件算力與工程能力深度整合,華為有望在智能駕駛、工業互聯網等特定領域實現AI技術的場景化超越。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.