阿里千問3登頂全球最強開源模型
阿里大模型又甩出一張王炸。
4月29日凌晨,阿里新一代通義千問模型Qwen3(簡稱千問3)開源,一發布就直接登頂全球最強開源模型。隨即相關話題引發全網關注。
圖源:微博
這款讓全世界震撼的模型,有何特別之處?據了解,Qwen3是國內首個“混合推理模型”,它將“快思考”和“慢思考”集成進同一個模型,能快速低算力處理簡單問題,也能通過多步驟深度推理解決復雜問題,有效降低算力消耗。
目前,Qwen3系列模型一共開源了8款“混合推理模型”,包括兩款MoE(混合專家)模型Qwen3-235B-A22B和Qwen3-30B-A3B,以及六個Dense(稠密)模型32B、14B、8B、4B、1.7B和0.6B。
圖源:阿里云
那么,Qwen3又強在哪里?首要原因是算力成本大幅降低,直接碾壓全球各個頂尖大模型
比如旗艦模型Qwen3-235B-A22B參數量僅為DeepSeek-R1的1/3,總參數量235B,激活僅需22B。
據市場多方消息,僅需4張H20即可部署Qwen3滿血版,而且Qwen3旗艦模型的部署成本是滿血版R1的25%~35%,部署成本大降75%~65%,顯存占用僅為性能相近模型的三分之一。
其次,Qwen3大模型的性能也比同類大模型更強,在多個基準測試中表現出色,甚至超過了DeepSeek-R1和OpenAI o1等頂級模型。
在Qwen3系列模型中,旗艦版本Qwen3-235B-A22B是性能最強的。據阿里云披露的Qwen3基準測試結果,這款開源模型在代碼、數學、通用能力等基準測試中,與一眾頂級模型相比極具競爭優勢,與DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro等模型不相上下,甚至有趕超的趨勢。
Qwen3基準測試結果 圖源:阿里云
具體來看,比如,在奧數水平的AIME25測評中,千問3取得了81.5分,刷新開源紀錄;在考察代碼能力的LiveCodeBench評測中,千問3得分超過70分,表現優于Grok3;在評估模型人類偏好對齊的ArenaHard測評中,千問3以95.6分超越了OpenAI-o1及DeepSeek-R1。
另外,在評估模型Agent能力的BFCL評測中,Qwen3取得了70.8分的成績,刷新了該評測的記錄,并超越了Gemini2.5-Pro、OpenAI-o1等頂尖模型。
值得一提的是,Qwen3模型還支持全球119種語言和方言,意味著Qwen 3試圖開辟更多的國際市場。
不得不說,Qwen3模型的各項表現極為亮眼。當然,如果拿阿里自身來比較,Qwen3模型取得的成績就理所當然和不足為奇。
因為阿里大模型都很能拿得出手,去年6月底,通義千問第二代開源模型Qwen2-72B亮相即登頂。
當時全球著名開源平臺Hugging Face(笑臉)的聯合創始人兼首席執行官在社交平臺透露,通義千問第二代開源模型Qwen2-72B拿下全球開源第一,力壓Meta、Mistralai等海外科技巨頭。
圖源:微博
緊接著今年3月3日,阿里的另一款大模型“萬相2.1(Wan2.1)”也取得了優異成績。
當時開源社區Hugging Face最新榜單顯示,阿里大模型“萬相2.1(Wan2.1)”登頂模型熱榜和模型空間榜,成為近期全球開源社區最受歡迎的大模型。
圖源:通義萬相Wan公眾號
如今,阿里大模型登頂全球最強開源模型,對阿里來說,又是一次重大的技術突破和戰略布局。
阿里巴巴要全面AI化
阿里大模型能取得如此突破,與阿里在資源上的大力投入密不可分。
在戰略層面,阿里巴巴對AI業務的重視提高到了前所未有的高度。在上個月的財報電話會議上,阿里巴巴集團CEO吳泳銘明確指出,阿里巴巴將持續聚焦國內外電商業務、AI+云計算的科技業務、互聯網平臺產品這三大業務類型。
而對于大模型,吳泳銘強調,未來三年,阿里將圍繞AI這個戰略核心,在AI基礎設施、基礎模型平臺及AI原生應用、現有業務的AI轉型等三方面加大投入。
顯而易見,阿里巴巴正加速從傳統電商公司向AI技術驅動的科技公司轉型,這是隨著AI戰略深入推進的必然結果,也是兩年前吳泳銘提出的“用戶為先、AI驅動”戰略的延續。
要知道過去兩年,阿里深受電商低價競爭和市場格局變化的困擾,亟需借助AI的力量來打開新的局面。
去年4月正值阿里變革一周年,馬云在內部會議上激情澎湃地表示:“AI時代剛剛到來,一切才剛開始,我們正當其時!”
同年12月,在螞蟻集團20周年慶典上,馬云再次現身并分享了他對未來20年AI時代的深刻見解,他強調了AI技術將如何重塑各行各業,并鼓勵螞蟻集團抓住這一歷史機遇。
今年4月,馬云發表最新演講,再次大談AI。
顯然,馬云對AI戰略的重視程度非同一般,將其視為阿里巴巴未來發展的核心驅動力。
為支撐這一戰略,阿里巴巴在資源投入上展現出驚人魄力。
去年,阿里接連出售銀泰百貨、大潤發、高鑫零售等非核心資產,同時阿里還頻繁減持快狗打車、B站、陌陌、網易云音樂等長期虧損的非核心業務。
這些動作背后與其聚焦電商、云計算等核心主業的戰略目標息息相關。
除了減輕非核心業務的負擔,阿里還加大與云計算有關的AI投入。
比如加大AI人才招聘力度。在3月25日的匯豐全球投資峰會上,阿里巴巴主席蔡崇信表示,經歷了幾輪裁員之后,阿里的員工數量已經觸底了。接下來,阿里將重新開啟招聘。
緊接著4月,阿里國際隨即傳出,首次啟動一項面向全球的頭部AI科技人才培養計劃“Bravo 102”,打破傳統的校招體系,面試通過后可反選項目和團隊。另據阿里國際招聘官網,2026屆校招中80%為AI崗位,包括AI算法、研發、AI產品經理等。
圖源:阿里國際招聘
今年2月,阿里還挖來全球頂尖AI科學家、前Salesforce副總裁許主洪(Steven Hoi),為AI業務助力。
在資金投入方面,阿里也毫不含糊。吳泳銘直接放話,未來三年,阿里將投入超過3800億元用于建設云和AI硬件基礎設施,總額超過過去十年總和。
這一連串的動作,正在把阿里AI業務推向高潮。
互聯網大廠掀起新一輪AI大戰
AI熱潮已經持續了兩年,今年年初DeepSeek的橫空出世再次引爆了整個AI圈,新一輪的競賽已然拉開帷幕。無論國內還是國外,各大模型公司都在加速布局,競相角逐。
當我們聚焦于阿里、抖音、騰訊、百度等國內互聯網大廠,他們都以各自的方式鋪開業務。
阿里利用開源大模型打開市場,自2023年8月開始,阿里云便開始大規模開源其大模型系列,成為我國首家大規模開源的大廠,并屢獲佳績。
同時,阿里AI業務有了新變化,從過去的側重面向B端,轉而向C端用戶傾斜。上個月夸克上線全新功能“AI超級框”,以及通義APP的持續升級改版,都是針對C端用戶側的調整。
AI大模型技術正在快速成熟,應用場景從B端向個人用戶擴展,C端用戶對AI產品的需求日益多樣化,由此,C端市場已成為阿里爭奪的新戰場。
抖音方面,則選擇采取了“廣撒網”式的戰略打法,先構建起龐大的AI產品矩陣,并采用 “賽馬機制”,鼓勵內部團隊圍繞同類產品進行差異化開發。
通過多版本并行測試、數據實時反饋,篩選出最具潛力的產品方向,并快速迭代升級。
自2023 年起,抖音在國內市場加速AI產品的落地節奏。據不完全統計,短短兩年間,其在移動端推出近10款AI應用,形成了覆蓋聊天、社交、辦公、教育、圖像、視頻、音樂全場景的產品生態。
目前來看,各大互聯網公司都力圖構建自身的AI護城河,搶占先機,重塑行業競爭格局。
作者 |木易
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.