網易首頁 > 網易號 > 正文申請入駐

阿里大模型突然震驚全世界

2025-04-30 09:19:30　來源: 電商派Pro

廣東舉報

分享至

阿里千問3登頂全球最強開源模型

阿里大模型又甩出一張王炸。

4月29日凌晨，阿里新一代通義千問模型Qwen3（簡稱千問3）開源，一發布就直接登頂全球最強開源模型。隨即相關話題引發全網關注。

圖源：微博

這款讓全世界震撼的模型，有何特別之處？據了解，Qwen3是國內首個“混合推理模型”，它將“快思考”和“慢思考”集成進同一個模型，能快速低算力處理簡單問題，也能通過多步驟深度推理解決復雜問題，有效降低算力消耗。

目前，Qwen3系列模型一共開源了8款“混合推理模型”，包括兩款MoE（混合專家）模型Qwen3-235B-A22B和Qwen3-30B-A3B，以及六個Dense（稠密）模型32B、14B、8B、4B、1.7B和0.6B。

圖源：阿里云

那么，Qwen3又強在哪里？首要原因是算力成本大幅降低，直接碾壓全球各個頂尖大模型

比如旗艦模型Qwen3-235B-A22B參數量僅為DeepSeek-R1的1/3，總參數量235B，激活僅需22B。

據市場多方消息，僅需4張H20即可部署Qwen3滿血版，而且Qwen3旗艦模型的部署成本是滿血版R1的25%～35%，部署成本大降75%～65%，顯存占用僅為性能相近模型的三分之一。

其次，Qwen3大模型的性能也比同類大模型更強，在多個基準測試中表現出色，甚至超過了DeepSeek-R1和OpenAI o1等頂級模型。

在Qwen3系列模型中，旗艦版本Qwen3-235B-A22B是性能最強的。據阿里云披露的Qwen3基準測試結果，這款開源模型在代碼、數學、通用能力等基準測試中，與一眾頂級模型相比極具競爭優勢，與DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro等模型不相上下，甚至有趕超的趨勢。

Qwen3基準測試結果圖源：阿里云

具體來看，比如，在奧數水平的AIME25測評中，千問3取得了81.5分，刷新開源紀錄；在考察代碼能力的LiveCodeBench評測中，千問3得分超過70分，表現優于Grok3；在評估模型人類偏好對齊的ArenaHard測評中，千問3以95.6分超越了OpenAI-o1及DeepSeek-R1。

另外，在評估模型Agent能力的BFCL評測中，Qwen3取得了70.8分的成績，刷新了該評測的記錄，并超越了Gemini2.5-Pro、OpenAI-o1等頂尖模型。

值得一提的是，Qwen3模型還支持全球119種語言和方言，意味著Qwen 3試圖開辟更多的國際市場。

不得不說，Qwen3模型的各項表現極為亮眼。當然，如果拿阿里自身來比較，Qwen3模型取得的成績就理所當然和不足為奇。

因為阿里大模型都很能拿得出手，去年6月底，通義千問第二代開源模型Qwen2-72B亮相即登頂。

當時全球著名開源平臺Hugging Face（笑臉）的聯合創始人兼首席執行官在社交平臺透露，通義千問第二代開源模型Qwen2-72B拿下全球開源第一，力壓Meta、Mistralai等海外科技巨頭。

圖源：微博

緊接著今年3月3日，阿里的另一款大模型“萬相2.1(Wan2.1)”也取得了優異成績。

當時開源社區Hugging Face最新榜單顯示，阿里大模型“萬相2.1(Wan2.1)”登頂模型熱榜和模型空間榜，成為近期全球開源社區最受歡迎的大模型。

圖源：通義萬相Wan公眾號

如今，阿里大模型登頂全球最強開源模型，對阿里來說，又是一次重大的技術突破和戰略布局。

阿里巴巴要全面AI化

阿里大模型能取得如此突破，與阿里在資源上的大力投入密不可分。

在戰略層面，阿里巴巴對AI業務的重視提高到了前所未有的高度。在上個月的財報電話會議上，阿里巴巴集團CEO吳泳銘明確指出，阿里巴巴將持續聚焦國內外電商業務、AI+云計算的科技業務、互聯網平臺產品這三大業務類型。

而對于大模型，吳泳銘強調，未來三年，阿里將圍繞AI這個戰略核心，在AI基礎設施、基礎模型平臺及AI原生應用、現有業務的AI轉型等三方面加大投入。

顯而易見，阿里巴巴正加速從傳統電商公司向AI技術驅動的科技公司轉型，這是隨著AI戰略深入推進的必然結果，也是兩年前吳泳銘提出的“用戶為先、AI驅動”戰略的延續。

要知道過去兩年，阿里深受電商低價競爭和市場格局變化的困擾，亟需借助AI的力量來打開新的局面。

去年4月正值阿里變革一周年，馬云在內部會議上激情澎湃地表示：“AI時代剛剛到來，一切才剛開始，我們正當其時！”

同年12月，在螞蟻集團20周年慶典上，馬云再次現身并分享了他對未來20年AI時代的深刻見解，他強調了AI技術將如何重塑各行各業，并鼓勵螞蟻集團抓住這一歷史機遇。

今年4月，馬云發表最新演講，再次大談AI。

顯然，馬云對AI戰略的重視程度非同一般，將其視為阿里巴巴未來發展的核心驅動力。

為支撐這一戰略，阿里巴巴在資源投入上展現出驚人魄力。

去年，阿里接連出售銀泰百貨、大潤發、高鑫零售等非核心資產，同時阿里還頻繁減持快狗打車、B站、陌陌、網易云音樂等長期虧損的非核心業務。

這些動作背后與其聚焦電商、云計算等核心主業的戰略目標息息相關。

除了減輕非核心業務的負擔，阿里還加大與云計算有關的AI投入。

比如加大AI人才招聘力度。在3月25日的匯豐全球投資峰會上，阿里巴巴主席蔡崇信表示，經歷了幾輪裁員之后，阿里的員工數量已經觸底了。接下來，阿里將重新開啟招聘。

緊接著4月，阿里國際隨即傳出，首次啟動一項面向全球的頭部AI科技人才培養計劃“Bravo 102”，打破傳統的校招體系，面試通過后可反選項目和團隊。另據阿里國際招聘官網，2026屆校招中80%為AI崗位，包括AI算法、研發、AI產品經理等。

圖源：阿里國際招聘

今年2月，阿里還挖來全球頂尖AI科學家、前Salesforce副總裁許主洪（Steven Hoi），為AI業務助力。

在資金投入方面，阿里也毫不含糊。吳泳銘直接放話，未來三年，阿里將投入超過3800億元用于建設云和AI硬件基礎設施，總額超過過去十年總和。

這一連串的動作，正在把阿里AI業務推向高潮。

互聯網大廠掀起新一輪AI大戰

AI熱潮已經持續了兩年，今年年初DeepSeek的橫空出世再次引爆了整個AI圈，新一輪的競賽已然拉開帷幕。無論國內還是國外，各大模型公司都在加速布局，競相角逐。

當我們聚焦于阿里、抖音、騰訊、百度等國內互聯網大廠，他們都以各自的方式鋪開業務。

阿里利用開源大模型打開市場，自2023年8月開始，阿里云便開始大規模開源其大模型系列，成為我國首家大規模開源的大廠，并屢獲佳績。

同時，阿里AI業務有了新變化，從過去的側重面向B端，轉而向C端用戶傾斜。上個月夸克上線全新功能“AI超級框”，以及通義APP的持續升級改版，都是針對C端用戶側的調整。

AI大模型技術正在快速成熟，應用場景從B端向個人用戶擴展，C端用戶對AI產品的需求日益多樣化，由此，C端市場已成為阿里爭奪的新戰場。

抖音方面，則選擇采取了“廣撒網”式的戰略打法，先構建起龐大的AI產品矩陣，并采用 “賽馬機制”，鼓勵內部團隊圍繞同類產品進行差異化開發。

通過多版本并行測試、數據實時反饋，篩選出最具潛力的產品方向，并快速迭代升級。

自2023 年起，抖音在國內市場加速AI產品的落地節奏。據不完全統計，短短兩年間，其在移動端推出近10款AI應用，形成了覆蓋聊天、社交、辦公、教育、圖像、視頻、音樂全場景的產品生態。

目前來看，各大互聯網公司都力圖構建自身的AI護城河，搶占先機，重塑行業競爭格局。

作者 |木易

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.