大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

搶先DeepSeek R2,阿里通義正式發布國內首個通用推理模型 | 電廠

0
分享至


記者 董溫淑

編輯 高宇雷

Qwen 3模型即將發布的消息,已經流傳了一個月的時間;特別是最近一周內,坊間對Qwen 3的猜測不斷在“憋個大的”與“最終難產”之間反復橫跳。

直到4月29日凌晨,這款備受關注的模型終于亮相,號稱全面超越DeepSeek R1。

杭州一家中廠的算法從業者告訴「電廠」:“近幾個月網上不少DeepSeek R2的泄露信息,有人說R2要在5月份發。Qwen 3(這個時間發布)肯定是想搶個先機。”

在一家國產大模型開放平臺工作的劉露則透露,其所在的團隊提前不到12小時獲知Qwen3的發布消息,團隊成員連夜完成了Qwen 3系列模型在該平臺的部署上線。

無論如何,Qwen 3的亮相都意味著開源AI大模型的技術能力再次被刷新;與之相繼的,將是產業鏈下游應用者迎來一次新的生態選擇。

「電廠」注意到,Qwen 3發布僅10小時,已經有開發者發布了套殼Qwen 3系列模型的ChatBot類產品。


基于Qwen 3的第三方ChatBot類產品,圖源/網絡 ?


國內首個混合推理模型,成本/性能超越DeepSeek R1

根據阿里云通義千問團隊官宣,Qwen3系列開源了8個模型,其中包含2個MoE(混合專家)大模型和6個Dense(稠密)大模型。

本次Qwen3系列模型尤為值得關注的創新是該模型支持思考模式、非思考模式兩種運行方式。

在思考模式下,模型會逐步推理,經過深思熟慮后給出最終答案。這種方法適合需要深入思考的復雜問題;在非思考模式中,模型會提供快速、近乎即時的響應,適用于對速度要求高于深度的簡單問題。

換句話說,Qwen3打破了DeepSeek R1等思維鏈模型慢思考的單一模式,而是為用戶賦予靈活選擇的權利。這也是如今全球大模型市場發展的重要方向之一。


不同Benchmark下Qwen3兩種思考模式對比,圖源/阿里云通義 ?

今年2月份,由部分OpenAI前員工創辦的Anthropic在全球范圍內率先發布了名為Claude 3.7 Sonnet的混合推理模型,被視為融合了DeepSeek V3(適于通用任務)與R1(適于推理任務)模型的各自優勢。

這種混合模式引起了業界的廣泛關注。OpenAI創始人Sam Altman就曾表示,OpenAI接下來將研發“它能夠知道什么時候應該長時間思考,并且通常適用于廣泛任務”的模型。而Qwen3是國內首個混合推理模型。

性能及成本優化方面,Qwen3系列也表現驚人。

比如本次開源的兩個MoE模型,權重分別為Qwen3-235B-A22B,是一個擁有 2350 多億總參數和220多億激活參數的大模型;另一個為Qwen3-30B-A3B,一個擁有約300億總參數和30億激活參數的小型MoE模型。

MoE(混合專家模型)混合包含多個專家網絡,每個專家通常是一個子模型、也可以是神經網絡的一個子模塊,擁有不同的能力或專長,能夠處理不同類型的輸入數據。在運行時,不同任務會被進行分類、輸送到相應的“專家”處進行解決。

DeepSeek V3與R1都屬于MoE模型。這種架構的優勢是其能夠,并且在解決任務時僅調動與之相應的模塊、節省計算成本。這也是“AI界拼多多”DeepSeek提升性價比的殺手锏之一。作為與Qwen3的對比,DeepSeek V3與R1總參數規模為6710億參數,激活參數為370億。

性能方面,官方信息顯示,Qwen旗艦模型 Qwen3-235B-A22B 在代碼、數學、通用能力等基準測試中,與 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等頂級模型相比,均展現出優勢。

小型MoE模型Qwen3-30B-A3B ,相比DeepSeek V3、GPT 4o、谷歌Gemma3-27B-1T等模型同樣表現優異。

六個開源的Dense模型均適用于通用任務解決,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。

值得一提的是參數量極低的Qwen3-4B模型,也在不少任務中展現出來相比GPT 4o更為優異的成績。

上述模型均在 Apache 2.0 許可下開源。這是一種較為寬松的許可證,允許代碼修改和再發布(作為開源或商業軟件)。

Qwen3模型還支持 119 種語言和方言,并優化了Agent和代碼能力、加強了對MCP的支持。


開源大模型“城頭變換大王旗”

Qwen3的發布,距離DeepSeek R1的亮相已過去了3個多月。

1月20日,憑借比肩OpenAI o1的性能、低廉的成本,以及對大模型研發范式的改變,R1一經發布就榮膺開源大模型世界的“無冕之王”至今。

在此期間,包含科大訊飛(星火X1)、百度(文心X1)、OpenAI(o3 mini)、阿里(Qwen-QwQ-32B)、字節(豆包1.5深度思考)在內的玩家紛紛下場推理模型,但至多是接近R1性能或實現部分超越,未能真正挑動后者的位置。

在大模型的世界里,數月的時間已足夠一代新王換舊王。正是這樣的背景下,關注的目光落到了Qwen3身上。

與許多國內玩家不同的是,早在2024年8月,阿里就公開站到了開源自研模型的大廠陣營之中。在這條最終被DeepSeek驗證可行的市場之路上,Qwen可以說已經提前拿到了不少牌。

至今Qwen系列產品已在不少開源榜單中排名靠前。如據全球最大AI開源社區Huggingface 4月29日顯示,在audio-text-to-text任務類目下,Qwen的兩款模型熱度居前。

Huggingface 于2月10日發布的開源大模型榜單“Open LLM Leaderboard”也顯示,排名前十的開源大模型全部是基于Qwen開源模型二次訓練的衍生模型。


圖源/Huggingface ?

在生態活躍度方面,Qwen也處于全球前列。據官方數據顯示,從2024年下半年開始至2025年1月底,基于Qwen系列的衍生模型數量超過了美國Llama系列,超過9萬個,已是全球最大的AI模型家族,超過了Meta 旗下的Llama家族。

不過對比Llama系列,Qwen系列開源模型在下載量方面與前者仍有差距。據Meta首席執行官Zuck Burg在今年3月份宣布,Llama的下載量已達到10億次;而Qwen系列的下載量還在千萬級別。

在Qwen3發布這一天,周靖人接受了“晚點”的采訪,他講道,判斷“開源生態跑出來了”的指標主要有兩點“一是看開發者的選擇,二是看性能指標”。

本次隨著Qwen3的發布,這款新模型通過在性能指標和成本方面超越DeepSeek R1,以及創新的混合推理模式,登頂為全球最強大的開源大模型,又為Qwen增添了一張好牌。

但在這之后,還有更多的挑戰等待著它。接下來DeepSeek R2的亮相,也將為整個市場增添新的變數。

在貫徹“第一通吃(winner-takes-all)”定律的開源市場,競爭遠未到達終局、誰能成為最終的“winner”還充滿未知,無論是DeepSeek,還是Qwen和Llama,都仍需要為不下牌桌而持續努力。

不過值得欣慰的是,雖然戰程未半,至少當下的開源大模型“桂冠”仍歸屬于國產玩家。

(注:文中劉露為化名)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
難怪高層頻頻被害,伊朗情報組搜集到關鍵證據,兇手身份出乎意料

難怪高層頻頻被害,伊朗情報組搜集到關鍵證據,兇手身份出乎意料

博覽歷史
2025-06-15 13:15:08
“館長” 宣布提前回臺,向大家道歉,感慨的說道:兩岸一家人

“館長” 宣布提前回臺,向大家道歉,感慨的說道:兩岸一家人

陳博世財經
2025-06-15 10:51:34
奧萊報:因世界杯恩怨,梅西拒絕在球員通道理睬前皇馬球員佩佩

奧萊報:因世界杯恩怨,梅西拒絕在球員通道理睬前皇馬球員佩佩

雷速體育
2025-06-15 10:46:54
羅帥宇的通報來了,真相終于大白

羅帥宇的通報來了,真相終于大白

大張的自留地
2025-06-14 08:39:21
伊朗或在數小時內再次發動襲擊 以色列進入“前所未有緊急狀態”

伊朗或在數小時內再次發動襲擊 以色列進入“前所未有緊急狀態”

環球網資訊
2025-06-15 05:59:29
63歲吳鎮宇新造型絕了,沒有老人味還越來越年輕了,至少年輕30歲

63歲吳鎮宇新造型絕了,沒有老人味還越來越年輕了,至少年輕30歲

手工制作阿殲
2025-06-15 08:44:14
1死4傷!男子鳴笛遭圍堵駕車駛離,目擊者曝完整經過,太無奈了!

1死4傷!男子鳴笛遭圍堵駕車駛離,目擊者曝完整經過,太無奈了!

古希臘掌管松餅的神
2025-06-15 10:19:39
突發!蒼井空確認復出,你最希望看到她的什么?

突發!蒼井空確認復出,你最希望看到她的什么?

閑侃閑侃
2025-06-15 07:16:55
遭伊朗導彈襲擊 以色列一城市大片別墅變廢墟

遭伊朗導彈襲擊 以色列一城市大片別墅變廢墟

大象新聞
2025-06-15 11:35:04
羅帥宇冤不冤我說不準,但沒人會偷割你孩子的器官……

羅帥宇冤不冤我說不準,但沒人會偷割你孩子的器官……

基本常識
2025-06-14 22:42:03
湖北XX學院,奔馳哥與學生妹活色生香,追逐野鴛鴦成校園樂趣,這瓜真的驚艷!

湖北XX學院,奔馳哥與學生妹活色生香,追逐野鴛鴦成校園樂趣,這瓜真的驚艷!

閑侃閑侃
2025-06-15 07:17:03
37歲梅西失絕殺!著名足球解說詹俊嘆息不已:進了就太經典了

37歲梅西失絕殺!著名足球解說詹俊嘆息不已:進了就太經典了

側身凌空斬
2025-06-15 11:26:53
印度曝光!中印在藏南交火,中國軍人一個動作感動14億國人

印度曝光!中印在藏南交火,中國軍人一個動作感動14億國人

Ck的蜜糖
2025-06-15 01:51:14
中伊外長通話時,伊朗外長向中國做出保證,王毅外長:會主持公道

中伊外長通話時,伊朗外長向中國做出保證,王毅外長:會主持公道

梁訊
2025-06-15 10:18:51
11國棄權,中方反對票失效,以方侵犯伊朗主權,更可怕的還在后面

11國棄權,中方反對票失效,以方侵犯伊朗主權,更可怕的還在后面

吳欣純Deborah
2025-06-14 16:59:12
高層被斬首一點都不冤,伊朗剛逮捕70名以色列間諜,噩耗再次傳來

高層被斬首一點都不冤,伊朗剛逮捕70名以色列間諜,噩耗再次傳來

梁訊
2025-06-15 09:29:48
國家級健身教練唐博濤去世,僅37歲,滿身肌肉很健碩,死因疑曝光

國家級健身教練唐博濤去世,僅37歲,滿身肌肉很健碩,死因疑曝光

180視角
2025-06-14 12:20:45
以色列國家安全總局局長巴爾宣布辭職

以色列國家安全總局局長巴爾宣布辭職

環球網資訊
2025-06-15 06:10:24
10年排隊淚未干,廣州一夜全解限!廣州限購全面放開,網民不買賬

10年排隊淚未干,廣州一夜全解限!廣州限購全面放開,網民不買賬

小人物看盡人間百態
2025-06-15 11:13:50
伊朗不打倒神棍政權,國家將永無希望

伊朗不打倒神棍政權,國家將永無希望

廖保平
2025-06-14 09:19:25
2025-06-15 15:32:49
電廠 incentive-icons
電廠
探索科技公司的未知,為你充電
1646文章數 1042關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

以色列空襲胡塞武裝高層秘密會議 現場大約有10具尸體

頭條要聞

以色列空襲胡塞武裝高層秘密會議 現場大約有10具尸體

體育要聞

裁判可以噴,但也從步行者自身找找問題?

娛樂要聞

鳳凰傳奇曾毅塌房?網友:別連累玲花

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

本地
手機
時尚
數碼
公開課

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

手機要聞

小米 REDMI Turbo 4 Pro 手機 2.0.206.0 版本屏幕失靈問題已優化

裙子里別穿“安全褲”了!今夏流行這樣穿!

數碼要聞

全球獨此一份!黃仁勛簽名RTX 5090黃金版拍出17萬元天價

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 无码视频免费一区二三区| 亚洲精品无码久久久久久久| 日本欧美一区二区三区高清| 欧美大成色www永久网站婷| 亚洲国产精品无码aaa片| 亚洲伊人久久大香线蕉综合图片| 草色噜噜噜av在线观看香蕉| 亚洲伊人成综合人影院青青青| 亚洲综合天堂婷婷五月| 国内精品伊人久久久久妇| 久久丫精品国产亚洲av不卡| 国产精品久久久久久久久久免费| 久久精品国产免费观看| 超碰国产精品久久国产精品99| 免费视频爱爱太爽了| 一本久久知道综合久久| 无码国产精品一区二区高潮| 免费看男女做好爽好硬视频| 国产69精品久久久久久妇女迅雷| 亚洲人成亚洲人成在线观看| 中文字幕丰满伦子无码| 国产午夜无码福利在线看网站| 国产成人精品久久一区二区| 欧美日韩亚洲中文字幕二区| 国产又色又爽又刺激在线播放| 中年熟妇的大黑p| 欧洲成人一区二区三区| 女人大荫蒂毛茸茸视频| 国产成人亚洲综合无码品善网| 男女免费观看在线爽爽爽视频| 亚洲国产成人精品av在线| 美女张开腿让人桶| 国产免费丝袜调教视频| 中文字幕人妻av一区二区| aa性欧美老妇人牲交免费| 高潮射精日本韩国在线播放| 又大又黄又粗高潮免费| 亚洲一区无码中文字幕| 99国产精品久久久久久久日本竹| 乱妇乱女熟妇熟女网站| 欧美69久成人做爰视频|