大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

新“SOTA”推理模型避戰Qwen和R1?歐版OpenAI被噴麻了

0
分享至

聞樂 發自 凹非寺
量子位 | 公眾號 QbitAI

“歐洲的OpenAI”Mistral AI終于發布了首款推理模型——Magistral

然而再一次遭到網友質疑:怎么又不跟最新版Qwen和DeepSeek R1 0528對比?

(此前該公司發布Ministral 3B/8B時,聲稱“始終優于同行”,卻沒有對比Qwen2.5)





在該模型發布的前幾個小時,Mistral AI的CEO Arthur Mensch在接受爐邊訪談時聲稱即將發布的Magistral能夠與其他所有競爭對手相抗衡。

在官方展示的基準測試結果中,DeepSeek-R1的數據確實不是最新的(在AIME-25數學測試中,DeepSeek-R1-0528的準確率已經從舊版的70%提升至87.5%),并且比較行列里完全不見Qwen的身影。



不過,與同公司初期模型Mistral Medium 3相比,該框架在AIME-24上的準確率提升了50%。

此次Magistral發布了兩種版本:

Magistral Small——24B參數的開源權重版本,可在Apache 2.0許可下自行部署。

Magistral Medium——更強大的、面向企業的版本,在Amazon SageMaker上提供。



專為透明推理而設計

在Magistral發布之前,Mistral AI的CEO Arthur Mensch在訪談中提到:

  • “從歷史上看,我們看到美國的模型用英語進行推理,中國的模型更擅長用中文進行推理。”

于是,這次Magistral的一個亮點就是支持多語言推理,尤其是解決了主流模型用歐洲語言的推理效果不如本土語言的缺陷。



下面的例子展示了在Le Chat中,使用Magistral Medium的阿拉伯語提示和響應。



與通用模型不同的是,Magistral針對多步邏輯進行了微調,提升了可解釋性,并在用戶的語言中提供了可追溯的思考過程,能夠實現大規模實時推理。

下面的例子展示了重力、摩擦和碰撞的單次物理模擬,在預覽中使用的是Magistral Medium。



就好像Magistral不是黑箱預言家,而是一個能陪你「擺事實、講道理」的智能伙伴。

并且,在Le Chat中,通過Flash Answers,Magistral Medium的token吞吐量比大多數競爭對手快10倍。

這就能夠實現大規模的實時推理和用戶反饋。



作為Mistral推出的首個基于純強化學習(RL)訓練的推理大模型,Magistral采用改進的Group Relative Policy Optimization(GRPO)算法。

直接通過RL訓練,不依賴任何現有推理模型的蒸餾數據(如DeepSeek-R1需SFT預熱)。

通過消除KL散度懲罰、動態調整探索閾值和基于組歸一化的優勢計算,在AIME-24數學基準上實現從26.8%到73.6%的準確率躍升。



首創異步分布式訓練架構,通過Generators持續生成、Trainers異步更新的設計,配合動態批處理優化,實現高效的大規模RL訓練。

還反直覺地發現純文本RL訓練可提升多模態性能(如MMMU-Pro-Vision提升12%),并驗證RL對小模型同樣有效(24B的Magistral Small在AIME-24準確率達70.7%)。



這些創新使Magistral在無需預訓練蒸餾的情況下,以純RL方式為LLM的強化學習訓練提供了新范式。

One More Thing

官方沒有給出Magistral與最新版Qwen和R1的對比,網友來代勞了。



從結果可以看出,Qwen 4B與該模型相近,小型的30B MoE效果更好,R1最新版就更不用說了(doge

并且,由于“歐洲的OpenAI”越來越不Open,Stability AI前CEO建議Mistral AI應該爭取真正的開源來占據開源的領導地位。




[1]https://mistral.ai/news/magistral
[2]https://x.com/dylan522p/status/1932563462963507589
[3]https://x.com/arthurmensch/status/1932451932406415531

— 完 —

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
羅帥宇父母很后悔,當時沒有對兒子尸體尸檢,因沒湊夠3萬元費用

羅帥宇父母很后悔,當時沒有對兒子尸體尸檢,因沒湊夠3萬元費用

小人物看盡人間百態
2025-06-13 15:40:41
印度墜機幸存者被發現時手持登機牌能行走,“起飛30秒后一聲巨響,然后飛機墜毀了”

印度墜機幸存者被發現時手持登機牌能行走,“起飛30秒后一聲巨響,然后飛機墜毀了”

魯中晨報
2025-06-13 07:02:05
伊朗稱擊落以色列F-35隱身戰機,殘骸照公布!

伊朗稱擊落以色列F-35隱身戰機,殘骸照公布!

澎湃新聞
2025-06-14 10:16:28
李訥晚年回憶,曾問父親和誰關系最好,毛主席干脆利落地說出4人

李訥晚年回憶,曾問父親和誰關系最好,毛主席干脆利落地說出4人

歷史龍元閣
2024-07-31 01:07:21
經典伏擊戰術:德媒稱F-16越級斬殺蘇-35!俄羅斯五代機蘇-57在哪

經典伏擊戰術:德媒稱F-16越級斬殺蘇-35!俄羅斯五代機蘇-57在哪

鷹眼Defence
2025-06-11 17:19:59
伊朗防長:若與美發生軍事沖突,將襲擊中東美軍基地

伊朗防長:若與美發生軍事沖突,將襲擊中東美軍基地

澎湃新聞
2025-06-12 11:12:19
一面天使一面魔鬼馬瑟林G3砍27分摧毀雷霆防線 G4連續犯大錯

一面天使一面魔鬼馬瑟林G3砍27分摧毀雷霆防線 G4連續犯大錯

直播吧
2025-06-14 11:40:21
印度墜機僅1人生還!黑匣子曝光最后1分鐘,飛行員這操作看傻了!

印度墜機僅1人生還!黑匣子曝光最后1分鐘,飛行員這操作看傻了!

奇思妙想生活家
2025-06-13 23:22:15
太慘了!網傳上海一學霸小三門210分考204分,認為清北無望而墜亡

太慘了!網傳上海一學霸小三門210分考204分,認為清北無望而墜亡

火山詩話
2025-06-12 06:24:32
羅帥宇事件最新消息:醫院不存在買賣器官,家屬疑似說了謊

羅帥宇事件最新消息:醫院不存在買賣器官,家屬疑似說了謊

映射生活的身影
2025-06-14 01:23:43
賣不掉了?李嘉誠“賣港口”新進展:巴拿馬強硬表態,外交部回應

賣不掉了?李嘉誠“賣港口”新進展:巴拿馬強硬表態,外交部回應

涵豆說娛
2025-06-13 15:33:00
山東近5萬考生棄考:比內卷更現實的,是00后高中生的清醒選擇

山東近5萬考生棄考:比內卷更現實的,是00后高中生的清醒選擇

金哥說新能源車
2025-06-13 12:45:47
俄高官:只要是打以色列,俄羅斯將敞開供應先進導彈飛機和武器!

俄高官:只要是打以色列,俄羅斯將敞開供應先進導彈飛機和武器!

阿龍聊軍事
2025-06-11 22:03:58
港警再拘捕黃之鋒,黃之鋒表示認罪,或被判終身監禁,賴清德要慌

港警再拘捕黃之鋒,黃之鋒表示認罪,或被判終身監禁,賴清德要慌

素年文史
2025-06-13 19:25:02
讀了芒格我發現:頂級富豪都不大談努力,而是死守3大原則

讀了芒格我發現:頂級富豪都不大談努力,而是死守3大原則

阿胖讀書
2025-06-11 10:41:26
特朗普稱中美已達成協議,美國將對華征收55%關稅,商務部回應

特朗普稱中美已達成協議,美國將對華征收55%關稅,商務部回應

科技虎虎
2025-06-13 15:45:33
關曉彤新劇番位爭議炸鍋!李昀銳粉絲為何集體破防?

關曉彤新劇番位爭議炸鍋!李昀銳粉絲為何集體破防?

Yuki女人故事
2025-06-13 12:49:14
人情薄如紙!原中央政治局常委吳官正:難忘那夜的秋雨!

人情薄如紙!原中央政治局常委吳官正:難忘那夜的秋雨!

霹靂炮
2025-03-03 14:09:01
阿斯:維拉有意前鋒羅德里格斯,切爾西、曼聯、萊比錫也在關注他

阿斯:維拉有意前鋒羅德里格斯,切爾西、曼聯、萊比錫也在關注他

直播吧
2025-06-14 13:25:09
動真格!一夜間,大批無證網約車被停止派單,司機:不跑了,總算到頭了!

動真格!一夜間,大批無證網約車被停止派單,司機:不跑了,總算到頭了!

網約車觀察室
2025-06-14 10:11:23
2025-06-14 14:27:00
量子位 incentive-icons
量子位
追蹤人工智能動態
10659文章數 176166關注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業陪葬?

頭條要聞

網紅是潛逃31年的殺人犯 幾乎每天都看法治新聞

頭條要聞

網紅是潛逃31年的殺人犯 幾乎每天都看法治新聞

體育要聞

32隊爭10億獎金,全新世俱杯來了!

娛樂要聞

鳳凰傳奇曾毅手表引爭議 含性暗示元素

財經要聞

樓市權威發聲

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

教育
時尚
旅游
房產
軍事航空

教育要聞

45個平行志愿怎么填?高考志愿填報全解析

在時尚中國之夜,共赴榮耀東方時刻

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

房產要聞

又一城購房補貼!買房就發錢,正在海南樓市瘋狂擴散!

軍事要聞

伊朗多名將領、核科學家遇襲身亡 身份披露

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲成在人线aⅴ免费毛片| 一区二区精品视频日本| 亚洲精品一区二区三区四区久久| 国产女人精品视频国产灰线| 国产乱国产乱老熟300部视频| 人人狠狠久久亚洲综合88| 后入到高潮免费观看| 色婷婷亚洲婷婷五月| 国产成人无码a区在线观看导航| 国产精品无码一区二区在线看| 国产亚洲精品久久久久久国模美| 亚洲六月丁香六月婷婷| 国产麻豆精品乱码一区| 久久精品人妻一区二区三区| 国产在线国偷精品免费看| 亚洲最大成人一区久久久| 日本jizz| 成年女人午夜毛片免费| 青草伊人久久综在合线亚洲| 无码国产精品一区二区免费式直播| 狠狠cao2020高清视频| 国产又黄又爽胸又大免费视频| 久久久久人妻一区二区三区vr| 色又黄又爽18禁免费网站现观看| 亚洲熟女乱综合一区二区| 5566先锋影音夜色资源站在线观看| 无码aⅴ在线观看| 国产99久9在线视频传媒| 青青草国产成人99久久| 国产农村乱辈无码| 2019最新国产不卡a| 成人精品视频99在线观看免费| 国产精品无码日韩欧| 在线观看国产成人av片| 国产麻豆剧果冻传媒星空视频| 中文字幕日本特黄aa毛片| 亚洲精品无码久久久久y| 亚洲成a人片在线观看日本| 国产又爽又黄又舒服又刺激视频| 国产亚洲精品久久久久久牛牛| 国产精品丝袜亚洲熟女|