AI這場仗，螞蟻決定這么打

2025-05-28 18:20:28　來源: 鈦媒體APP

北京舉報(bào)

分享至

5月27日下午16點(diǎn)多，接任螞蟻集團(tuán)CEO僅87天的韓歆毅，穿著黃色短袖來到杭州螞蟻A空間正進(jìn)行的“螞蟻黑客松”比賽，并坐在前排臺(tái)階上仔細(xì)聆聽。今年3月，獲清華大學(xué)經(jīng)濟(jì)學(xué)碩士學(xué)位的韓歆毅升任螞蟻集團(tuán)CEO。

支付寶雙飛輪、AI First和加速全球化是螞蟻集團(tuán)的三大戰(zhàn)略。事實(shí)上，螞蟻和其他互聯(lián)網(wǎng)公司一樣，近兩年一直在 AI 領(lǐng)域進(jìn)行投入。去年螞蟻20周年時(shí)候，螞蟻集團(tuán)董事長井賢棟宣布，未來20年，螞蟻要做一家科技驅(qū)動(dòng)、創(chuàng)新驅(qū)動(dòng)的公司。

其中，在AI First戰(zhàn)略下，螞蟻推出了金融、醫(yī)療、生活服務(wù)三款A(yù)I應(yīng)用，螞蟻內(nèi)部業(yè)務(wù)也做了很多變革，支付寶、螞蟻國際等核心業(yè)務(wù)加速AI化，螞蟻內(nèi)部也成立了通用人工智能（AGI）部門，開源2900億參數(shù)規(guī)模的百靈大模型，引發(fā)關(guān)注。

韓歆毅在27日下午的內(nèi)部技術(shù)日活動(dòng)上首次詳解螞蟻AI戰(zhàn)略。

他用時(shí)三十多分鐘，全面清晰談未來螞蟻的AI戰(zhàn)略布局。在韓歆毅看來，中國 AI 大模型賽道競爭激烈，螞蟻將聚焦AI應(yīng)用側(cè)，利用AI基座大模型技術(shù)做更強(qiáng)的技術(shù)服務(wù)能力。

“今天，我們永遠(yuǎn)是在AI技術(shù)突破的邊界上做一款PMF產(chǎn)品，如果技術(shù)路線不收斂，產(chǎn)品很難突破；技術(shù)路線收斂了，我們就敢于往里去投、去砸。大家說你聚焦AI應(yīng)用，還要不要做基礎(chǔ)大模型，年初討論的時(shí)候我們答案非常堅(jiān)決，一定要，因?yàn)槿绻贏I做服務(wù)和應(yīng)用，就像訓(xùn)練一個(gè)人去做所有的事，追求智能上限，會(huì)讓這個(gè)人更加聰明，能夠做更多、更好的服務(wù)。我們很堅(jiān)定去探索AGI、探索智能上限?！表n歆毅稱，未來，AI 時(shí)代將會(huì)重新定義一切。

螞蟻集團(tuán)CEO韓歆毅

即將開源兩款：比肩DeepSeek-V3模型和百億多模態(tài)模型

對(duì)于AI大模型領(lǐng)域來說，螞蟻?zhàn)钪匕醯南o疑是今年3月百靈大模型團(tuán)隊(duì)（Ling Team）發(fā)布的兩款MoE開源大模型論文。

今年3月，螞蟻百靈大模型團(tuán)隊(duì)開源2個(gè)MoE架構(gòu)的大語言模型Ling-lite（0220版本）和Ling-plus。

其中，Ling-lite參數(shù)規(guī)模168億（激活參數(shù)27.5億），Ling-plus基座模型參數(shù)規(guī)模高達(dá)2900億（激活參數(shù)288億），并且在多個(gè)算力平臺(tái)（包括非Hopper架構(gòu)的國產(chǎn)算力）進(jìn)行訓(xùn)練，預(yù)訓(xùn)練階段將計(jì)算成本降低約20%，每1萬億token成本達(dá)508萬元，最終實(shí)現(xiàn)行業(yè)頭部模型水平的性能表現(xiàn)，并驗(yàn)證了300B尺寸的SOTA MoE大語言模型在非高端算力平臺(tái)上訓(xùn)練的可行性。

同時(shí)，螞蟻強(qiáng)化學(xué)習(xí)AReaL團(tuán)隊(duì)還開源了AReaL-boba，可用128張H800 GPU 在1天訓(xùn)練完成SOTA 1.5B推理模型訓(xùn)練，256張H800 GPU 2天內(nèi)完成SOTA 7B推理模型訓(xùn)練。

過去幾個(gè)月，螞蟻百靈大模型團(tuán)隊(duì)進(jìn)行了迭代，Ling-lite升級(jí)到了1.5版本，相比上一代新模型的推理能力有了顯著提升，同尺寸MoE SOTA，僅用2.75B激活計(jì)算可對(duì)標(biāo)10B內(nèi)SOTA dense模型。Ling-lite-1.5采用分層語料預(yù)訓(xùn)練策略和需求驅(qū)動(dòng)的執(zhí)行優(yōu)化體系，以更少的語料和更高的質(zhì)量，性能超過同尺寸下SOTA模型，大幅提升數(shù)學(xué)、代碼等推理能力。

5月27日舉行的第十屆螞蟻技術(shù)日上，螞蟻百靈大模型團(tuán)隊(duì)宣布，即將逐步開源百億參數(shù)規(guī)模的多模態(tài)模型Ming系列Ming-lite-omni。

具體來說，這是一款以統(tǒng)一架構(gòu)集成多模態(tài)理解、生成和編輯能力的模型，支持將理解和生成模型合在一起調(diào)用，也可以單獨(dú)完成理解和生成任務(wù)，帶來原生全模態(tài)交互體驗(yàn)。

Ming-lite-omni主要承襲了5月初開源的Ming-lite-omni-preview和Ming-lite-uni這2款模型的能力，在此基礎(chǔ)上做了更為系統(tǒng)的整合優(yōu)化。

Ming-lite-omni基于Ling-lite-1.5，MoE模塊新增了模態(tài)特定路由以緩解模態(tài)沖突、增強(qiáng)模態(tài)間協(xié)同，使得音、視、圖、文等模態(tài)能夠有效統(tǒng)一在一個(gè)模型中。同時(shí)在圖像、語音生成與理解統(tǒng)一方面?zhèn)戎貎?yōu)化，突破理解與生成相互沖突的難題。至此，Ming-lite-omni實(shí)現(xiàn)了模態(tài)統(tǒng)一處理，以及多模態(tài)理解與生成在一個(gè)模型上的統(tǒng)一，可以處理音頻、視頻、圖像和文本模態(tài)的任意組合作為輸入，生成與音頻、圖像或文本輸出交織的多模態(tài)輸出，從而實(shí)現(xiàn)先進(jìn)的實(shí)時(shí)的全模態(tài)交互體驗(yàn)。

團(tuán)隊(duì)表示，“我們的目標(biāo)是逐步開源Ming系列多模態(tài)模型，這將營造一個(gè)協(xié)作環(huán)境，讓研究人員和開發(fā)者能夠在這些模型的基礎(chǔ)上進(jìn)行構(gòu)建和擴(kuò)展，從而推動(dòng) AI 應(yīng)用的創(chuàng)新。我們希望通過與社區(qū)的合作，逐步加速M(fèi)ing系列模型開發(fā)，推進(jìn)開發(fā)更先進(jìn)、更實(shí)用的 AI 系統(tǒng)，以應(yīng)對(duì)復(fù)雜的現(xiàn)實(shí)問題?！?/p>

螞蟻百靈大模型負(fù)責(zé)人周俊（花名：西亭）表示，新開源的Ming-lite-omni模型有幾個(gè)值得關(guān)注的創(chuàng)新點(diǎn)：一是真正把生成和理解模型放到一個(gè)模型；二是真正意義上的全模態(tài)輸入和輸出，都支持音視頻、圖文多種形態(tài)；三是真正是以MoE為架構(gòu)的模型，中間沒有提供其他東西，交互性較強(qiáng)。

螞蟻百靈多模態(tài)大模型負(fù)責(zé)人陳景東（景東）向筆者進(jìn)一步指出，目前更多開源的是必要的代碼，開源的更多作用是希望大家可以把Ming系列模型能夠用好。

目前來看，包括螞蟻、騰訊在內(nèi)的多家AI大模型團(tuán)隊(duì)認(rèn)為，多模態(tài)模型正在走向MoE架構(gòu)的“全模態(tài)”模型。包括Seed1.5-VL和Qwen2.5-Omni為代表的模型現(xiàn)已支持圖像、視頻、語音、文本及其任意組合的理解，而以Kimi-VL為代表支持MoE架構(gòu)；但技術(shù)挑戰(zhàn)上，支持音、視、圖、文全模態(tài)交互的公開單模型非常少見，并且圖像和語音的理解與生成統(tǒng)一模型鮮有出現(xiàn)，且理解和生成效果難以平衡。

阿里集團(tuán)副總裁許主洪認(rèn)為，當(dāng)下多模態(tài)大模型的一大演進(jìn)趨勢，正是用統(tǒng)一的框架做理解和生成，這一領(lǐng)域發(fā)展尚處于初級(jí)階段，需要實(shí)踐驗(yàn)證。而今日螞蟻開源的Ming-lite-omni，正是這一領(lǐng)域的代表性實(shí)踐。

同時(shí)，螞蟻團(tuán)隊(duì)還宣布，百靈大模型即將開源一款Ling-max模型，模型規(guī)模和性能與DeepSeek-V3“滿血版”比肩，追尋跟V3差不多的版本進(jìn)行開源，讓更多人基于百靈版本上面調(diào)用各式各樣的能力。

截至目前，螞蟻逐步形成兩類百靈基礎(chǔ)模型路線：MoE語言大模型Ling-Series/推理模型Ring-Series；原生全模態(tài)大模型Ming-Series。

除了模型更新，螞蟻三大AI管家應(yīng)用方面也有新進(jìn)展，旗下AI健康管家不久后將上線新版本。

據(jù)悉，今年初螞蟻集團(tuán)宣布完成收購好大夫之后，3月首次對(duì)外公布了以螞蟻醫(yī)療大模型為核心的“一體三端（醫(yī)療機(jī)構(gòu)、醫(yī)生、用戶）”的AI醫(yī)療布局，成為應(yīng)用場景與行業(yè)共建最深的專業(yè)大模型之一。據(jù)悉，其面向用戶端的應(yīng)用產(chǎn)品AI健康管家，從去年下半年發(fā)布以來，通過高質(zhì)量數(shù)據(jù)資源、專業(yè)標(biāo)注團(tuán)隊(duì)等多方面優(yōu)化模型，在AI就醫(yī)助理、AI健康咨詢等方面表現(xiàn)出色，充當(dāng)用戶個(gè)人日常健康管理與就醫(yī)咨詢的助理角色，上線半年服務(wù)超4000萬用戶。而這一AI應(yīng)用產(chǎn)品即將上線新版本，迎來新的產(chǎn)品功能迭代突破。

對(duì)于內(nèi)部AI產(chǎn)品使用百靈大模型情況，西亭對(duì)筆者表示，站在基礎(chǔ)大模型角度看，之所以開源這么多基礎(chǔ)模型，主要是不想讓大模型成為某些公司的專屬，通過將螞蟻更多探索的AI技術(shù)公布到開源社區(qū)，成為推動(dòng)大模型往前發(fā)展的重要起點(diǎn)。今天從業(yè)務(wù)和應(yīng)用角度來說，百靈不會(huì)強(qiáng)行做一個(gè)非常綁定，因?yàn)楫?dāng)前模型還沒有達(dá)到AGI能力，也沒有成為社會(huì)必需品，所以行業(yè)和基礎(chǔ)模型兩方會(huì)持續(xù)推進(jìn)，不會(huì)有那么強(qiáng)的耦合。

“另外，如果不談技術(shù)本身，我更加期待我們合作伙伴，純粹是因?yàn)榘凫`技術(shù)做得好而選用我們，而不是別的應(yīng)用連接使用百靈模型，這是我們對(duì)內(nèi)和對(duì)外的一個(gè)非常關(guān)鍵因素。我們希望做的東西能夠得到（開源）社區(qū)的認(rèn)可，并且與社區(qū)推動(dòng)AI技術(shù)進(jìn)步。這是我們的觀點(diǎn)?！蔽魍しQ，AGI仍處于早前階段，團(tuán)隊(duì)相信通過自己的努力、模型能力進(jìn)步后，會(huì)在合適的時(shí)間通過內(nèi)部、外部使用它。

國內(nèi)AI競爭加劇，螞蟻發(fā)力應(yīng)用

自2025年起，全球AI大模型市場“內(nèi)卷”加劇。開源模型DeepSeek引發(fā)全球討論，基礎(chǔ)大模型并未如預(yù)期一樣放緩迭代，除了DeepSeek之外的AI行業(yè)Super App超級(jí)應(yīng)用也未出現(xiàn)。

因此，國內(nèi)外科技大廠都在“內(nèi)卷”模型迭代：OpenAI發(fā)布GPT-4.5和o3；Gemini發(fā)布2.5 Pro版本；騰訊混元升級(jí)快思考模型混元TurboS、深度思考模型混元T1，并發(fā)布視覺深度推理模型T1-Vision和端到端語音通話模型混元Voice；字節(jié)跳動(dòng)旗下火山引擎發(fā)布豆包·視頻生成模型Seedance 1.0 lite、豆包1.5·視覺深度思考模型，并升級(jí)豆包·音樂模型等。

去年第四季度國內(nèi)有49個(gè)大模型更新發(fā)布，到今年一季度這一數(shù)字增長至55個(gè)，最多的時(shí)候一周有8個(gè)模型。大模型迭代速度越來越快，模型能力越來越強(qiáng)。正如李彥宏所說“大模型廠商卷生卷死?！?/p>

所以，對(duì)于AI這場戰(zhàn)役來說，企業(yè)如何利用這些強(qiáng)大模型，把AI應(yīng)用做好，讓更多人體驗(yàn)到AI技術(shù)能力，這似乎成為未來的關(guān)鍵點(diǎn)，而國內(nèi)科技大廠擁有非常強(qiáng)的基本盤產(chǎn)品，并且擁有流量、資源投入以及人才資源，將是國內(nèi)AI“下半場”競爭的核心參與者。

“跟很多創(chuàng)業(yè)公司相比，我們的優(yōu)勢不是資源，而是人才，怎么把我們的人才聚集到一起，其實(shí)靠的是協(xié)作?！表n歆毅表示，AI這件事很難，當(dāng)前螞蟻是在與全球最頂級(jí)的AI團(tuán)隊(duì)競爭，而且坦白說，這上面人家不光是跑得比我們早，也跑得比我們快。因此，對(duì)于螞蟻來說，目標(biāo)并不是做一家全球最領(lǐng)先的大模型公司，而是依然聚焦于應(yīng)用上，仍希望智能上限的探索使得AI應(yīng)用層面有突破，“至少在某幾個(gè)領(lǐng)域我們要領(lǐng)先。”

展望未來，韓歆毅首次詳細(xì)闡述螞蟻新的AI First戰(zhàn)略：

三大AI應(yīng)用服務(wù)——AI金融管家、AI健康管家、AI生活管家；
四大技術(shù)探索——百靈基礎(chǔ)大模型、AI世界的支付與基礎(chǔ)能力、科技產(chǎn)業(yè)化、開源與開放；
兩大行業(yè)探索領(lǐng)域——AI 與物理世界融合（具身智能）、區(qū)塊鏈。

談到基礎(chǔ)模型的探索，韓歆毅表示，過去幾個(gè)月螞蟻團(tuán)隊(duì)投入的探索力量和更多突破，其實(shí)在某些方向已具備全球一定的領(lǐng)先地位，但這個(gè)領(lǐng)先還是偏單點(diǎn)。今天我們要全力以赴，追求智能上限，并且不斷開源開放。另一方面，未來所有應(yīng)用隨著AI世界變得更加多樣化，螞蟻的機(jī)會(huì)在于支付，AI世界的支付可能與今天完全不一樣，因此，螞蟻需要提供AI世界的支付與基礎(chǔ)能力。

對(duì)于具身智能的探索，韓歆毅指出，這是一個(gè)面向未來的開放式探索。今年螞蟻成立了靈波科技，希望探索AI與物理世界的融合，未來還將與哈啰一起探索自動(dòng)駕駛。

“人在相當(dāng)長的時(shí)間內(nèi)，不太可能回到我們的科幻電影中，有一個(gè)養(yǎng)生艙躺進(jìn)去接上我們的虛擬世界、宇宙里面，這個(gè)短期內(nèi)不太可能發(fā)生，但至少相當(dāng)長的時(shí)間內(nèi)，人還是活在現(xiàn)實(shí)世界中，現(xiàn)實(shí)世界和數(shù)字AI世界會(huì)同時(shí)并存，而我們希望幫助大家解決現(xiàn)實(shí)AI世界問題，這就是為什么我們?nèi)ヌ剿骶呱碇悄堋⒅悄荞{駛等。”韓歆毅稱。

韓歆毅表示，如果往前看，螞蟻AI First戰(zhàn)略是一個(gè)“頂層框架型”的想法，還有一些非常具象的業(yè)務(wù)和策略依然在探索、摸索過程中，因此，整個(gè)過程中，無論是解決當(dāng)下的業(yè)務(wù)的具體問題，還是螞蟻面向未來的探索，其實(shí)都需要技術(shù)人員的創(chuàng)新與突破。“因?yàn)榧夹g(shù)是我們產(chǎn)品、業(yè)務(wù)快速奔跑的核心能力和堅(jiān)強(qiáng)后盾?！?/p>

韓歆毅強(qiáng)調(diào)，螞蟻希望真正給到用戶、合作伙伴一個(gè)革命性、代際差體驗(yàn)、核心的競爭優(yōu)勢，所以在面臨當(dāng)下AI技術(shù)探索、AI應(yīng)用的戰(zhàn)場上，我們要回到“黑客松”的精神，源于對(duì)技術(shù)的熱愛。

“我們源于熱愛，成于協(xié)同，最后我們終于創(chuàng)新，用創(chuàng)新的方式為螞蟻未來的10年、科技的10年打出一片新的天地。”韓歆毅在演講結(jié)尾稱。（本文首發(fā)于鈦媒體App，作者｜林志佳）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.