5月27日下午16點(diǎn)多,接任螞蟻集團(tuán)CEO僅87天的韓歆毅,穿著黃色短袖來到杭州螞蟻A空間正進(jìn)行的“螞蟻黑客松”比賽,并坐在前排臺(tái)階上仔細(xì)聆聽。今年3月,獲清華大學(xué)經(jīng)濟(jì)學(xué)碩士學(xué)位的韓歆毅升任螞蟻集團(tuán)CEO。
支付寶雙飛輪、AI First和加速全球化是螞蟻集團(tuán)的三大戰(zhàn)略。事實(shí)上,螞蟻和其他互聯(lián)網(wǎng)公司一樣,近兩年一直在 AI 領(lǐng)域進(jìn)行投入。去年螞蟻20周年時(shí)候,螞蟻集團(tuán)董事長井賢棟宣布,未來20年,螞蟻要做一家科技驅(qū)動(dòng)、創(chuàng)新驅(qū)動(dòng)的公司。
其中,在AI First戰(zhàn)略下,螞蟻推出了金融、醫(yī)療、生活服務(wù)三款A(yù)I應(yīng)用,螞蟻內(nèi)部業(yè)務(wù)也做了很多變革,支付寶、螞蟻國際等核心業(yè)務(wù)加速AI化,螞蟻內(nèi)部也成立了通用人工智能(AGI)部門,開源2900億參數(shù)規(guī)模的百靈大模型,引發(fā)關(guān)注。
韓歆毅在27日下午的內(nèi)部技術(shù)日活動(dòng)上首次詳解螞蟻AI戰(zhàn)略。
他用時(shí)三十多分鐘,全面清晰談未來螞蟻的AI戰(zhàn)略布局。在韓歆毅看來,中國 AI 大模型賽道競爭激烈,螞蟻將聚焦AI應(yīng)用側(cè),利用AI基座大模型技術(shù)做更強(qiáng)的技術(shù)服務(wù)能力。
“今天,我們永遠(yuǎn)是在AI技術(shù)突破的邊界上做一款PMF產(chǎn)品,如果技術(shù)路線不收斂,產(chǎn)品很難突破;技術(shù)路線收斂了,我們就敢于往里去投、去砸。大家說你聚焦AI應(yīng)用,還要不要做基礎(chǔ)大模型,年初討論的時(shí)候我們答案非常堅(jiān)決,一定要,因?yàn)槿绻贏I做服務(wù)和應(yīng)用,就像訓(xùn)練一個(gè)人去做所有的事,追求智能上限,會(huì)讓這個(gè)人更加聰明,能夠做更多、更好的服務(wù)。我們很堅(jiān)定去探索AGI、探索智能上限?!表n歆毅稱,未來,AI 時(shí)代將會(huì)重新定義一切。
螞蟻集團(tuán)CEO韓歆毅
即將開源兩款:比肩DeepSeek-V3模型和百億多模態(tài)模型
對(duì)于AI大模型領(lǐng)域來說,螞蟻?zhàn)钪匕醯南o疑是今年3月百靈大模型團(tuán)隊(duì)(Ling Team)發(fā)布的兩款MoE開源大模型論文。
今年3月,螞蟻百靈大模型團(tuán)隊(duì)開源2個(gè)MoE架構(gòu)的大語言模型Ling-lite(0220版本)和Ling-plus。
其中,Ling-lite參數(shù)規(guī)模168億(激活參數(shù)27.5億),Ling-plus基座模型參數(shù)規(guī)模高達(dá)2900億(激活參數(shù)288億),并且在多個(gè)算力平臺(tái)(包括非Hopper架構(gòu)的國產(chǎn)算力)進(jìn)行訓(xùn)練,預(yù)訓(xùn)練階段將計(jì)算成本降低約20%,每1萬億token成本達(dá)508萬元,最終實(shí)現(xiàn)行業(yè)頭部模型水平的性能表現(xiàn),并驗(yàn)證了300B尺寸的SOTA MoE大語言模型在非高端算力平臺(tái)上訓(xùn)練的可行性。
同時(shí),螞蟻強(qiáng)化學(xué)習(xí)AReaL團(tuán)隊(duì)還開源了AReaL-boba,可用128張H800 GPU 在1天訓(xùn)練完成SOTA 1.5B推理模型訓(xùn)練,256張H800 GPU 2天內(nèi)完成SOTA 7B推理模型訓(xùn)練。
過去幾個(gè)月,螞蟻百靈大模型團(tuán)隊(duì)進(jìn)行了迭代,Ling-lite升級(jí)到了1.5版本,相比上一代新模型的推理能力有了顯著提升,同尺寸MoE SOTA,僅用2.75B激活計(jì)算可對(duì)標(biāo)10B內(nèi)SOTA dense模型。Ling-lite-1.5采用分層語料預(yù)訓(xùn)練策略和需求驅(qū)動(dòng)的執(zhí)行優(yōu)化體系,以更少的語料和更高的質(zhì)量,性能超過同尺寸下SOTA模型,大幅提升數(shù)學(xué)、代碼等推理能力。
5月27日舉行的第十屆螞蟻技術(shù)日上,螞蟻百靈大模型團(tuán)隊(duì)宣布,即將逐步開源百億參數(shù)規(guī)模的多模態(tài)模型Ming系列Ming-lite-omni。
具體來說,這是一款以統(tǒng)一架構(gòu)集成多模態(tài)理解、生成和編輯能力的模型,支持將理解和生成模型合在一起調(diào)用,也可以單獨(dú)完成理解和生成任務(wù),帶來原生全模態(tài)交互體驗(yàn)。
Ming-lite-omni主要承襲了5月初開源的Ming-lite-omni-preview和Ming-lite-uni這2款模型的能力,在此基礎(chǔ)上做了更為系統(tǒng)的整合優(yōu)化。
Ming-lite-omni基于Ling-lite-1.5,MoE模塊新增了模態(tài)特定路由以緩解模態(tài)沖突、增強(qiáng)模態(tài)間協(xié)同,使得音、視、圖、文等模態(tài)能夠有效統(tǒng)一在一個(gè)模型中。同時(shí)在圖像、語音生成與理解統(tǒng)一方面?zhèn)戎貎?yōu)化,突破理解與生成相互沖突的難題。至此,Ming-lite-omni實(shí)現(xiàn)了模態(tài)統(tǒng)一處理,以及多模態(tài)理解與生成在一個(gè)模型上的統(tǒng)一,可以處理音頻、視頻、圖像和文本模態(tài)的任意組合作為輸入,生成與音頻、圖像或文本輸出交織的多模態(tài)輸出,從而實(shí)現(xiàn)先進(jìn)的實(shí)時(shí)的全模態(tài)交互體驗(yàn)。
團(tuán)隊(duì)表示,“我們的目標(biāo)是逐步開源Ming系列多模態(tài)模型,這將營造一個(gè)協(xié)作環(huán)境,讓研究人員和開發(fā)者能夠在這些模型的基礎(chǔ)上進(jìn)行構(gòu)建和擴(kuò)展,從而推動(dòng) AI 應(yīng)用的創(chuàng)新。我們希望通過與社區(qū)的合作,逐步加速M(fèi)ing系列模型開發(fā),推進(jìn)開發(fā)更先進(jìn)、更實(shí)用的 AI 系統(tǒng),以應(yīng)對(duì)復(fù)雜的現(xiàn)實(shí)問題?!?/p>
螞蟻百靈大模型負(fù)責(zé)人周俊(花名:西亭)表示,新開源的Ming-lite-omni模型有幾個(gè)值得關(guān)注的創(chuàng)新點(diǎn):一是真正把生成和理解模型放到一個(gè)模型;二是真正意義上的全模態(tài)輸入和輸出,都支持音視頻、圖文多種形態(tài);三是真正是以MoE為架構(gòu)的模型,中間沒有提供其他東西,交互性較強(qiáng)。
螞蟻百靈多模態(tài)大模型負(fù)責(zé)人陳景東(景東)向筆者進(jìn)一步指出,目前更多開源的是必要的代碼,開源的更多作用是希望大家可以把Ming系列模型能夠用好。
目前來看,包括螞蟻、騰訊在內(nèi)的多家AI大模型團(tuán)隊(duì)認(rèn)為,多模態(tài)模型正在走向MoE架構(gòu)的“全模態(tài)”模型。包括Seed1.5-VL和Qwen2.5-Omni為代表的模型現(xiàn)已支持圖像、視頻、語音、文本及其任意組合的理解,而以Kimi-VL為代表支持MoE架構(gòu);但技術(shù)挑戰(zhàn)上,支持音、視、圖、文全模態(tài)交互的公開單模型非常少見,并且圖像和語音的理解與生成統(tǒng)一模型鮮有出現(xiàn),且理解和生成效果難以平衡。
阿里集團(tuán)副總裁許主洪認(rèn)為,當(dāng)下多模態(tài)大模型的一大演進(jìn)趨勢,正是用統(tǒng)一的框架做理解和生成,這一領(lǐng)域發(fā)展尚處于初級(jí)階段,需要實(shí)踐驗(yàn)證。而今日螞蟻開源的Ming-lite-omni,正是這一領(lǐng)域的代表性實(shí)踐。
同時(shí),螞蟻團(tuán)隊(duì)還宣布,百靈大模型即將開源一款Ling-max模型,模型規(guī)模和性能與DeepSeek-V3“滿血版”比肩,追尋跟V3差不多的版本進(jìn)行開源,讓更多人基于百靈版本上面調(diào)用各式各樣的能力。
截至目前,螞蟻逐步形成兩類百靈基礎(chǔ)模型路線:MoE語言大模型Ling-Series/推理模型Ring-Series;原生全模態(tài)大模型Ming-Series。
除了模型更新,螞蟻三大AI管家應(yīng)用方面也有新進(jìn)展,旗下AI健康管家不久后將上線新版本。
據(jù)悉,今年初螞蟻集團(tuán)宣布完成收購好大夫之后,3月首次對(duì)外公布了以螞蟻醫(yī)療大模型為核心的“一體三端(醫(yī)療機(jī)構(gòu)、醫(yī)生、用戶)”的AI醫(yī)療布局,成為應(yīng)用場景與行業(yè)共建最深的專業(yè)大模型之一。據(jù)悉,其面向用戶端的應(yīng)用產(chǎn)品AI健康管家,從去年下半年發(fā)布以來,通過高質(zhì)量數(shù)據(jù)資源、專業(yè)標(biāo)注團(tuán)隊(duì)等多方面優(yōu)化模型,在AI就醫(yī)助理、AI健康咨詢等方面表現(xiàn)出色,充當(dāng)用戶個(gè)人日常健康管理與就醫(yī)咨詢的助理角色,上線半年服務(wù)超4000萬用戶。而這一AI應(yīng)用產(chǎn)品即將上線新版本,迎來新的產(chǎn)品功能迭代突破。
對(duì)于內(nèi)部AI產(chǎn)品使用百靈大模型情況,西亭對(duì)筆者表示,站在基礎(chǔ)大模型角度看,之所以開源這么多基礎(chǔ)模型,主要是不想讓大模型成為某些公司的專屬,通過將螞蟻更多探索的AI技術(shù)公布到開源社區(qū),成為推動(dòng)大模型往前發(fā)展的重要起點(diǎn)。今天從業(yè)務(wù)和應(yīng)用角度來說,百靈不會(huì)強(qiáng)行做一個(gè)非常綁定,因?yàn)楫?dāng)前模型還沒有達(dá)到AGI能力,也沒有成為社會(huì)必需品,所以行業(yè)和基礎(chǔ)模型兩方會(huì)持續(xù)推進(jìn),不會(huì)有那么強(qiáng)的耦合。
“另外,如果不談技術(shù)本身,我更加期待我們合作伙伴,純粹是因?yàn)榘凫`技術(shù)做得好而選用我們,而不是別的應(yīng)用連接使用百靈模型,這是我們對(duì)內(nèi)和對(duì)外的一個(gè)非常關(guān)鍵因素。我們希望做的東西能夠得到(開源)社區(qū)的認(rèn)可,并且與社區(qū)推動(dòng)AI技術(shù)進(jìn)步。這是我們的觀點(diǎn)?!蔽魍しQ,AGI仍處于早前階段,團(tuán)隊(duì)相信通過自己的努力、模型能力進(jìn)步后,會(huì)在合適的時(shí)間通過內(nèi)部、外部使用它。
國內(nèi)AI競爭加劇,螞蟻發(fā)力應(yīng)用
自2025年起,全球AI大模型市場“內(nèi)卷”加劇。開源模型DeepSeek引發(fā)全球討論,基礎(chǔ)大模型并未如預(yù)期一樣放緩迭代,除了DeepSeek之外的AI行業(yè)Super App超級(jí)應(yīng)用也未出現(xiàn)。
因此,國內(nèi)外科技大廠都在“內(nèi)卷”模型迭代:OpenAI發(fā)布GPT-4.5和o3;Gemini發(fā)布2.5 Pro版本;騰訊混元升級(jí)快思考模型混元TurboS、深度思考模型混元T1,并發(fā)布視覺深度推理模型T1-Vision和端到端語音通話模型混元Voice;字節(jié)跳動(dòng)旗下火山引擎發(fā)布豆包·視頻生成模型Seedance 1.0 lite、豆包1.5·視覺深度思考模型,并升級(jí)豆包·音樂模型等。
去年第四季度國內(nèi)有49個(gè)大模型更新發(fā)布,到今年一季度這一數(shù)字增長至55個(gè),最多的時(shí)候一周有8個(gè)模型。大模型迭代速度越來越快,模型能力越來越強(qiáng)。正如李彥宏所說“大模型廠商卷生卷死?!?/p>
所以,對(duì)于AI這場戰(zhàn)役來說,企業(yè)如何利用這些強(qiáng)大模型,把AI應(yīng)用做好,讓更多人體驗(yàn)到AI技術(shù)能力,這似乎成為未來的關(guān)鍵點(diǎn),而國內(nèi)科技大廠擁有非常強(qiáng)的基本盤產(chǎn)品,并且擁有流量、資源投入以及人才資源,將是國內(nèi)AI“下半場”競爭的核心參與者。
“跟很多創(chuàng)業(yè)公司相比,我們的優(yōu)勢不是資源,而是人才,怎么把我們的人才聚集到一起,其實(shí)靠的是協(xié)作?!表n歆毅表示,AI這件事很難,當(dāng)前螞蟻是在與全球最頂級(jí)的AI團(tuán)隊(duì)競爭,而且坦白說,這上面人家不光是跑得比我們早,也跑得比我們快。因此,對(duì)于螞蟻來說,目標(biāo)并不是做一家全球最領(lǐng)先的大模型公司,而是依然聚焦于應(yīng)用上,仍希望智能上限的探索使得AI應(yīng)用層面有突破,“至少在某幾個(gè)領(lǐng)域我們要領(lǐng)先。”
展望未來,韓歆毅首次詳細(xì)闡述螞蟻新的AI First戰(zhàn)略:
- 三大AI應(yīng)用服務(wù)——AI金融管家、AI健康管家、AI生活管家;
- 四大技術(shù)探索——百靈基礎(chǔ)大模型、AI世界的支付與基礎(chǔ)能力、科技產(chǎn)業(yè)化、開源與開放;
- 兩大行業(yè)探索領(lǐng)域——AI 與物理世界融合(具身智能)、區(qū)塊鏈。
談到基礎(chǔ)模型的探索,韓歆毅表示,過去幾個(gè)月螞蟻團(tuán)隊(duì)投入的探索力量和更多突破,其實(shí)在某些方向已具備全球一定的領(lǐng)先地位,但這個(gè)領(lǐng)先還是偏單點(diǎn)。今天我們要全力以赴,追求智能上限,并且不斷開源開放。另一方面,未來所有應(yīng)用隨著AI世界變得更加多樣化,螞蟻的機(jī)會(huì)在于支付,AI世界的支付可能與今天完全不一樣,因此,螞蟻需要提供AI世界的支付與基礎(chǔ)能力。
對(duì)于具身智能的探索,韓歆毅指出,這是一個(gè)面向未來的開放式探索。今年螞蟻成立了靈波科技,希望探索AI與物理世界的融合,未來還將與哈啰一起探索自動(dòng)駕駛。
“人在相當(dāng)長的時(shí)間內(nèi),不太可能回到我們的科幻電影中,有一個(gè)養(yǎng)生艙躺進(jìn)去接上我們的虛擬世界、宇宙里面,這個(gè)短期內(nèi)不太可能發(fā)生,但至少相當(dāng)長的時(shí)間內(nèi),人還是活在現(xiàn)實(shí)世界中,現(xiàn)實(shí)世界和數(shù)字AI世界會(huì)同時(shí)并存,而我們希望幫助大家解決現(xiàn)實(shí)AI世界問題,這就是為什么我們?nèi)ヌ剿骶呱碇悄堋⒅悄荞{駛等。”韓歆毅稱。
韓歆毅表示,如果往前看,螞蟻AI First戰(zhàn)略是一個(gè)“頂層框架型”的想法,還有一些非常具象的業(yè)務(wù)和策略依然在探索、摸索過程中,因此,整個(gè)過程中,無論是解決當(dāng)下的業(yè)務(wù)的具體問題,還是螞蟻面向未來的探索,其實(shí)都需要技術(shù)人員的創(chuàng)新與突破。“因?yàn)榧夹g(shù)是我們產(chǎn)品、業(yè)務(wù)快速奔跑的核心能力和堅(jiān)強(qiáng)后盾?!?/p>
韓歆毅強(qiáng)調(diào),螞蟻希望真正給到用戶、合作伙伴一個(gè)革命性、代際差體驗(yàn)、核心的競爭優(yōu)勢,所以在面臨當(dāng)下AI技術(shù)探索、AI應(yīng)用的戰(zhàn)場上,我們要回到“黑客松”的精神,源于對(duì)技術(shù)的熱愛。
“我們源于熱愛,成于協(xié)同,最后我們終于創(chuàng)新,用創(chuàng)新的方式為螞蟻未來的10年、科技的10年打出一片新的天地。”韓歆毅在演講結(jié)尾稱。(本文首發(fā)于鈦媒體App,作者|林志佳)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.