中經記者 曲忠芳 北京報道
當“百模大戰”偃旗息鼓、“AI六小虎”漸行漸遠,大模型的“大力出奇跡”和智能涌現是否已趨向枯竭?
6月6日至7日,在第七屆智源大會上,智源研究院正式推出了“悟界”系列開源大模型,涵蓋多模態世界模型、腦科學多模態模型、具身大腦與大小腦協作框架、全原子微觀生命模型等。與此同時,現場設置的AI科研成果互動體驗展區展示了悟界系列大模型在具身智能、腦科學、數字心臟等領域的應用場景。
在大會前,智源研究院院長王仲遠在接受包括《中國經營報》在內的媒體記者采訪時表示:“大模型技術還遠沒有發展到盡頭,過往業界所說的百模大戰,更多的是指大語言模型的競爭,而大語言模型囿于互聯網數據使用的瓶頸,基礎模型性能雖然仍在提升,但提升速度已明顯放緩。”
在采訪中,關于如何解決大語言模型性能提升瓶頸、當下的人形機器人熱潮,以及AI Agent(智能體)的發展趨勢等問題,王仲遠一一作出了正面回應。
大模型性能提升瓶頸的不同“解法”
王仲遠指出,針對大語言模型性能提升瓶頸的“解法”,能夠看到當下業界的三種路徑:一是通過強化學習提升后訓練和推理能力的提升。例如OpenAI O4、DeepSeek R1等的推出,都是過去一年里大模型領域最明顯的進展。二是數據合成,目前學術界仍在突破期。互聯網數據是由人類創造的,假設AI合成數據、生成數據的質量能夠媲美人類創造的數據質量,那意味著AI就有可能實現自我學習和進步。三是多模態數態。在全世界范圍內,多模態數據是文字數據的成百上千倍、萬倍甚至更多,但這些數據還并沒有被有效地利用起來。
對此,智源研究院的“解法”是圍繞原生多模態世界模型去做研究和布局。王仲遠表示:“原生多模態世界模型本質上是為了讓AI去感知和理解物理世界,進而實現與物理世界的交互。”
在智源研究院看來,當AI進入物理世界后,在宏觀層面,大模型與硬件結合通過具身智能的發展解決實際生產生活問題;而在微觀層面,生成式AI的應用能夠進一步揭示微觀世界的本質。由此所構成的世界模型是實現物理AGI(通用人工智能)的重要發展路徑,智源研究院的工作布局則是圍繞這一技術發展趨勢而進行布局的。
在智源大會現場,記者了解到,“悟界”系列大模型主要包括:原生多模態世界模型Emu3、腦科學多模態通用基礎模型見微Brainμ、跨本體具身大小腦協作框架RoboOS 2.0與具身大腦RoboBrain2.0,以及全原子微觀生命模型OpenComplex2。
其中,王仲遠介紹,RoboOS 2.0與RoboBrain2.0能夠適配各種形態的機器人,涵蓋輪式單臂、輪式雙臂、雙足人足、四足機器人等。截至目前,智源研究院已與全球20多家具身智能企業建立了戰略合作關系。
除此之外,關于AI Agent在今年密集涌現的現象,王仲遠解釋,當基礎模型達到“可用”的水平——指既能理解自然語言,又具有一定的邏輯,大模型就會進入“好用”的階段,促進產業的發展。Agnet是一個重要的產業落地形式,產業可以在基礎模型之上開發出解決用戶實際需求的Agent。當然,創業公司還要考慮ROI(投入產出比),模型需要在保證相同能力的情況下越小越好,慢思考能力或推理能力在保證推理效果的情況下越快越好。這個過程中遇到的瓶頸在未來會被逐步解決。
王仲遠表示,智源研究院與香港投資管理有限公司建立戰略合作框架,共建世界級跨區域合作的人工智能生態圈,推動加速人才、技術、資本的飛輪效應。
“2025年人形機器人剛學會跑”
不同于往屆,今年智源大會首次將具身智能升級為全天的分論壇,并加入了人形機器人的主題,由此具身智能的火熱程度可見一斑。會議期間,記者還在具身智能展區看到,各種構型的機器人展示了制作漢堡、倒飲料、抓娃娃、家居物品收納等不同的技能。其中,智源與銀河通用聯合研發的具身大模型機器人Galbot,展示了商超場景下的落地應用能力。
當被問及如何看待近半年里人形機器人熱潮時,王仲遠表示,長期來看,人形機器人是具身智能領域非常重要的發展方向。不過,不同構型的機器人會是共存的狀態。與其他構型的機器人比較來說,人形機器人的成熟周期要慢。“2024年,人形機器人剛剛會走,而2025年我們可以看到,人形機器人學會了跑,能否走得穩、跑得穩,產業界仍在努力中。”
王仲遠提到,具身智能目前存在“循環悖論”,即具身能力不足,限制了真機數據的采集;數據的稀缺導致模型能力弱、落地難,無法進一步提升具身能力。
產業界中不同的參與力量在探索不同的解決辦法。其一,硬件的成本越來越低,未來如果能夠做到一臺機器人賣幾千元錢,那么消費者的購買意愿顯然會比一臺機器人一百萬元、幾十萬元的可能性高;其二,許多企業在數據方面下功夫,在真實數據之外,通過仿真數據集成訓練出有效的模型。智源研究院走的則是大模型的路線,依靠互聯網數據幫助機器人學習智能。簡單來說,學習海量的已有數據,再通過強化學習和真實世界的數據不斷訓練能力,突破具身智能的發展上限。
“不同的企業和研究團隊都在用不同的方式進行探索,現階段尚未達成共識。”王仲遠表示,目前具身智能的本體硬件和具身模型都不成熟,這需要本體硬件和模型研發的共同努力。他提到,智源研究院在與機器人本體硬件公司交流時,本體公司普遍認為要展示硬件機器人的能力上限,同時也要降低成本。當售價足夠“親民”,那么數據采集量和模型提升速度就會大幅度提升。
(編輯:吳清 審核:李正豪 校對:顏京寧)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.