為加速人工智能領域布局,上海正積極行動,聚焦于技術前沿。
2月21日至23日,上海開年首個科技盛會——“2025全球開發者先鋒大會”即將在上海徐匯舉辦。近日,《國際金融報》記者來到徐匯區“模速空間”探營,與多家在人工智能領域嶄露頭角的企業交流,直觀感受他們在人工智能技術研發、產品創新等方面的活力與潛力。
開源兩款多模態大模型,展現視頻、語音生成能力
2月18日,階躍星辰開源了兩款階躍Step系列多模態大模型——Step-Video-T2V視頻生成模型和Step-Audio語音模型。
階躍星辰副總裁李璟介紹稱,階躍 Step-Video-T2V模型的參數量達到300億,可以直接生成204幀、540P分辨率的高質量視頻,意味著能確保生成的視頻內容具有極高的信息密度和強大的一致性。根據企業官方技術報告中的測評結果來看,它是目前全球范圍內參數量最大、性能最好的開源視頻生成大模型。
在生成效果上,記者看到,Step-Video-T2V在復雜運動、美感人物、視覺想象力、基礎文字生成、原生中英雙語輸入和鏡頭語言等方面具備強大的生成能力,且語義理解和指令遵循能力突出,能夠高效助力視頻創作者實現精準創意呈現。同時,Step-Video-T2V 對復雜運動場景具有優異的把控能力,無論是高雅優美的芭蕾舞、對抗激烈的空手道、緊張刺激的羽毛球,還是高速翻轉的跳水,都能展現。
“階躍Step-Audio是行業內首個產品級的開源語音交互模型。”李璟說,能根據不同的場景需求生成情緒、方言、語種、歌聲和個性化風格的表達,能和用戶自然地進行高質量對話。“同時,模型生成的語音具有自然流暢、情商高等特征,同時也能支持不同角色的音色克隆,滿足影視娛樂、社交、游戲等行業場景下應用需求。”
階躍星辰作為一家2023年成立的AI初創公司,專注于千億參數大模型的研發,其Step系列通用模型以邏輯推理與復雜任務處理能力為特色,并與云計算廠商合作提供企業級AI服務。
李璟認為,國內開源生態的日益成熟,為廠商提供了強大的開源動力。他舉例指出,階躍星辰在發布此次開源大模型后,迅速獲得了云廠商、社區的積極響應與適配,這些行動都是自發產生的,表明開源環境有助于廠商更有效地進行模型迭代與優化。
“開源,作為促進開發者參與和應用部署的有效方式,是階躍星辰此次選擇開放兩款模型的重要原因。”李璟進一步表示,這次開源的視頻生成模型,是目前開源社區參與量最大、效果最好的一類模型,也是階躍模型矩陣中的兩大亮點。期待更多合作伙伴的體驗與加入,共同推動全球開源社區的多模態技術發展。
談及即將開幕的GDC大會,李璟直言,去年的大會是階躍星辰首次亮相,在不到一年時間里,階躍星辰在模型和生態建設方面都取得了顯著的進步。因此,今年的GDC大會上,階躍星辰的參與將更加深入和廣泛。階躍星辰將在會上設立活動板塊和環節,并圍繞金融、內容及開發者生態舉辦兩場分論壇,旨在與業界共同交流探討模型創新生態到應用生態方面的想法,“期待這樣的交流碰撞能為階躍星辰帶來更多對未來方向的判斷和理解”。
加速語料庫建設,推進大模型在各領域應用
庫帕思是一家定位于專業化的功能性語料服務運營平臺,按照開放性、鏈接型、市場化的總體要求,立足“1+N”的運營模式,致力于面向基模、垂類模型、中小創新創業者提供低成本、高質量的語料數據服務。
上海庫帕思科技有限公司CEO黃海清介紹稱,目前已全面啟動具身智能、金融、制造、教育、醫療、文娛、城市治理等領域的行業語料庫建設,按照儲備一批、轉化一批、應用一批,穩步推進數據語料化工作,并對外提供市場化服務。
黃海清透露,語料運營1.0平臺已投入實戰運營,正加快布局從真實世界到模擬仿真到數據合成平臺2.0研制,開展基于世界模型的模擬仿真技術創新。目前,企業已經鏈接了超過50家的語料生態合作伙伴,大模型語料數據聯盟實現了實質性的“提質擴容”。
黃海清認為,行業垂類大模型將成為未來的主戰場,人工智能和大模型將對各行各業產生深遠影響。目前,金融、教育、醫療、工業等領域已經率先采用了大模型,而在自動駕駛、具身智能、科學智能等重點領域,大模型也正在被積極應用。黃海清預測,隨著時間的推移,交通、零售等行業也將逐步接納大模型,這場大模型的革命將是全面且深刻的。
“隨著科技的快速發展,國家相關法律法規應當與時俱進。在人工智能、大模型及語料數據領域,傳統的版權法主要是為人類設計的,而當前的標準在衡量機器學習時可能并不完全適用。”黃海清指出,“這一問題已經對大模型公司的語料采購成本等產生了影響。”
因此,建議加快明確大模型語料數據的合理使用規則,推動“文本與數據挖掘”在預訓練領域的適用。同時,在國內推行針對機器學習的數據合理使用,以平衡著作權人權利和科技發展需要,并解決授權難的問題。
在其看來,政府應出臺鼓勵政策,支持語料數據企業加強自動化工具鏈平臺的研發,以降低語料數據成本。還可打造AI自動化清洗與標注工具鏈平臺,降低語料成本。
黃海清強調,版權法應當與時俱進,對人工智能、大模型訓練語料數據的合理界定范圍進行更新,這并不是要改變過去的規則,而是增加和更新相關內容,他認為這是一個既適合又可操作的路徑。
推動智能算力發展,提供低成本高效算力服務
智能算力是大模型創新和人工智能應用的動力引擎。
云賽智聯股份有限公司(下稱“云賽智聯”)是上海儀電旗下專注于云計算和大數據、行業解決方案及智能化產品的專業化信息技術服務企業,深耕 ToG、ToB 領域,積極開拓市場,已連續六年承建上海市大數據中心數據運營項目。
云賽智聯市場高級經理茅宇中透露,全球開發者先鋒大會開幕式當天,云賽智聯將與全球頂尖科技企業、開發者及行業領袖齊聚上海西岸藝術中心,舉辦“2025全球開發者先鋒大會-上海儀電專場”,一起探索智能算力與前沿科技的無限可能。屆時,上海儀電智慧城市設計研究院、云賽智聯及下屬企業還將帶來行業垂類應用的報告,分享智慧城市、商業決策等領域的創新實踐。
上海儀電智算科技商務生態中心主管黃燕告訴記者,作為“模塑申城”五大公共服務平臺之一的上海智能算力公共服務平臺建設運營單位,上海儀電投產了多個國內領先的“大規模、高等級”萬卡智算集群,為上海重要大模型企業以及研究機構提供了低成本算力服務,并建設了國產化AI算力適配測試中心、人工智能產業研究等一系列公共服務功能。比如在算力效率方面,支持容器化調度和大模型自動續訓,有效訓練時間占比達99%以上。應用部署方面,支撐了階躍星辰Step、書生浦語、商湯日日新、MiniMax ABAB、DeepSeek、Llama3、通義千問等大模型的高效部署和加速,并內置“一站式”模型研發平臺。
記者采訪了解到,為降低人工智能中小企業創新成本,在上海市經信委指導下,上海儀電將邀請相關企業共建上海市智能算力資源統籌調度服務平臺,旨在通過精準匹配多方供需,融合調度各方資源,支撐和繁榮上海大模型創新生態。據介紹,該平臺包含算力超市、算力納管、算力融合等主要功能板塊。其中,算力超市核心定位為“構建算力交易生態,促成供需多邊交易”,包括算力產品商城、算力招標市場等兩部分;算力納管核心定位為“匯總監控、計費、資源統計等數據,實現算力的統籌監控”,包括交易直連、監控計費數據上報、可視化數據分析等三部分;算力融合核心定位為異構異域算力資源管理和調度,包括算力調度、任務調度、算力補貼閉環管理三部分。
(本文照片均由記者潘潔拍攝)
記者 潘潔
編輯 潘晟
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.