芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影
芯東西5月9日報道,據EETimes報道,美國AI芯片獨角獸SambaNova Systems近期宣布將裁員77人,約占其500名員工的15%。此次裁員正值該公司偏離最初目標,放棄做AI訓練,轉向完全專注于AI推理。
SambaNova成立于2017年,總部位于美國加州,曾希望為訓練和推理打造基于統一架構的AI芯片,2023年發布了一款專為大語言模型微調和推理設計的芯片。其上一輪融資是2021年的D輪融資,使其融資總額超過11億美元(約合人民幣80億元),估值超過50億美元(約合人民幣362億元)。
SambaNova發言人稱,SambaNova做出了一些調整,以適應當前的市場狀況以及從模型訓練到微調和推理的轉變。SambaNova已迅速轉向專注于提供云優先解決方案,幫助企業和開發者大規模部署開源模型。
在AI訓練市場,英偉達的統治地位難以撼動。相對而言,在AI推理市場收獲客戶可能性更大,隨著大模型服務日益普及,模型推理亟需更高性價比的算力基礎設施,這使得數據中心AI推理芯片市場規模被空前看好。數據中心領域的AI芯片和硬件創企已轉向通過云端提供對開源大語言模型的API訪問。
SambaNova的目標客戶群是企業市場,他們正嘗試通過云服務部署基于大語言模型的應用程序來進入推理領域,去年9月首次推出SambaNova Cloud。該公司的軟件棧SambaNova Studio面向企業AI,并隨SambaNova機架式硬件一起提供,用于本地集群和云端。
近幾個月來,AI芯片獨角獸SambaNova、Cerebras、Groq,通過自有硬件提供大語言模型token服務。這三家公司最初都專注于為其他云服務提供商和本地AI計算銷售硬件系統,其中SambaNova和Cerebras仍在銷售硬件系統。
SambaNova平臺搭載其第四代處理器SN40L。SN40L采用數據流架構和三層內存架構,提高了AI推理效率。通過整合超大內存,單個SambaNova系統即可容納數TB的模型。
根據獨立AI基準測試公司Artificial Analysis的測試結果,SambaNova在DeepSeek R1 671B上平均每秒每位用戶可交付250個token,而使用GPU的提供商平均每秒每位用戶僅交付19個token,這意味著SambaNova的推理性能平均比GPU驅動的系統快10倍以上。
盡管多家AI芯片創企曾披露“超越英偉達”的雄心,并試圖通過提供更具競爭力的價格來打動客戶,但芯片市場競爭非常殘酷,英偉達的生態影響力難以撼動,其他在AI芯片市場上有所作為的供應商也以芯片大廠居多。
精簡團隊、聚焦主線,是近期多家芯片企業為改善業績、增強競爭力的主要手段。隨著企業適應不斷變化的行業競爭和經濟狀況,2025年科技行業的裁員名單預計會變得更長。
來源:SambaNova,EETimes
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.