本文由無冕財經(wumiancaijing)原創發布
作者:譚嘉琳
編輯:陳澗
設計:嵐昇
2024年底,國內AI界出了兩件大事兒。
一是小米被曝出要以千萬級別的年薪,從名為“DeepSeek”(深度求索)的大模型團隊挖角一名“天才少女”,這被視為小米發力大模型軍備戰。
二是國內一款大模型面世,性能上趕超國際巨頭Open AI的GPT-4o,還因為極低的訓練成本被稱為“大模型屆的拼多多”,一時成為驚艷硅谷的“神秘東方力量”。
而這款大模型,就叫做DeepSeek-V3。
這樣一來,原本名不經傳的DeepSeek團隊一下被推到聚光燈下。更令網友震驚的是,這么頂尖的大模型,竟然不是出自天天砸錢高呼“All in AI”的互聯網大廠,而是來自私募機構幻方量化。
“炒股”機構做出來的AI,是怎么跑贏一眾大廠的?
AI“天才少女”,出自私募機構
去年12月23日,業內傳出95后AI“天才少女”羅福莉被雷軍以千萬級年薪挖角,或將領導小米的大模型團隊。
一時間,主人公眾多標簽被網友扒出:北大碩士畢業、一年發8篇頂級會議論文、畢業后橫掃BAT最頂級碩士offer……
▲羅福莉的個人簡介。圖片來自其知乎個人首頁。
不過,消息被炒熱后,據紅星新聞2024年12月31日報道,羅福莉對于是否要跳槽到小米,目前還在猶豫,還發聲希望不要被過度關注。
而像羅福莉一樣“悶聲干大事”的,還有她背后的公司幻方量化。
幻方量化成立于2015年,專注于量化投資,也就是通過數學、統計、人工智能等方式取代人工決策進行投資。
但作為私募機構,讓幻方在國內外最“出圈”的,不是投資產品,反而是以“超絕性價比”著稱的大模型產品。
2024年5月,幻方旗下的開源大模型DeepSeek-V2橫空出世,將推理成本降低到每百萬token僅1塊錢,僅是當時行業領先的GPT-4 Turbo的七十分之一。去年12月26日,DeepSeek再發布DeepSeek-V3,訓練成本僅550萬美元,約為GPT-4o的二十分之一。
而在性能方面,DeepSeek-V3 技術報告稱,其在英語、代碼、數學、漢語以及多語言任務上表現十分出色。國外獨立AI測評機構評道,“DeepSeek-V3超越了迄今為止所有開源模型”。
震驚硅谷的同時,DeepSeek也把國內公司殺了個措手不及。
雖然幻方曾向暗涌Waves透露,DeepSeek大模型目前還沒有商業化的計劃,只專注于技術創新;但如此高性能搭配極低成本,可想而知,一旦DeepSeek發力,將引發一輪“血戰”。
這不,去年5月份DeepSeek-V2問世,立馬引起各大模型警覺,掀起一陣價格戰。
獨角獸智譜AI第一個跟進,在5月11日宣布將其入門級模型GLM-3 Turbo的API降價為1元/百萬tokens;15日,字節跳動發布豆包大模型,定價低至0.0008元/千Tokens,比行業降低約99%。隨后,阿里云、騰訊云等也宣布將其下大模型降價,百度、科大訊飛等甚至決定將幾款輕量級大模型免費開放。
就在去年12月31日,DeepSeek-V3發布后5天,阿里云還宣布開啟第三輪大模型降價,其下通義千問視覺理解模型全線降價超80%。
▲阿里云發布的降價公告。圖片來自阿里云公眾號。
私募機構做AI,還“吊打”了一眾大廠。聽起來不可思議,但放在幻方倒也合理。
都知道私募是替有錢人干活的,炒股的眼光必須毒辣;而幻方從一開始,就瞄準了AI輔助——不僅要炒,還要用機器學習精準炒股。
早在2008年,幻方就開始使用機器學習探索全自動量化交易;2017年,幻方就開始全面應用深度學習技術進行交易。
到了2023年4月,ChatGPT問世一周月,大模型正是科技圈的必爭之地,幻方也抓緊組建成立子公司DeepSeek,令西方AI界驚嘆的“東方神秘力量”也就此誕生。
AI炒股,“鐮刀”會更鋒利嗎?
事實上,DeepSeek的大模型一出世,也曾引起外界質疑——私募機構要是搞起了AI炒股,普通股民哪里比得過?有的網友甚至把大模型比作“核動力鐮刀”,要割倒一片“韭菜”。
不過,DeepSeek已經向外界澄清,自己做AI大模型跟金融無關,純純是對科技創新感興趣。更何況,以幻方最近的業績來看,AI量化助攻確實作用不大。
截至去年12月20日,幻方量化共有65只基金公開披露凈值,其中有29只基金年內漲幅超過10%,其余36只基金均在年內下跌。另外,據深藍財經,此前幻方旗下多只收益率達100%-400%的產品,到2024年后大多都降至10%左右。
曾經管理規模達到千億的幻方,如今已經降到200億-300億元規模。而放眼百億級私募業績整體,數據顯示,截至11月底,年內百億級私募旗下產品平均收益超17%。如此比較,幻方反而掉隊了。
不過,既然是“最牛大模型”,DeepSeek用不到炒股上,但還是很有“錢”途的。憑借技術創新得來“超絕性價比”,DeepSeek不愁市場地位。
據鳳凰網科技,目前最新的DeepSeek-V3的定價為輸入每百萬tokens 0.5元(緩存命中)/2元(緩存未命中)、輸出每百萬tokens 8元,性價比很高。據AI咨詢公司semianalysis測算,DeepSeek-V3的毛利率達到70%以上。
雖然DeepSeek對外公布還沒開始全面商業化,但其創始人梁文鋒向媒體透露,DeepSeek已經在成本之上開始盈利。
而另一邊,大廠們還得燒錢補貼價格戰,才能與之匹敵。據科技新知,2024年5月DeepSeek-V2發布前,國內大模型推理算力毛利率高于60%,和國際同行基本一致,但在5月接連降價后,毛利率直接跌至負數。
未來DeepSeek想做的,還是大模型產業的最上游。用梁文鋒的話說,“我們只負責基礎模型和前沿的創新,然后其它公司在DeepSeek的基礎上構建toB、toC的業務”。
即使不做“鐮刀”,但可以料想,DeepSeek足以在大模型界刮起腥風血雨。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.