網易首頁 > 網易號 > 正文申請入駐

私募機構做的“AI鐮刀”，秒殺大廠，雷軍也動手了

2025-01-06 10:27:43　來源: 無冕財經

廣東舉報

分享至

本文由無冕財經（wumiancaijing）原創發布

作者：譚嘉琳

編輯：陳澗

設計：嵐昇

2024年底，國內AI界出了兩件大事兒。

一是小米被曝出要以千萬級別的年薪，從名為“DeepSeek”（深度求索）的大模型團隊挖角一名“天才少女”，這被視為小米發力大模型軍備戰。

二是國內一款大模型面世，性能上趕超國際巨頭Open AI的GPT-4o，還因為極低的訓練成本被稱為“大模型屆的拼多多”，一時成為驚艷硅谷的“神秘東方力量”。

而這款大模型，就叫做DeepSeek-V3。

這樣一來，原本名不經傳的DeepSeek團隊一下被推到聚光燈下。更令網友震驚的是，這么頂尖的大模型，竟然不是出自天天砸錢高呼“All in AI”的互聯網大廠，而是來自私募機構幻方量化。

“炒股”機構做出來的AI，是怎么跑贏一眾大廠的？

AI“天才少女”，出自私募機構

去年12月23日，業內傳出95后AI“天才少女”羅福莉被雷軍以千萬級年薪挖角，或將領導小米的大模型團隊。

一時間，主人公眾多標簽被網友扒出：北大碩士畢業、一年發8篇頂級會議論文、畢業后橫掃BAT最頂級碩士offer……

▲羅福莉的個人簡介。圖片來自其知乎個人首頁。

不過，消息被炒熱后，據紅星新聞2024年12月31日報道，羅福莉對于是否要跳槽到小米，目前還在猶豫，還發聲希望不要被過度關注。

而像羅福莉一樣“悶聲干大事”的，還有她背后的公司幻方量化。

幻方量化成立于2015年，專注于量化投資，也就是通過數學、統計、人工智能等方式取代人工決策進行投資。

但作為私募機構，讓幻方在國內外最“出圈”的，不是投資產品，反而是以“超絕性價比”著稱的大模型產品。

2024年5月，幻方旗下的開源大模型DeepSeek-V2橫空出世，將推理成本降低到每百萬token僅1塊錢，僅是當時行業領先的GPT-4 Turbo的七十分之一。去年12月26日，DeepSeek再發布DeepSeek-V3，訓練成本僅550萬美元，約為GPT-4o的二十分之一。

而在性能方面，DeepSeek-V3 技術報告稱，其在英語、代碼、數學、漢語以及多語言任務上表現十分出色。國外獨立AI測評機構評道，“DeepSeek-V3超越了迄今為止所有開源模型”。

震驚硅谷的同時，DeepSeek也把國內公司殺了個措手不及。

雖然幻方曾向暗涌Waves透露，DeepSeek大模型目前還沒有商業化的計劃，只專注于技術創新；但如此高性能搭配極低成本，可想而知，一旦DeepSeek發力，將引發一輪“血戰”。

這不，去年5月份DeepSeek-V2問世，立馬引起各大模型警覺，掀起一陣價格戰。

獨角獸智譜AI第一個跟進，在5月11日宣布將其入門級模型GLM-3 Turbo的API降價為1元/百萬tokens；15日，字節跳動發布豆包大模型，定價低至0.0008元/千Tokens，比行業降低約99%。隨后，阿里云、騰訊云等也宣布將其下大模型降價，百度、科大訊飛等甚至決定將幾款輕量級大模型免費開放。

就在去年12月31日，DeepSeek-V3發布后5天，阿里云還宣布開啟第三輪大模型降價，其下通義千問視覺理解模型全線降價超80%。

▲阿里云發布的降價公告。圖片來自阿里云公眾號。

私募機構做AI，還“吊打”了一眾大廠。聽起來不可思議，但放在幻方倒也合理。

都知道私募是替有錢人干活的，炒股的眼光必須毒辣；而幻方從一開始，就瞄準了AI輔助——不僅要炒，還要用機器學習精準炒股。

早在2008年，幻方就開始使用機器學習探索全自動量化交易；2017年，幻方就開始全面應用深度學習技術進行交易。

到了2023年4月，ChatGPT問世一周月，大模型正是科技圈的必爭之地，幻方也抓緊組建成立子公司DeepSeek，令西方AI界驚嘆的“東方神秘力量”也就此誕生。

AI炒股，“鐮刀”會更鋒利嗎？

事實上，DeepSeek的大模型一出世，也曾引起外界質疑——私募機構要是搞起了AI炒股，普通股民哪里比得過？有的網友甚至把大模型比作“核動力鐮刀”，要割倒一片“韭菜”。

不過，DeepSeek已經向外界澄清，自己做AI大模型跟金融無關，純純是對科技創新感興趣。更何況，以幻方最近的業績來看，AI量化助攻確實作用不大。

截至去年12月20日，幻方量化共有65只基金公開披露凈值，其中有29只基金年內漲幅超過10%，其余36只基金均在年內下跌。另外，據深藍財經，此前幻方旗下多只收益率達100%-400%的產品，到2024年后大多都降至10%左右。

曾經管理規模達到千億的幻方，如今已經降到200億-300億元規模。而放眼百億級私募業績整體，數據顯示，截至11月底，年內百億級私募旗下產品平均收益超17%。如此比較，幻方反而掉隊了。

不過，既然是“最牛大模型”，DeepSeek用不到炒股上，但還是很有“錢”途的。憑借技術創新得來“超絕性價比”，DeepSeek不愁市場地位。

據鳳凰網科技，目前最新的DeepSeek-V3的定價為輸入每百萬tokens 0.5元（緩存命中）/2元（緩存未命中）、輸出每百萬tokens 8元，性價比很高。據AI咨詢公司semianalysis測算，DeepSeek-V3的毛利率達到70%以上。

雖然DeepSeek對外公布還沒開始全面商業化，但其創始人梁文鋒向媒體透露，DeepSeek已經在成本之上開始盈利。

而另一邊，大廠們還得燒錢補貼價格戰，才能與之匹敵。據科技新知，2024年5月DeepSeek-V2發布前，國內大模型推理算力毛利率高于60%，和國際同行基本一致，但在5月接連降價后，毛利率直接跌至負數。

未來DeepSeek想做的，還是大模型產業的最上游。用梁文鋒的話說，“我們只負責基礎模型和前沿的創新，然后其它公司在DeepSeek的基礎上構建toB、toC的業務”。

即使不做“鐮刀”，但可以料想，DeepSeek足以在大模型界刮起腥風血雨。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.