文 | 八尺八尋,作者 | 八尺,編輯 | 培培01
天才的標簽之外楊植麟還是個資深文青。90后一代或多或少都曾迷戀過村上春樹,1992年出生的楊植麟也不例外。在村上春樹的一本小說中,楊植麟對一個程序員深夜寫代碼這件事印象深刻,并充滿憧憬,這為他未來進入AI領域埋下伏筆。
高中和大學時期他熱愛搖滾,最喜歡的樂隊是平克弗洛伊德。在清華讀書期間,他創(chuàng)立了搖滾樂隊Splay,曾晉級清華大學校園歌手大賽原創(chuàng)決賽。清華向來有音樂傳統(tǒng),除了走出過高曉松和水木年華,楊植麟那位大名鼎鼎的學弟姚順雨(任職于OpenAI),本科時創(chuàng)立了清華大學說唱社。
玩搖滾和說唱屬于理科生的叛逆和浪漫。90后一代人的迷茫在于,這個時代留給他們的紅利并不多,音樂恰好能宣泄這種憤懣的情緒。楊植麟的樂隊創(chuàng)作過一首歌,講述有關(guān)“做了一個創(chuàng)業(yè)成功一夜暴富的白日夢”。對追求理想和獲得金錢總是搖擺不定,正是青春期普遍的狀態(tài),渴望一夜暴富或許是抵擋理想主義破滅的有效手段。
從時間坐標上來看,其實90后趕上過移動互聯(lián)網(wǎng)紅利期的尾巴。戴威是只比楊植麟大一歲的清華校友,2015年戴威的ofo共享單車正式上線,并在全球首創(chuàng)“無樁單車共享”模式,成為當之無愧的創(chuàng)業(yè)明星。ofo最后的結(jié)局我們都知道,戴威欠用戶人均199元(總額達15 億),后來奔向美國繼續(xù)創(chuàng)業(yè)。
移動互聯(lián)網(wǎng)的黃金時代是屬于70后、80后創(chuàng)業(yè)者的,以王興、程維、張一鳴、黃崢為代表,頭部市場格局已趨近固化。90后一代創(chuàng)業(yè)者,拔劍四顧心茫然,很難找到真正的機會,需要等待下一個產(chǎn)業(yè)變革窗口期的到來。
移動互聯(lián)網(wǎng)的黃金時期進入尾聲后,那些年媒體和科技圈無不認為區(qū)塊鏈會是下一個風口。這個過程北大的孫宇晨(90年人)從幣圈靠割韭菜殺了出來,人送外號“孫割”,最后同樣跑到美國,目前他是特朗普幣(TRUMP 幣)的最大持有者,被稱為特朗普的榜一大哥。
他走的是一條邪路,也是一條置之死地而后生的不歸路。很多人說何同學是5G的唯一受益者,這話對應到孫宇晨身上也沒錯,他幾乎是區(qū)塊鏈的最大受益者。
互聯(lián)網(wǎng)的風口來來往往,短暫又輝煌。歷經(jīng)了區(qū)塊鏈、元宇宙、5g的浪潮,現(xiàn)在終于來到了AI2.0時代,標志性事件是2022年11月30日OpenAI推出ChatGPT。馬化騰在ChatGPT問世后,將AI比做“幾百年不遇、類似發(fā)明電的工業(yè)革命一樣的機遇”,往后幾年無數(shù)人開始摩拳擦掌,試圖在AI2.0時代搶占先機。
很多人難以理解,近三年為什么有人對AI懷著近乎狂熱的追求,乃至把AI當成某種信仰。就90后群體來說,我很認同一位AI博主給出的答案:“我們90后似乎從未真正分到過時代紅利,如果AI不是我們的答案,那什么才是這個時代給我們的機會?”
許知遠有本書叫《時代的稻草人》,把“稻草人”這個概念用來形容90后一代,可以如此歸納:稻草人的現(xiàn)實困境在于它既屬于自由的田野,又懸浮在半空,永遠無法真正扎根。如今他們等來的AI,一塊看似能夠讓他們真正扎根的全新土壤。
文藝青年楊植麟后來走上計算機學術(shù)道路,那時他似乎并沒意識到自己能在AI領域取得多大成就。
當戴威在共享單車領域興風作浪時,楊植麟赴美國卡耐基梅隆大學攻讀博士學位,師從蘋果AI負責人Ruslan Salakhutdinov和谷歌首席科學家William Cohen。博士期間,他作為第一作者發(fā)表了兩篇里程碑式論文:Transformer-XL(突破固定上下文長度的語言模型)、XLNet(提出廣義自回歸預訓練框架)。
這兩篇論文在AI領域影響深遠,引用量超22000次,研究成果被Google PaLM、Meta LLaMA 等主流產(chǎn)品采用,也成為他通向AI2.0時代的門票。
OpenAI推出ChatGPT后,在循環(huán)智能干了六年的楊植麟內(nèi)心充滿復雜的情緒,“有點激動,有點焦慮,有點FOMO(害怕錯過),又很興奮。”幾個月后他創(chuàng)立月之暗面,主攻AGI(通用人工智能)領域。
月之暗面這個名字來源平克弗洛伊德的專輯名《The Dark Side of the Moon》,楊植麟把會議室也全部用搖滾樂隊命名,公司里還放著兩把電吉他,一架鋼琴。可見文青的一面確確實實刻進骨子里。
梁文鋒憑借DeepSeek出圈前,楊植麟是最被看好的AI創(chuàng)業(yè)者,業(yè)界評價他——是堅定的AGI信徒和有技術(shù)號召力的創(chuàng)始人,無論是在學界還是商界都地位頗高。據(jù)傳,2023年三四月份,字節(jié)的張一鳴頻繁約人補AI課,這些人當中就有楊植麟。
他是頂尖計算機專家,又有六年的人工智能創(chuàng)業(yè)經(jīng)驗,這催生出一個技術(shù)理想主義者的野心。“AI不是我在接下來一兩年找到什么PMF(產(chǎn)品市場匹配),而是接下來十到二十年如何改變世界。”去年與媒體人張小珺對話時他說「1」。
改變世界談何容易,放眼全球敢說自己能改變世界的人,似乎只有馬斯克和特朗普。
張小珺為他的表達捏一把冷汗,認為他的思考顯得抽象且具有理想主義,擔心他難以在現(xiàn)實主義的中國找到生存空間。媒體人天生的悲觀顯然不會影響到一個看到時代機遇的創(chuàng)業(yè)者。悲觀者或許正確,但唯獨樂觀者能夠前行,文藝青年時期的他也許是悲觀的,如今作為創(chuàng)業(yè)者他必須前行。
02
梁文鋒和DeepSeek出圈,讓紅極一時的月之暗面迅速黯淡下去,楊植麟前行的道路受阻。同為廣東人,兩人的命運在幾天內(nèi)就出現(xiàn)了明顯的分野。
月之暗面成立于2023年4月,DeepSeek成立于這年7月,起步時間相差無幾。相比85后梁文鋒,楊植麟更年輕,計算機學術(shù)成就也更大。研發(fā)大模型之前,梁文鋒作為幻方量化的創(chuàng)始人,主導公司的AI技術(shù)研發(fā)與戰(zhàn)略方向,楊植麟也在人工智能行業(yè)有多年經(jīng)驗。
之前我寫過清華姚班的天才為什么沒能成為AI時代的主角(清華姚班的天才們,為何成為AI時代的失意者),最終歸因于姚班人對技術(shù)的路徑依賴,商業(yè)能力稍弱。如今想想這個歸因的確過分單一,楊植麟30歲之后創(chuàng)立的月之暗面,無論技術(shù)還是商業(yè)經(jīng)驗都相對豐富,最后卻沒能取得DeepSeek的成績,當中一定有更復雜的原因。
憑借過硬的學術(shù)能力,楊植麟在AI領域找到生存空間問題不大。月之暗面創(chuàng)立之初就獲得2億美元的融資,來自紅杉中國和真格基金。第二年,又接受了美團、阿里、騰訊、小紅書等互聯(lián)網(wǎng)企業(yè)的戰(zhàn)投。
創(chuàng)業(yè)拿投資是再正常不過的事,問題是怎么拿,拿多少,還是完全不拿。張一鳴創(chuàng)辦今日頭條之初,一再強調(diào)今日頭條是非主流,要保持非主流的獨立存在,不希望被迫站隊(當時的BAT大廠)。原因很簡單,一旦站隊就會樹敵且容易引發(fā)輿論。
去年4月多家媒體報道,楊植麟在月之暗面完成阿里領投的10億美元融資后,通過老股交易套現(xiàn)數(shù)千萬美元,金額據(jù)傳達4000萬美元。雖然月之暗面回應消息不實,陷入輿論漩渦也會影響公司的注意力。
2024 年初,與楊植麟之前的公司循環(huán)智能股東(包括金沙江創(chuàng)投)之間的股權(quán)糾紛,也讓他焦頭爛額。該糾紛的核心在于月之暗面成立時,未能明確月之暗面與循環(huán)智能的人員股權(quán)和產(chǎn)權(quán)歸屬。循環(huán)智能及其投資方認為月之暗面使用了前公司的資源,并因此提起仲裁訴訟,要求獲得月之暗面的股份「2」。
這也引發(fā)了外界對楊植麟處理合作關(guān)系和資產(chǎn)剝離能力的質(zhì)疑,不管怎樣,對初創(chuàng)公司來說無疑一種極大的消耗。
楊植麟所謂十年二十年改變世界只是一種理想,隨著巨頭的發(fā)力,AI創(chuàng)業(yè)的窗口期一定會非常短,往往在三兩年大概就能定下格局,真正的機會只能靠極短的時間去爭取。整個2024年,月之暗面被這兩件事牽扯,難免會影響公司在技術(shù)研發(fā)上投入的時間和精力。
當年12月6日,楊植麟還發(fā)布1300字的長文回應金沙江創(chuàng)投合伙人朱嘯虎。如果知道基座大模型一個月后即將迎來“deepshock”,敘事走向可能會完全不同。
相比之下,DeepSeek出圈以前一直保持一種非主流的狀態(tài),拒絕外來投資,以免被干擾,這為他們騰出時間悶聲鉆研技術(shù),可以心無旁騖地在技術(shù)深水區(qū)里下猛料。而且梁文鋒對公司掌握著絕對的控制權(quán),他通過多層有限合伙嵌套,以1%的直接持股和間接持股控制杭州深度求索84.3%的股權(quán),避免了股權(quán)分散造成的影響。
技術(shù)尚未形成護城河前,去年楊植麟還把很大精力放在了投流上。僅2024年3月至8月,Kimi的廣告投放金額就高達1.4億元,單月最高投放近5000萬元。也見到了成效,Kimi的月活在短短半年內(nèi)從400萬飆升至1282萬「3」,穩(wěn)居行業(yè)第二,僅次于百度文小言。
Kimi如此大規(guī)模投流并非完全是為了搶占市場。按照楊植麟的說法,投流實際上是為了獲取數(shù)據(jù)和擴大數(shù)據(jù)樣本,如何在收集數(shù)據(jù)基礎上去篩選數(shù)據(jù)、運用數(shù)據(jù),才最終決定了Kimi們能生長成為什么樣的AI助手。
通過用戶擴大數(shù)據(jù)來源,這一邏輯源于大模型對高質(zhì)量、精準反饋數(shù)據(jù)的依賴性,用戶在使用過程中產(chǎn)生的交互數(shù)據(jù),能夠反向優(yōu)化模型的推理能力和場景適應性。
楊植麟認為,大模型訓練要遵循Scaling law(縮放定律/規(guī)模定律)的第一性原理。Scaling law是指,隨著模型規(guī)模(參數(shù)數(shù)量)、訓練數(shù)據(jù)量、計算資源因素的增加,模型性能通常會按照某種可預測的規(guī)律提升。這幾乎是當時行業(yè)內(nèi)的共識,大家都知道的事情,也意味著在用這個方法卷模型性能并不新鮮。
2024年Kimi大規(guī)模投流并獲得一定量的用戶留存后,產(chǎn)品形態(tài)卻未實現(xiàn)重大迭代,僅個別功能更新。
Kimi團隊規(guī)模始終在兩百人以內(nèi),與動輒數(shù)千人的大廠研發(fā)部門相比,其技術(shù)迭代速度明顯滯后。更致命的是核心人才的流失,2024年下半年,多名算法工程師離職。楊植麟給的解釋是沒有人才流失,而是主動做了業(yè)務減法,不希望團隊擴大,認為這對創(chuàng)新有致命性傷害。
楊植麟與梁文鋒的競賽進入沖刺階段,是在去年9月。當時OpenAI正式推出了o1系列的兩款模型o1-preview 預覽版和o1-mini 迷你版,o1-preview 成為全球首款推理模型,它定義了現(xiàn)代AI推理模型的核心特征,如長思維鏈和強化學習訓練。這意味著此后大模型公司,必然都會沿著這個思路推出自己的推理模型。
這場競賽的結(jié)果是,今年1月20號DeepSeek R1 和Kimi1.5 兩個推理模型同一天發(fā)布。取得的反響完全不同,DeepSeek R1震驚全球,完全掩蓋了Kimi1.5的風頭。小步慢跑的Kimi,輸給憋出大招的DeepSeek。
論成敗多少會顯得刻薄,這里只分析技術(shù)問題。楊植麟似乎進入一個誤區(qū),DeepSeek R1的技術(shù)路線,證明楊植麟堅信的“Scaling law”這個模型訓練的第一性原理,并非唯一。
圖靈獎得主楊立昆曾說,從突破性創(chuàng)新角度來看DeepSeek并不出色,但是在低成本、開源、多個任務上的推理性能表現(xiàn)很不錯。
DeepSeek的轟動性幾乎超出了所有業(yè)內(nèi)人的預期,甚至楊植麟也不例外。在DeepSeek R1發(fā)布同日,楊植麟也推出首個通用推理模型K1.5,但也沒能預料到大模型格局會就此改變。
因為不開源、以及更注重通用推理能力和多模態(tài),在chat 特定推理任務上的表現(xiàn)力不如DeepSeek,Kimi的模型性能完全被單模態(tài)的DeepSeek R1光環(huán)遮蓋。也因此有了大模型“六小虎”終章的說法。
DeepSeek上線一個月,圈粉上億(下載量)。梁文峰的技術(shù)路線也證明,楊植麟通過大規(guī)模投流爭奪用戶,對提升模型能力來說收效甚微。
03
這場競爭是技術(shù)理想主義與商業(yè)現(xiàn)實主義的較量。
楊植麟的理想主義,是希望探究有效的產(chǎn)生智能的方法,探索智能的上限,最終實現(xiàn)AGI。現(xiàn)實是,通往AGI的這條征途上會非常漫長,也需要從基礎設施到技術(shù)上的范式轉(zhuǎn)變。
如果過度專注AGI,不僅可能會造成產(chǎn)品迭代緩慢,也可能因為缺乏成功的商業(yè)化應用,無人愿意為其理想主義買單。
曠視科技的創(chuàng)始人印奇是楊植麟的清華學長,在跨越AI的兩個時代后,他從純粹的技術(shù)信仰者轉(zhuǎn)身開始思考商業(yè)閉環(huán)。印奇在與《晚點》對話時坦言,技術(shù)和科研無法獨立長久存在,必須與客戶價值和商業(yè)模式相連接,沒有人會永遠為“信仰”買單,閉環(huán)才是可持續(xù)創(chuàng)新的前提。「4」
張小珺那句:擔心他(楊植麟)在現(xiàn)實主義的中國難以找到生存空間。像是一個預言。楊植麟的技術(shù)理想與商業(yè)化落地之間,有一條寬闊的鴻溝。這條鴻溝正是所謂的現(xiàn)實主義。
最初Kimi通過提供基礎功能的免費服務吸引用戶,例如長文本處理、代碼編寫、聯(lián)網(wǎng)搜索等,滿足大多數(shù)用戶的日常需求。去年5月開始,Kimi針對用戶在基礎功能之外的需求(如更高性能、優(yōu)先使用權(quán)等)推出付費版本,例如高峰期優(yōu)先使用權(quán),用戶可通過打賞獲得高峰時段的優(yōu)先使用權(quán)限。本質(zhì)上這是對ChatGPT付費模式的一種變形。
現(xiàn)實主義中國的情況是,人們普遍沒有付費訂閱的習慣,想賺C端的錢注定難如登天。
去年7月Kimi上線了瀏覽器插件,試圖通過豐富應用場景,進而探索潛在的商業(yè)化機會。8月Kimi發(fā)布了企業(yè)級API,主要面向具有一定規(guī)模化業(yè)務的企業(yè),為對穩(wěn)定性要求更高的大企業(yè)客戶提供API服務。這是Kimi從專注ToC應用變?yōu)橥瑫r兼顧ToB業(yè)務的一個關(guān)鍵信號。問題是技術(shù)沒有形成壁壘,這些商業(yè)試探的效率也不會高。
相比之下,DeepSeek的商業(yè)化路徑極為清晰,以技術(shù)開源與低價策略為核心,精準卡位B端市場。DeepSeek開源策略并非單純技術(shù)輸出,而是通過開放部分代碼吸引開發(fā)者,同時保留核心算法的封閉性,形成“開源引流 - 定制收費"的商業(yè)模式。
這種模式不僅降低了市場推廣成本,還通過與云廠商深度綁定,如阿里云、騰訊云、華為云等將DeepSeek模型集成至其AI平臺,提供 SaaS 化服務。DeepSeek的API調(diào)用價格僅為行業(yè)均值1/5的低價策略,這讓它快速占領市場份額。
同為廣東人的梁文鋒,在公開場合中被塑造成技術(shù)理想派,但實際上,他也是典型的商業(yè)實用主義者。他深諳AI產(chǎn)業(yè)的法則,通過壓縮成本、開源引流、生態(tài)協(xié)同等策略,快速構(gòu)建商業(yè)閉環(huán),在金融、游戲等領域?qū)崿F(xiàn)規(guī)模化落地。
這一切都是建立在技術(shù)領先的基礎上,AI創(chuàng)業(yè)者失去用戶會失去市場,但失去技術(shù)很可能失去一切。去年7月,梁文鋒與《暗涌Waves》溝通時,提到最多的兩個字就是——創(chuàng)新。
朱嘯虎曾說:“AI創(chuàng)業(yè)者要勇于承認自己沒有壁壘,有任何技術(shù)壁壘都是騙人的,就是靠底層模型提供能力,但可以更懂用戶,更懂產(chǎn)品,可以在非AI的能力上建立壁壘。”這套說辭在移動互聯(lián)網(wǎng)時期或許正確,AI時代模型能力不行再怎么懂用戶也不行。
DeepSeek火爆以來,Kimi的月活用戶隨之流失,從去年11月的3600萬腰斬到今年3月的1820萬,被DeepSeek(1.87億)、豆包(9980萬)和騰訊元寶(2358萬)甩在身后。面對頹勢楊植麟并非毫無動作,宣布與財新傳媒合作,試圖通過垂直領域內(nèi)容增強公信力,又自建內(nèi)容社區(qū),在小紅里開對話框。在模型性能沒有很大提升的情況,這些措施看上去已經(jīng)擁抱商業(yè),但目前來看尚未見效。
回過頭來看,85后梁文鋒用技術(shù)和商業(yè)的完美結(jié)合,給90后文藝青年楊植麟上了一堂現(xiàn)實主義課程。作為頂尖名校出身,與圖靈獎獲得者合發(fā)論文,楊植麟的學術(shù)背景優(yōu)于梁文鋒。但他的技術(shù)理想主義把自己推向云端,在月亮和六便士之間,他選擇了月亮的暗面。
再從代際上看,梁文鋒只比張一鳴小兩歲,他們才是同一代人,梁文鋒的成就也是80后創(chuàng)業(yè)成功的典范。兩年前他說的那句:“務必要瘋狂地懷抱雄心,且還要瘋狂地真誠。”似乎最能代表他的創(chuàng)業(yè)理念。
單從商業(yè)模式的成功來衡量,上個互聯(lián)網(wǎng)風口80后最突出的商業(yè)人物分別是字節(jié)的張一鳴和拼多多的黃崢,兩人的理念完全不同。張一鳴的理念是敢為天下先,愛拼才會贏,最終締造出抖音帝國。黃崢受教于段永平,胸無大志,敢為天下后,同樣把拼多多做到了萬億市值(人民幣)。
成功并非只有一條路徑,他們都用自己獨特的商業(yè)理念開創(chuàng)一條嶄新的商業(yè)模式。
相比之下,目前來看90后一代,被商業(yè)磨礪的時間尚短,不足以摸索出一套適合自身的商業(yè)打法。至今還沒出現(xiàn)一個具有開創(chuàng)性的商業(yè)領袖。如果AI真的是這一代人的答案,至少,幾個月前楊植麟曾是那個最接近成為新一代商業(yè)領袖的人。
DeepSeek火爆也激發(fā)出大廠的勝負欲,近兩個月,百度、字節(jié)、阿里、騰訊頻繁迭代模型,進入5月,微軟開發(fā)者大會用50個新產(chǎn)品全面押注Agent,Google I/O 2025開發(fā)者大會宣布,全面重塑AI生態(tài)。巨頭們競爭白熱化,或讓Kimi以及其他六小龍這類中等規(guī)模AI公司直接面臨更復雜的生存問題。
六小龍中最早掉隊的零一萬物創(chuàng)始人李開復,3月曾直接回應,中國市場最終可能只有三家能夠真正站穩(wěn)腳跟的大模型提供商,分別是DeepSeek、阿里巴巴和字節(jié)跳動。
強者吞掉弱者一直都是商業(yè)的主流敘事,殘酷而無趣,人們反而更喜歡以弱勝強的商業(yè)敘事。事實上這樣的故事也并不罕見。
20世紀80年代,全球計算機巨頭IBM主導企業(yè)級市場,而蘋果電腦只是個初創(chuàng)公司,后來喬布斯提出個人電腦的概念,如今誰人不識MacBook。特斯拉之前,豐田、通用等傳統(tǒng)車企占據(jù)全球汽車市場90%以上份額,馬斯克跳過燃油車存量市場,用電動車和智能駕駛建立技術(shù)壁壘,市值一度超過全球九大傳統(tǒng)車企總和。
盡管巨頭壓制,又被DeepSeek反超,月之暗面并非全無機會。作為同一代人,也作為一個商業(yè)觀察者,很希望他能在第一輪的競逐失敗賽中逆勢成長,開創(chuàng)出獨屬自己的道路。
最近和很多大模型領域的研究人員聊,很多人認為現(xiàn)在的大模型transform架構(gòu)仍然存在幻覺等難以回避的問題,未來可能會有新的架構(gòu),顛覆現(xiàn)有的能力。這意味著,屬于楊植麟和90后AI創(chuàng)業(yè)者的機會依然存在,AI依然是90一代人的答案。
也許楊植麟的底色仍是那個文藝青年。他喜歡的專輯《The Dark Side of the Moon》里的第一首歌是《Speek To Me》,最后想把這首歌中一段十分應景的歌詞送給他:不要坐下,挖到另一個的時間到了,存在的越久,飛得越高,只有駕馭那浪潮的時候,才能在巨浪中取得平衡。
參考資料:
- 【1】對話月之暗面楊植麟:向延綿而未知的雪山前進,張小珺
- 【2】Kimi楊植麟仲裁案水下故事全揭秘,暗涌
- 【3】移動營銷平臺AppGrowing數(shù)據(jù)
- 【4】晚點對話印奇:AI1.0的教訓是,所有不能閉環(huán)的輝煌都是暫時的
- 【5】對話幻方梁文鋒:AI界的拼多多——揭秘DeepSeek! 暗涌
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.