新智元報道
編輯:編輯部
【新智元導(dǎo)讀】在字節(jié)當技術(shù)人,是怎樣一種體驗?有探索時的迷茫、掙扎甚至是自我懷疑,也有收獲成果后的興奮與成就感。在這里,他們不斷追求前沿,想為「世界折騰點東西出來」。
最近,字節(jié)跳動啟動了新一年的筋斗云人才計劃,共涵蓋大模型應(yīng)用、搜索/推薦/廣告、計算機體系結(jié)構(gòu)與系統(tǒng)優(yōu)化、安全/AI Safety、硬件、AI Coding、視頻架構(gòu)、AIGC等八大領(lǐng)域中的42個技術(shù)課題。
其實,在筋斗云計劃發(fā)起之前,就有一批優(yōu)秀的字節(jié)同學(xué)在這些課題中,追逐技術(shù)創(chuàng)新的「務(wù)實和浪漫」。
在他們之中,有的人想做那個「造錘子」的人,在探索中尋求長期價值,還有的人立志「把論文寫在大地上」,用技術(shù)為用戶帶來更豐富、更有價值的體驗……
但就像沖突是一個故事不可或缺的因素,他們也曾有過迷茫和掙扎:我是不是最開始就錯了?做不成怎么辦?要不然就算了……將這樣的念頭逐個掐滅,走過迷茫和掙扎,他們想要「為世界折騰點東西出來」。
這次,我們邀請到了三位筋斗云課題里的「技術(shù)博士」,以下是他們的故事:
沐春|Data-抖音算法工程師
做「造錘子」的那個人
2023年7月,從中國科學(xué)院博士畢業(yè)后,我放棄了幾家知名企業(yè)的頭部人才計劃Offer,加入了字節(jié)一個在當時相對較小的產(chǎn)品——汽水音樂。
在求職的當口,我最關(guān)注自己將來做的事是不是夠長期?是不是夠創(chuàng)新?敲釘子的事誰都能干,我想做那個造錘子的人。
字節(jié)滿足了我的期待。我了解到汽水音樂內(nèi)部也有很多長期課題,這對于一個以應(yīng)用為主的團隊來說非常難得。面試時Leader的一句話也很打動我,「你來了之后,不給你設(shè)方向限制。」
入職后我接手的第一個課題就非常長期和有獨創(chuàng)性——興趣時鐘。
如何建模時間關(guān)聯(lián)的用戶偏好是推薦系統(tǒng)中的一個經(jīng)典問題。過去行業(yè)普遍直接對時間進行小時編碼(hour embedding),再讓模型自己學(xué)習(xí)時間與用戶偏好的關(guān)系。這種方法在傳統(tǒng)天級訓(xùn)練的推薦系統(tǒng)中效果不錯,但并不適用現(xiàn)在的流式推薦系統(tǒng):同一時刻所有樣本的小時編碼相同,會導(dǎo)致模型無法學(xué)習(xí)其他的小時編碼,從而出現(xiàn)過擬合現(xiàn)象。
興趣時鐘的邏輯是直接對某一時間用戶的興趣偏好建模,本質(zhì)上是讓時間成為興趣的「觸發(fā)器」,在當前時間使用合適的用戶興趣偏好去預(yù)估,將最合適的、用戶最喜歡的內(nèi)容推薦給他們。
聽起來,邏輯的轉(zhuǎn)變似乎很簡單。但我認為衡量一個技術(shù)成功與否的標準從來都不是夠不夠復(fù)雜,一劍封喉,越簡單的技術(shù)越有效,也更容易被行業(yè)廣泛使用,從而為更多用戶提供更好的體驗。
興趣時鐘在汽水音樂上線后,將用戶的活躍天數(shù)提升了0.509%。后來,我們的論文被頂會SIGIR2024 Industry Track錄用,評委們也給出了積極的認可。
互聯(lián)網(wǎng)是一個0和1構(gòu)成的世界,技術(shù)也是如此,在拿到最終結(jié)果之前,無論過程有多長,我們會一直停留在「0」這個階段。
我印象很深刻,剛開始做興趣時鐘時,大家都很期待。但兩三個月后遲遲拿不到效果,也就沒人再問了。有那么一段時間,我經(jīng)常胡思亂想,「這么久都不出來,Leader和其他同學(xué)會不會對我有意見?」
之所以這么難,還是因為這是一件從0到1的事,沒什么前人的經(jīng)驗可以借鑒,所有事情都要重來,也踩過不少坑。舉個很小的例子,模型代碼取的是AOE時間,但存儲系統(tǒng)取的是UTC8時間。因為時間標準不同,導(dǎo)致最后的收益不及預(yù)期。
興趣時鐘的研發(fā)過程并沒有什么動人心魄的故事,無非就是遇到一個又一個小問題,一次又一次解決它們,直到最后走向成果落地。
2024年,我開始負責汽水音樂的推薦技術(shù)。在此期間,我也像曾經(jīng)的Leader一樣,提供一些思路上的指引,讓同學(xué)們?nèi)ジ阋恍╅L期課題。比如我們?nèi)ツ臧雅d趣時鐘升級成了長期興趣時鐘,提出了不對稱擴散模型等。
也是在管理團隊后,我突然發(fā)現(xiàn)自己當年想多了。有時候不問進展,并不代表不關(guān)心,而是不想給同學(xué)們太多壓力。我相信同學(xué)們,也深刻知道,這本來就是一件需要長期投入的事。
Rong|Data-基礎(chǔ)架構(gòu) 研發(fā)工程師
把論文寫在「大地上」
在清華讀博時,導(dǎo)師經(jīng)常鼓勵我們要重視技術(shù)的實踐落地。這點對我影響很大,2020年4月到字節(jié)實習(xí)后,更加深了我的理解。
博士期間我的研究方向就是數(shù)據(jù)庫和AI。寫論文時,我們通常會設(shè)置一個理想環(huán)境,并在理想條件下拿結(jié)果。但真實的工業(yè)環(huán)境更加復(fù)雜,工作不只停留在紙面上,而是要落到具體實踐中——當你做的東西解決了實際問題、產(chǎn)生了真正價值,論文和專利這些是水到渠成的事。
從2021年到今天,我職業(yè)生涯的第一次實習(xí)和第一份工作都在字節(jié)跳動的ByteBrain團隊。這四年中,激勵我一步步走過來的,正是一個又一個可觸碰的問題,以及解決問題后帶來的滿足感。
我在字節(jié)ByteBrain團隊的工作和博士期間的研究方向一脈相承,剛開始做AI for Infra,也就是用AI技術(shù)優(yōu)化數(shù)據(jù)庫等基礎(chǔ)設(shè)施,在節(jié)省成本的同時提升性能。隨著大模型的發(fā)展,我的工作也拓展到了Infra for AI領(lǐng)域,本質(zhì)上是為AI大模型的開發(fā)和落地提供基礎(chǔ)設(shè)施支持,從而加速開發(fā)流程、降低落地門檻。
正式入職后不久,ABase(字節(jié)跳動規(guī)模最大的首個自研NoSQL數(shù)據(jù)庫產(chǎn)品)團隊找到我們,提出要做數(shù)據(jù)庫的擴縮容,在用戶用量出現(xiàn)持續(xù)上漲和下跌時及時預(yù)警。對于算法側(cè)來說,常見的思路是在云引擎上線一個算法預(yù)測服務(wù),其他需求部門來調(diào)用算法API就好。但我們并沒有局限于此,而是從0到1把整套鏈路搭建了起來,涵蓋了數(shù)據(jù)采集、算法預(yù)測、擴縮容建議、消息預(yù)警、大盤展示等全流程。
說實話,這一定程度上超出了一個算法工程師的工作范疇。但我一直堅信要有長期視角,只要當下舍得沉下心來投入,就一定會收獲更多成果。
最后,功能上線后的結(jié)果也很不錯,在擴容上幫助ABase將緊急擴容工單的數(shù)量降低了60%左右,并在縮容上節(jié)省了3億左右的成本。后來,我們與ABase團隊在更多場景下展開了更深入的合作,雙方共創(chuàng)的論文也被今年的 SIGMOD 25(數(shù)據(jù)庫領(lǐng)域頂級會議)收錄。
類似的故事幾乎每天都在我的工作中發(fā)生。還記得最開始做「MySQL 虛擬索引 VIDEX 開源項目」時,我們的想法很簡單,只是覺得它對公司業(yè)務(wù)有用、對行業(yè)有用,值得開源,并沒想到最后會產(chǎn)生還不錯的影響力。
索引推薦是數(shù)據(jù)庫領(lǐng)域的一個經(jīng)典問題,如果沒有索引工具,僅依靠DBA(數(shù)據(jù)庫管理員)的經(jīng)驗來優(yōu)化索引會非常耗時耗力。隨著數(shù)據(jù)量級越來越大,在數(shù)據(jù)庫中插入一個真實索引的成本非常高,同時會帶來客戶隱私數(shù)據(jù)泄露的風險。虛擬索引便應(yīng)運而生,它可以實現(xiàn)虛擬環(huán)境中實現(xiàn)索引查詢,讓用戶可以按需調(diào)用。
MySQL雖然是當前業(yè)內(nèi)最主流的開源數(shù)據(jù)庫,但一直沒有成熟的虛擬索引工具。像Meta等公司都提到自己用了類似技術(shù),但沒有開源,沒人知道他們是怎么做的。
當我們自己上手時,卻發(fā)現(xiàn)就像打地鼠游戲那樣,很多未曾預(yù)料的問題總會層出不窮的冒出來,導(dǎo)致索引結(jié)果的準確率不高。怎么辦?只能埋頭去啃代碼,下了很多「笨功夫」。
比如結(jié)果不準時,我們會對比真實索引和虛擬索引的不同,并深入到代碼層尋找卡點??赡芫褪悄敲匆粌蓚€環(huán)境變量,但解決了它們,也就將很多環(huán)節(jié)的卡點都解決了。諸如此類的情況發(fā)生了幾十上百次,每一次我們都要去幾百萬行的系統(tǒng)代碼中定位到具體的某一行。
在那段時間,很多問題都面臨著挑戰(zhàn)。應(yīng)該說,痛并快樂著吧,我喜歡這種「長期專注一件事」的感覺。
VIDEX項目做成后,我們在公開測試集上的加速效果達到了理論基準(Ground Truth)下的90%以上,并且已經(jīng)在公司大規(guī)模上線,每天處理上千個RDS和MySQL的慢SQL優(yōu)化任務(wù)。目前,ByteBrain-VIDEX已經(jīng)被數(shù)據(jù)庫頂級會議VLDB2025DemoTrack接收。我們將VIDEX開源后,也引發(fā)了行業(yè)的關(guān)注與認可,并吸引了眾多海內(nèi)外研究者的討論與貢獻。
我覺得很多優(yōu)秀的字節(jié)同學(xué)都有一個基本特點:如果你認為一件事有價值,那就一定要把它做完、做好。說實話,我沒想過自己一定要成為業(yè)界最著名的專家或大牛,那太遠了。有目標就去干吧,短期做不成就多花一點時間,越努力越幸運,收獲一定在前方。
柘云|TikTok算法工程師
到「一線」去尋找答案
2021年的秋天,我在清華大學(xué)讀博四,到了該考慮職業(yè)發(fā)展的時候。
當時我的想法很明確:比起以發(fā)表論文為目標的純學(xué)術(shù)研究,我更希望自己的研究成果落到實處,為用戶帶來更豐富、更有價值的體驗。
博士畢業(yè)后,我加入TikTok推薦部門,成了一名算法工程師。在之后一年半的時間里,我都在做同一個長期課題——怎樣更好的建模用戶留存?
在此之前,無論是公司還是行業(yè),都做了不少探索。但從好到更好,還有很多事情要做。
當時行業(yè)中常見的方法是基于用戶畫像和點贊、評論等即時行為建模,并以此來預(yù)估他們的留存意愿。但這樣會導(dǎo)致推薦系有點「短視」,對用戶長期價值的關(guān)注不夠。
經(jīng)過與同事們不斷討論后,我們決定換一種視角——在關(guān)注用戶即時行為的同時,對用戶留存本身進行建模,并將其作為信號來指導(dǎo)推薦系統(tǒng)。事實上,這樣的思路并不是我們的原創(chuàng),而是在游戲和小說等領(lǐng)域得到了驗證,這也給了我們信心。
但在這樣一個對短視頻來說相對空白的領(lǐng)域,我們還是走了不少彎路,失敗也緊隨而至。
一開始,我們參考了前人的經(jīng)驗,采用注意力機制讓模型自己去做「用戶行為歸因」,也就是具體找到是哪條視頻、用戶的那一類行為導(dǎo)致了用戶留存。但嘗試了一段時間,發(fā)現(xiàn)并不能拿到滿意的結(jié)果。
原因很簡單,看小說和玩游戲相對容易歸因,但在短視頻領(lǐng)域,影響用戶留存的因素很多、也很復(fù)雜,即時的、長期的,主動的、被動的,甚至是隨機的……它們就像是一堆雜亂無章的「線團」,模型很難做到抽絲剝繭,找到真正有用的「線頭」。
前人的路走不通,那就自己趟一條路出來。團隊經(jīng)過復(fù)盤后,我們想到,既然在海量視頻和行為中難以精準歸因,不如換一種「聚合視角」,在用戶的累積行為中去尋找答案。
舉個簡單的例子,有用戶在某一天看了5小時、評論了一次,第二天就不來了;一段時間后,同樣的用戶看了1小時、評論了10次,第二天又回來了。顯然在這種情況下,真正影響用戶留存的因素并非時長,而是評論互動。我們要推薦給用戶的,也應(yīng)該是高互動性內(nèi)容。
現(xiàn)在回憶起來,那是一段非常難忘、有趣的經(jīng)歷。我們在一次次討論、一次次復(fù)盤、一次次A/B Test中不停轉(zhuǎn)換視角、尋找答案。對我來說,這也是一件很有成就感的事:我們開發(fā)的「歸因模型」不僅為用戶活躍度帶來了不錯的提升,也為公司其他業(yè)務(wù)部門帶來了不錯的借鑒和增益。
在那一年半里,我自己的角色也不僅僅是算法工程師,而是帶著產(chǎn)品和運營的視角工作。這也正是字節(jié)最吸引我的地方:這里不設(shè)邊界,不會把人綁定在某一個業(yè)務(wù)或產(chǎn)品上。你可以用自己的「工具箱」做很多嘗試,公司那么多產(chǎn)品,都能成為發(fā)揮能力的舞臺。
2024年,我轉(zhuǎn)到了TikTok用戶增長方向,主要關(guān)注日韓、歐洲等市場。從原來著眼全球的「廣度」到如今聚焦當?shù)氐摹干疃取?,對我而言,這又是一次重大的視角轉(zhuǎn)變。
作為算法工程師,我經(jīng)常會和部門其他同學(xué)到一線做用戶的實地調(diào)研,有時候甚至?xí)ヒ恍┢h的小城和小鎮(zhèn)。我經(jīng)常跟朋友開玩笑說:你很難想象一位算法工程師會走上街頭給用戶「發(fā)傳單」吧,我們這么干了!
但那是一種非常新奇的體驗,你會見到不同的真實的人、會深入觀察到不同文化,在交流和碰撞中,會打破你固有的認知,進而產(chǎn)生全新的技術(shù)想法。
還記得之前在德國問一位用戶對TikTok的使用情況,他把手機屏幕使用時間給我們看,我驚訝的發(fā)現(xiàn)他一天中大部分時間都在瀏覽新聞,手機對他來說更像是一種工具而不是娛樂載體。這種驚訝在后來的大規(guī)模街訪也得到了驗證——相比我們的既有認知,德國人花在線上的時間確實要少得多。
每個國家和地區(qū)都有自身獨有的屬性。這也意味著,原本通用的技術(shù)思路在本地市場并不適用,而是要在用戶增長和留存等方面進行大量的本土化適配——這正是我們正在努力的事,經(jīng)過一段時間的探索,我們也成功將某個市場的新用戶活躍度提升了1.5%左右。
在TikTok這樣一個全球化的產(chǎn)品,我們每天都在探索新奇。可能很小的一次技術(shù)迭代,都會對用戶的服務(wù)體驗帶來很大改變。這是一件很有成就感的事,但也提醒我們要時刻保持一顆敬畏之心。
我經(jīng)常會想:能夠通過自己的技術(shù)為用戶的服務(wù)體驗貢獻力量,這真的是一件激動人心的事。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.