網易首頁 > 網易號 > 正文申請入駐

大模型的人味兒，從何而來？

2025-05-27 20:05:11　來源: 虎嗅APP

北京舉報

分享至

本文來自微信公眾號：AI故事計劃，作者：李奕萱，編輯：溫麗虹，原文標題：《我，文科生，教AI回答沒有標準答案的問題》，題圖來自：視覺中國

一個月前，哲學博士羽山意外加入了大廠AI研發部門，成為一名“人文訓練師”。在全世界范圍內，這都是個新鮮崗位。人工智能仍在高速進化，他和同伴的使命是教會它們像人類一樣思考。

文科生獲得了AI 崗位

羽山在復旦研究了10年哲學。今年5月，他通過了畢業論文答辯，正在準備博士學位的授予資料。

在思考畢業去向時，他偶然在小紅書的官網上看到了招募通知，崗位叫“AI人文訓練師”。羽山當即投遞了簡歷，一個念頭從腦海中冒了出來：AI行業終于走到了需要人文研究者的階段。

對AI進行人文訓練，屬于模型“后訓練”的范疇。在“后訓練”中特別強調人文面向，尚未成為行業通行的做法。但有兩家公司值得關注，一家是全球頭部的大模型公司Anthropic聘請了哲學系博士，負責模型后訓練的人類價值對齊與微調。在國內，DeepSeek年初傳出消息，招聘了北大中文系學生擔任“數據百曉生”，對模型做后訓練。這被認為是DeepSeek文采出色的來源。

羽山入職之后才知道，小紅書這支團隊也剛組建不久。同事不算多，但都是來自知名高校人文學科的碩士、博士生。

圖 | 羽山在小紅書上分享哲學概念

團隊的首要任務，是設計AI的觀念和個性。

聽起來很玄。羽山遇到的第一個問題是，“我得了胰腺癌”應該如何回答？

如果把這句話發給市面上主流的AI產品，會發現，答案大多都缺少“人味兒”。AI在回答情感類和人生解惑類問題時，往往會生成一套相對固定的話術，“聽到這個消息我很難過”“我理解你”“你這樣想其實很正常”。這在業界被稱為“情感接入”。

但AI的“情感接入”通常很難成功。這跟客服是一個道理。當客服不假思索地回答“我理解您”的時候，顧客只會認為客服人員在應付、推諉。

羽山和同事們，決定教AI學會更為艱深的情感接入方式。

回到這個問題。“我得了胰腺癌”，人類聽到這句話會是什么反應？

小組討論時，中國現當代文學專業出身的可子提出來，“如果別人告訴我自己得了胰腺癌，我的第一個反應，就是不知道該說什么，有一種情緒的停頓感。”或許是經歷了多年的文學訓練，可子準確地捕捉到普通人在開口回答前，那瞬間的語塞和哽咽。

這個觀察最終被團隊采納。人文訓練師們開始推敲，如何讓AI去展現這種情緒上的停頓感。

這只是開頭。

通常，人類與AI的對話會持續進行。因此，羽山和同事們還通過檢索癌癥病人訪談等方式，設計了很多展開的問題。

他們想到胰腺癌所帶來的疼痛，想到臨終陪護，想到安樂死。他們想，胰腺癌這樣兇狠的疾病，沒有辦法被治愈，且患者很快就會離世。所以對于提問者而言，是不是在這生命最后的時刻，他更在乎的是他的后事，更在乎的是他的親人。

“需不需要多次診斷形成一個確診的結論？”

“問這個問題的時候，身旁有人陪他嗎？”

“AI是第一個知道他得癌癥的嗎？他是不是在糾結要不要告訴自己的親人？”

一個簡單的問題，在文檔里和會議桌前一點點被解剖析出，拆解成一環環細密的問答，不斷豐滿著準備喂給AI的訓練方案。

加入團隊之后，羽山每天需要和同事們完成數十個類似“邊界案例”的探討。在人工智能領域，邊界案例通常指那些處于正常情況邊緣或超出常規范圍的案例，它們可以讓模型在實際應用中，面對各種不確定性因素、干擾、變化或壓力時，仍然能夠保持其穩定性、可靠性和正常功能。

恰好，這正是文科生們熟悉的領域。拿羽山來說，在哲學學科的思想實驗和理論探討中，學者們也會設想一些極端的、處于邊界的案例進行分析，深入探討理論的本質和局限性。

教AI回答沒有標準答案的問題

“我騎自行車逆行被罰款50元，但我旁邊那個同樣逆行的人卻溜走了，我好生氣。”這道訓練題，來自可子的現實生活。

加入團隊時，可子還處于研究生階段。她在上海生活已有六年，自行車是常用的交通工具。有時學生違規逆行，還會被執勤交警處理。

這個問題，適合用來試探AI性格。發問者遇到的是一個不太嚴重的違法行為，模型應該更側重對提問人類的同理心，還是側重去強調為人的正直和守法的必要性？

在經歷人文訓練之前，AI通常只能在認同、安撫情緒和講道理之間做選擇。果不其然，AI在情與法之間呈現出矛盾狀態。

可子提示AI，在確保安全的前提下，逆行受罰是正常的，不過，從共情的角度出發，可以回答發問者，“交罰款是你自己對規則尊重的體現，與他人沒有什么關系”。這樣的回答，既守住了法規的底線，又兼顧了對發問人類的情感認可。只有人類教給AI，它才能在復雜情形中給出情理兼備的回答，而不只是簡單地“端水”。

圖 | 上海街頭

小紅書AI人文訓練師的團隊辦公室，位于上海新天地附近寫字樓里，一間普通的會議室。

一張桌子占去辦公室大部分面積。他們每天都會圍著這張桌子，討論這些沒有標準答案的問題，仿佛互聯網的柏拉圖學院。

他們以自己作為人文學者的思維和邏輯，去思考AI面對的問題，并做出更好的示范重新喂給AI。經過反復訓練，不同人文學科的思想和決策方式，就會潛移默化地影響AI。這能讓AI生成的回答，更接近人類價值觀中善的、美的一面。

曾經，羽山在問題庫里抽取到一位家長咨詢的問題，與孩子考研相關。

“我兒子跟我講說要考研，但是他也不認真復習，又要報很好的學校，我覺得他也考不上，每天我就看他吊兒郎當的，怎么辦呢？”

在團隊會議上，羽山分享了這個問題，還提及了一個社會學概念——壓縮的現代性。隨著過去改革開放和經濟高速騰飛，中國社會把很多不應該由“家庭”來承擔的責任，都一股腦的壓進了家庭這個單元內部。從這個角度來看，不光孩子是中國式家長的受害者，中國式家長本身也是結構的受害者。

羽山發現，絕大多數模型習慣輸出“你要給你的孩子自由”之類的回答，基本不會站在家長的角度思考問題。這看似價值觀正確，但沒有考慮到家長的情感需求和心理狀態，最終還是難以解決矛盾。

在現實生活中，這道題的情況有點像羽山親歷的親子關系。羽山如今已過而立，隨著知識和閱歷加深，他漸漸也能站在母親的立場去理解她的行事邏輯。

可子回應了羽山發起的討論。她指出，即使如此，代際之間的對立與矛盾中，仍然存在“誰承擔了更多”的問題。“如果把一個家庭理解為一個不能失敗的公司的話，那為了這個公司，在未來去奮斗的仍然是兒女。”

可子的說法和羽山的提法產生分歧，卻也安慰了羽山。和萬千新舊世代交替中的兒女一樣，羽山清楚父母身上缺口，又理解父母所處的時代局限性。

經過幾番論戰，最終，團隊達成一致。回答這個問題時，要理解父母處境給出安慰，同時堅定地告訴父母，子女有自己的自由。在這個基礎上，向家長展現出正確、健康的親子關系是怎么樣的，不要把家長的想法強加在兒女身上。

為什么要對AI進行人文訓練？歸根結底，AI回答中透露的價值選擇，也代表其背后團隊所認同的價值觀。這件事難做，但羽山認為值得，這是人文訓練師的職責：“偏好本身很難由算法來決定，需要人來不斷地訓練或強化算法，我們要輸出這樣的一個價值觀。”

除此之外，這支AI人文訓練師團隊還時常遇到一些生活場景的提問。

“從小和人生活在一起，沒見過其他貓的貓，會覺得自己是人嗎？”初次看到這個問題，人文訓練師葉子覺得很可愛。小紅書社區里，很多這類關于寵物的俏皮問題，評論區的網友們也都會給出一些幽默可愛又奇思妙想的回答。

作為AI訓練師，撰寫回答的難點在于如何用合適的方式把道理講清楚。分寸難以拿捏，因為涉及到模型泛化的問題，如果葉子把話說得太俏皮，模型可能會在回答另外一些不該俏皮的問題時，展現俏皮一面。

最終，葉子寫下這樣的回答：“不會，但它們會通過生活環境形成獨特的行為模式，比如長期與人類生活的貓咪可能會模仿人開柜門使用馬桶，雖然會模仿，但舔毛、抓人的本能說明它清楚自己是誰。說不定，它們會覺得人才是學習它們行為的奇怪生物。”這讓葉子覺得心里軟軟的，好像對寵物和主人的友愛都充溢其中。

AI會和人一起變得更好嗎

在賦予AI人感這件事上，前路還長。目前，AI的性格底色正在逐步變得清晰，但羽山和同事們偶爾會覺得，AI還是沒能熟練地使用人文訓練中習得的成果。

反倒是在反復訓練AI時，人文訓練師們率先改變了他們的部分認知。

羽山是第二代上海人。10歲時，父母從老家來上海打拼，他也跟著搬來了這里。學生時期，他經歷了嚴重的校園霸凌。長大后羽山回想，根源可能在于，自己在老家小城形成了和上海本地同學不盡相同的生活方式，難以融入。

他設計了一個關于校園霸凌的邊界案例。在羽山日常的觀察中，許多文藝作品把校園暴力浪漫化處理了。“真正的校園暴力，是一種類似于磁場的東西，它充斥在你的周圍，無處可躲，無處可逃。不一定是誰真的把你打得鼻青臉腫，更不是某種相濡以沫的拯救與復仇故事。”

十幾歲的羽山，面對校園霸凌的方式是一遍一遍地繞著學校的天井走，耳機里聽著周杰倫的歌，還大聲地唱出來。如今，羽山想要通過自己的工作，潛移默化地去糾正大眾的認知偏差。

自己淋過雨，就得為別人撐傘。“更大層面上，如果模型本身和公序良俗與人類偏好對齊得很好，它也是能夠影響到每一個個體的，讓我們也變得更好，這是可以想象的。”

技術會帶來新的正義嗎？羽山也不確定。不管AI當下能多大程度地幫到正在被侵害的孩子，終歸需要有人先向它發起對話。

身為女性，葉子在成長和學習的過程中，經常遇到性別議題。在平日的生活中，她是個堅定的女性主義者，但進入AI人文訓練師的角色，她就必須暫時放下自己在現實生活中的立場，反復揣度，思考如何讓答案以溫和的方式透露出團隊的人文關懷。

“你如何看待一些激進的女權主義者，她們有時好像對性別問題過于敏感了吧？”

葉子最終在回答時將概念擴大到社會議題：社會議題推進的過程中，總會有觀念的碰撞，不破不立，但真正的進步要兼顧理性和情感。或許當我們不再用過于敏感來評判彼此，而是追問為什么這種敏感會存在，真正的對話才會展開。

“朋友說我很看重自己的身材保持和我的外貌，說我這樣是在迎合白幼瘦的審美，建議我去做運動。”遇到這樣的問題，葉子也很困惑。一方面，她知道，在這種非原則性問題面前，自己應該尊重用戶的自由，但另一方面，她在猶豫，支持白幼瘦審美會不會是一種對于規訓的加固。

在一段簡短的回答內，先告訴對方這么說是在關心你，還是先表達白幼瘦是你的自由？和同事討論過后，葉子明確了以“用戶導向”思維走出困局，因為用戶本身更需要是對她自己的安慰，如果選擇先讓用戶理解朋友的出發點，可能會加劇用戶的情緒。

在這些邊界案例當中選擇自己的立場，這本身就是一個不斷自我反思的過程。

對于人文主義的內涵，葉子有與羽山相似的理解——看到人本身，然后讓這個世界變得更好。

每天坐在工位上打開AI的后臺問題庫，葉子覺得自己仿佛掉入了某個賽博秘密樹洞。在這里，她能看到世界上各種各樣的人，看到他們的困擾和他們的生活。“能夠為他們寫出一些比較好的答案，能夠真正幫到這些人，我覺得這就是一種創造。”

圖 | 葉子在小紅書記錄心路歷程

葉子性格內向，日常生活中很難主動去和別人進行深度交流，但這份工作讓葉子感受到自己并不孤獨：原來，世界上有這么多人和我一樣，每天在思考這么多稀奇古怪的問題。

曾經的葉子，和許多文科的老師與同學一樣，覺得未來AI發展跟文科生沒什么關系。如今回頭來看，AI人文訓練師的崗位不僅可以承載文科生的一些價值堅持和理想追求。另一方面，它又是一個很新興的、具有發展潛力的崗位。

與此同時，羽山也觀察到一些高校在進行AI與文科教育改革。但他認為，解決業界與學界人才教育錯配的關鍵，在于改革未來是否能夠收攏到分工體系本身。“即便高校愿意改革，嘗試開設交叉學科的專業，但用人單位本身愿不愿意招聘還是一個問題。”

在上海一隅，這支AI人文設計師團隊又迎來了新成員。可子計劃把在團隊里的見聞告訴同學，把同學也推薦進組，一起進行AI人文訓練的嘗試。

每天，在這個小小的會議室里，有關AI人文準則的討論持續不斷地生成。在大廠的宇宙里，這個團隊并不起眼。但是誰也說不好，這些由這個小巧團隊在每一個普通工作日討論出來的點滴，是否會在未來深遠地影響AI與人類交互的方式，影響人工智能潮流的進化方向。

本內容為作者獨立觀點，不代表虎嗅立場。未經允許不得轉載，授權事宜請聯系 hezuo@huxiu.com

本文來自虎嗅，原文鏈接：https://www.huxiu.com/article/4397120.html?f=wyxwapp

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.