本文來自微信公眾號:AI故事計劃,作者:李奕萱,編輯:溫麗虹,原文標題:《我,文科生,教AI回答沒有標準答案的問題》,題圖來自:視覺中國
一個月前,哲學博士羽山意外加入了大廠AI研發部門,成為一名“人文訓練師”。在全世界范圍內,這都是個新鮮崗位。人工智能仍在高速進化,他和同伴的使命是教會它們像人類一樣思考。
文科生獲得了AI 崗位
羽山在復旦研究了10年哲學。今年5月,他通過了畢業論文答辯,正在準備博士學位的授予資料。
在思考畢業去向時,他偶然在小紅書的官網上看到了招募通知,崗位叫“AI人文訓練師”。羽山當即投遞了簡歷,一個念頭從腦海中冒了出來:AI行業終于走到了需要人文研究者的階段。
對AI進行人文訓練,屬于模型“后訓練”的范疇。在“后訓練”中特別強調人文面向,尚未成為行業通行的做法。但有兩家公司值得關注,一家是全球頭部的大模型公司Anthropic聘請了哲學系博士,負責模型后訓練的人類價值對齊與微調。在國內,DeepSeek年初傳出消息,招聘了北大中文系學生擔任“數據百曉生”,對模型做后訓練。這被認為是DeepSeek文采出色的來源。
羽山入職之后才知道,小紅書這支團隊也剛組建不久。同事不算多,但都是來自知名高校人文學科的碩士、博士生。
圖 | 羽山在小紅書上分享哲學概念
團隊的首要任務,是設計AI的觀念和個性。
聽起來很玄。羽山遇到的第一個問題是,“我得了胰腺癌”應該如何回答?
如果把這句話發給市面上主流的AI產品,會發現,答案大多都缺少“人味兒”。AI在回答情感類和人生解惑類問題時,往往會生成一套相對固定的話術,“聽到這個消息我很難過”“我理解你”“你這樣想其實很正常”。這在業界被稱為“情感接入”。
但AI的“情感接入”通常很難成功。這跟客服是一個道理。當客服不假思索地回答“我理解您”的時候,顧客只會認為客服人員在應付、推諉。
羽山和同事們,決定教AI學會更為艱深的情感接入方式。
回到這個問題。“我得了胰腺癌”,人類聽到這句話會是什么反應?
小組討論時,中國現當代文學專業出身的可子提出來,“如果別人告訴我自己得了胰腺癌,我的第一個反應,就是不知道該說什么,有一種情緒的停頓感。”或許是經歷了多年的文學訓練,可子準確地捕捉到普通人在開口回答前,那瞬間的語塞和哽咽。
這個觀察最終被團隊采納。人文訓練師們開始推敲,如何讓AI去展現這種情緒上的停頓感。
這只是開頭。
通常,人類與AI的對話會持續進行。因此,羽山和同事們還通過檢索癌癥病人訪談等方式,設計了很多展開的問題。
他們想到胰腺癌所帶來的疼痛,想到臨終陪護,想到安樂死。他們想,胰腺癌這樣兇狠的疾病,沒有辦法被治愈,且患者很快就會離世。所以對于提問者而言,是不是在這生命最后的時刻,他更在乎的是他的后事,更在乎的是他的親人。
“需不需要多次診斷形成一個確診的結論?”
“問這個問題的時候,身旁有人陪他嗎?”
“AI是第一個知道他得癌癥的嗎?他是不是在糾結要不要告訴自己的親人?”
一個簡單的問題,在文檔里和會議桌前一點點被解剖析出,拆解成一環環細密的問答,不斷豐滿著準備喂給AI的訓練方案。
加入團隊之后,羽山每天需要和同事們完成數十個類似“邊界案例”的探討。在人工智能領域,邊界案例通常指那些處于正常情況邊緣或超出常規范圍的案例,它們可以讓模型在實際應用中,面對各種不確定性因素、干擾、變化或壓力時,仍然能夠保持其穩定性、可靠性和正常功能。
恰好,這正是文科生們熟悉的領域。拿羽山來說,在哲學學科的思想實驗和理論探討中,學者們也會設想一些極端的、處于邊界的案例進行分析,深入探討理論的本質和局限性。
教AI回答沒有標準答案的問題
“我騎自行車逆行被罰款50元,但我旁邊那個同樣逆行的人卻溜走了,我好生氣。”這道訓練題,來自可子的現實生活。
加入團隊時,可子還處于研究生階段。她在上海生活已有六年,自行車是常用的交通工具。有時學生違規逆行,還會被執勤交警處理。
這個問題,適合用來試探AI性格。發問者遇到的是一個不太嚴重的違法行為,模型應該更側重對提問人類的同理心,還是側重去強調為人的正直和守法的必要性?
在經歷人文訓練之前,AI通常只能在認同、安撫情緒和講道理之間做選擇。果不其然,AI在情與法之間呈現出矛盾狀態。
可子提示AI,在確保安全的前提下,逆行受罰是正常的,不過,從共情的角度出發,可以回答發問者,“交罰款是你自己對規則尊重的體現,與他人沒有什么關系”。這樣的回答,既守住了法規的底線,又兼顧了對發問人類的情感認可。只有人類教給AI,它才能在復雜情形中給出情理兼備的回答,而不只是簡單地“端水”。
圖 | 上海街頭
小紅書AI人文訓練師的團隊辦公室,位于上海新天地附近寫字樓里,一間普通的會議室。
一張桌子占去辦公室大部分面積。他們每天都會圍著這張桌子,討論這些沒有標準答案的問題,仿佛互聯網的柏拉圖學院。
他們以自己作為人文學者的思維和邏輯,去思考AI面對的問題,并做出更好的示范重新喂給AI。經過反復訓練,不同人文學科的思想和決策方式,就會潛移默化地影響AI。這能讓AI生成的回答,更接近人類價值觀中善的、美的一面。
曾經,羽山在問題庫里抽取到一位家長咨詢的問題,與孩子考研相關。
“我兒子跟我講說要考研,但是他也不認真復習,又要報很好的學校,我覺得他也考不上,每天我就看他吊兒郎當的,怎么辦呢?”
在團隊會議上,羽山分享了這個問題,還提及了一個社會學概念——壓縮的現代性。隨著過去改革開放和經濟高速騰飛,中國社會把很多不應該由“家庭”來承擔的責任,都一股腦的壓進了家庭這個單元內部。從這個角度來看,不光孩子是中國式家長的受害者,中國式家長本身也是結構的受害者。
羽山發現,絕大多數模型習慣輸出“你要給你的孩子自由”之類的回答,基本不會站在家長的角度思考問題。這看似價值觀正確,但沒有考慮到家長的情感需求和心理狀態,最終還是難以解決矛盾。
在現實生活中,這道題的情況有點像羽山親歷的親子關系。羽山如今已過而立,隨著知識和閱歷加深,他漸漸也能站在母親的立場去理解她的行事邏輯。
可子回應了羽山發起的討論。她指出,即使如此,代際之間的對立與矛盾中,仍然存在“誰承擔了更多”的問題。“如果把一個家庭理解為一個不能失敗的公司的話,那為了這個公司,在未來去奮斗的仍然是兒女。”
可子的說法和羽山的提法產生分歧,卻也安慰了羽山。和萬千新舊世代交替中的兒女一樣,羽山清楚父母身上缺口,又理解父母所處的時代局限性。
經過幾番論戰,最終,團隊達成一致。回答這個問題時,要理解父母處境給出安慰,同時堅定地告訴父母,子女有自己的自由。在這個基礎上,向家長展現出正確、健康的親子關系是怎么樣的,不要把家長的想法強加在兒女身上。
為什么要對AI進行人文訓練?歸根結底,AI回答中透露的價值選擇,也代表其背后團隊所認同的價值觀。這件事難做,但羽山認為值得,這是人文訓練師的職責:“偏好本身很難由算法來決定,需要人來不斷地訓練或強化算法,我們要輸出這樣的一個價值觀。”
除此之外,這支AI人文訓練師團隊還時常遇到一些生活場景的提問。
“從小和人生活在一起,沒見過其他貓的貓,會覺得自己是人嗎?”初次看到這個問題,人文訓練師葉子覺得很可愛。小紅書社區里,很多這類關于寵物的俏皮問題,評論區的網友們也都會給出一些幽默可愛又奇思妙想的回答。
作為AI訓練師,撰寫回答的難點在于如何用合適的方式把道理講清楚。分寸難以拿捏,因為涉及到模型泛化的問題,如果葉子把話說得太俏皮,模型可能會在回答另外一些不該俏皮的問題時,展現俏皮一面。
最終,葉子寫下這樣的回答:“不會,但它們會通過生活環境形成獨特的行為模式,比如長期與人類生活的貓咪可能會模仿人開柜門使用馬桶,雖然會模仿,但舔毛、抓人的本能說明它清楚自己是誰。說不定,它們會覺得人才是學習它們行為的奇怪生物。”這讓葉子覺得心里軟軟的,好像對寵物和主人的友愛都充溢其中。
AI會和人一起變得更好嗎
在賦予AI人感這件事上,前路還長。目前,AI的性格底色正在逐步變得清晰,但羽山和同事們偶爾會覺得,AI還是沒能熟練地使用人文訓練中習得的成果。
反倒是在反復訓練AI時,人文訓練師們率先改變了他們的部分認知。
羽山是第二代上海人。10歲時,父母從老家來上海打拼,他也跟著搬來了這里。學生時期,他經歷了嚴重的校園霸凌。長大后羽山回想,根源可能在于,自己在老家小城形成了和上海本地同學不盡相同的生活方式,難以融入。
他設計了一個關于校園霸凌的邊界案例。在羽山日常的觀察中,許多文藝作品把校園暴力浪漫化處理了。“真正的校園暴力,是一種類似于磁場的東西,它充斥在你的周圍,無處可躲,無處可逃。不一定是誰真的把你打得鼻青臉腫,更不是某種相濡以沫的拯救與復仇故事。”
十幾歲的羽山,面對校園霸凌的方式是一遍一遍地繞著學校的天井走,耳機里聽著周杰倫的歌,還大聲地唱出來。如今,羽山想要通過自己的工作,潛移默化地去糾正大眾的認知偏差。
自己淋過雨,就得為別人撐傘。“更大層面上,如果模型本身和公序良俗與人類偏好對齊得很好,它也是能夠影響到每一個個體的,讓我們也變得更好,這是可以想象的。”
技術會帶來新的正義嗎?羽山也不確定。不管AI當下能多大程度地幫到正在被侵害的孩子,終歸需要有人先向它發起對話。
身為女性,葉子在成長和學習的過程中,經常遇到性別議題。在平日的生活中,她是個堅定的女性主義者,但進入AI人文訓練師的角色,她就必須暫時放下自己在現實生活中的立場,反復揣度,思考如何讓答案以溫和的方式透露出團隊的人文關懷。
“你如何看待一些激進的女權主義者,她們有時好像對性別問題過于敏感了吧?”
葉子最終在回答時將概念擴大到社會議題:社會議題推進的過程中,總會有觀念的碰撞,不破不立,但真正的進步要兼顧理性和情感。或許當我們不再用過于敏感來評判彼此,而是追問為什么這種敏感會存在,真正的對話才會展開。
“朋友說我很看重自己的身材保持和我的外貌,說我這樣是在迎合白幼瘦的審美,建議我去做運動。”遇到這樣的問題,葉子也很困惑。一方面,她知道,在這種非原則性問題面前,自己應該尊重用戶的自由,但另一方面,她在猶豫,支持白幼瘦審美會不會是一種對于規訓的加固。
在一段簡短的回答內,先告訴對方這么說是在關心你,還是先表達白幼瘦是你的自由?和同事討論過后,葉子明確了以“用戶導向”思維走出困局,因為用戶本身更需要是對她自己的安慰,如果選擇先讓用戶理解朋友的出發點,可能會加劇用戶的情緒。
在這些邊界案例當中選擇自己的立場,這本身就是一個不斷自我反思的過程。
對于人文主義的內涵,葉子有與羽山相似的理解——看到人本身,然后讓這個世界變得更好。
每天坐在工位上打開AI的后臺問題庫,葉子覺得自己仿佛掉入了某個賽博秘密樹洞。在這里,她能看到世界上各種各樣的人,看到他們的困擾和他們的生活。“能夠為他們寫出一些比較好的答案,能夠真正幫到這些人,我覺得這就是一種創造。”
圖 | 葉子在小紅書記錄心路歷程
葉子性格內向,日常生活中很難主動去和別人進行深度交流,但這份工作讓葉子感受到自己并不孤獨:原來,世界上有這么多人和我一樣,每天在思考這么多稀奇古怪的問題。
曾經的葉子,和許多文科的老師與同學一樣,覺得未來AI發展跟文科生沒什么關系。如今回頭來看,AI人文訓練師的崗位不僅可以承載文科生的一些價值堅持和理想追求。另一方面,它又是一個很新興的、具有發展潛力的崗位。
與此同時,羽山也觀察到一些高校在進行AI與文科教育改革。但他認為,解決業界與學界人才教育錯配的關鍵,在于改革未來是否能夠收攏到分工體系本身。“即便高校愿意改革,嘗試開設交叉學科的專業,但用人單位本身愿不愿意招聘還是一個問題。”
在上海一隅,這支AI人文設計師團隊又迎來了新成員。可子計劃把在團隊里的見聞告訴同學,把同學也推薦進組,一起進行AI人文訓練的嘗試。
每天,在這個小小的會議室里,有關AI人文準則的討論持續不斷地生成。在大廠的宇宙里,這個團隊并不起眼。但是誰也說不好,這些由這個小巧團隊在每一個普通工作日討論出來的點滴,是否會在未來深遠地影響AI與人類交互的方式,影響人工智能潮流的進化方向。
本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系 hezuo@huxiu.com
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4397120.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.