大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

合成數據的突破: 從降低迎合性偏差到認知自主性的重構

0
分享至

馬來西亞思特雅大學博士生王立博,近兩年來主要研究大語言模型。起初,王立博做這類研究也是被大語言模型給逼的,因為日常總得提防其“獻媚(Sycophancy)”,這是由基于人類反饋的強化學習調優策略導致的固有缺陷。

因此,他致力于設計能夠自主學習、思考和推理的人工智能,而不是人工寵物。

引入強化學習的訓練獎勵模型進行微調,盡管可以優化用戶體驗,但是引入偏見是不可避免的,因為“獎勵”的依據是優先考慮用戶反饋的滿意度而未必是考慮客觀事實。這種偏見通常來源于互聯網數據,而大語言模型的訓練數據集主要依賴于互聯網信息。

基于此,王立博嘗試通過合成數據干預來優化僅解碼器(decoder-only)transformer 架構,彌補其對輸入序列缺乏深度分析的不足。

在生成過程中他嘗試設計加入額外阻礙,促使模型自主判斷并拒絕不合理的輸入。這一構想原理上能有效避免過度依賴用戶的反饋,因為合成數據干預會更側重于模型內在推理能力的培養,而非尋求 RAG 外部知識庫。


(來源:OpenAI)

此外,實現自主思考的重要標志之一就是判斷力,為此王立博構想加入反面示例和對抗性輸入來提升模型的抗獻媚性。

實驗結果顯示,經過合成數據干預后的 GPT4o 在量化獻媚指標上顯著下降。如果這一成果有機會走出實驗室,它可能為 decoder-only 架構的模型會帶來更客觀的決策支持,并減少偏見。

同時,該成果在機器人、自動駕駛和醫療等領域的應用,有助于提升自動化科學研究的效率。

更令王立博興奮的是,此次實驗是通過提示詞工程(prompt engineering)實現。這意味著未來合成數據干預可以不再依賴傳統的代碼編寫,僅通過編寫自然語言,推動“AI 工程師”從專業技術人員走向普羅大眾,為更多探索者擴大平等契機。

未來,開發、優化、數據處理、特征挖掘以及對前沿技術知識的了解,可能無需再依賴少數掌握編程和數學知識的專家,而只需設計邏輯清晰的提示詞。

日前,相關論文《減輕僅解碼器變換器架構中的獻媚:合成數據干預》(Mitigating Sycophancy in Decoder-Only Transformer Architectures: Synthetic Data Intervention)為題發在 arXiv[1]。


圖 | 相關論文(來源:arXiv)

隨著大語言模型推理思考和生成代碼等能力的增強, 提示詞工程使人們有機會更平等地與各領域科學家共享信息資源。因此,未來王立博會致力于推動未來工程的提示詞化,簡單直接平等。

比如,最近王立博通過設計 prompt 進行黑盒測試 (Black-Box Testing) 實驗,嘗試模擬攻擊大語言模型的護欄。他發現即便如 GPT4o 和 Grok-2 Beta,其護欄在識別多步驟越獄傾向的提示詞時仍存在較大困難。

其還通過模擬場景設計了 7 到 10 步的提示詞成功順利使得所有模型模擬生成言語攻擊的內容。這意味著當前的大語言模型的護欄仍需完善。

在稀疏注意力方面,王立博曾設計通過稀疏注意力機制降低大語言模型中思維鏈推理的成本。

同樣的,王立博通過提示詞基于 GPTs 訓練的實驗模型與 o1 preview 進行對比。實驗結果顯示,在犧牲可接受范圍內的準確率的條件下,稀疏注意力機制與具備思維鏈的編碼器-解碼器(encoder-decoder)transformer 架構結合,在推理時間和推理步驟方面都顯著降低。

王立博也曾設計過將自動語音識別和大語言模型引入智能眼鏡的架構,這些構想如今正在被工業界所實踐。即便合成數據干預或稀疏注意力機制被廣泛應用,由于其本身的限制性使交互仍主要集中在視覺和聽覺。而隨著當前深度強化學習技術不斷優化更新,人形機器人將迎來質的高速發展。在促進自主學習能力的同時,王立博設計了人形機器人多場景推理 (Multi-Scenario Reasoning) 以及模塊化機器人實現自主變形的認知模塊化控制 (Cognitive Modular Control) 等架構。受到人腦認知架構的啟發,他致力于為自適應機器人引入認知的自主化技術,促進機器人的多形態或多用途的方向轉型。因此,探索機器人在工業領域具備感知、思考、推理、規劃、記憶和決策等能力的認知自主性成為王立博的下一個研究目標。

參考資料:

1.https://doi.org/10.48550/arXiv.2411.10156

2.https://doi.org/10.48550/arXiv.2411.09111

3.https://doi.org/10.48550/arXiv.2411.16730

4.https://doi.org/10.48550/arXiv.2412.20429

5.https://openreview.net/pdf?id=lJr0M8vpZO

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
僅6分鐘19個導彈連全軍覆沒,82架戰機被擊落,以色列如何做到的

僅6分鐘19個導彈連全軍覆沒,82架戰機被擊落,以色列如何做到的

歷史求知所
2025-04-20 18:40:05
突發:以色列對伊朗發動打擊

突發:以色列對伊朗發動打擊

澎湃新聞
2025-06-15 00:28:03
TVB前監制梅小青突然發病住院!大批TVB花旦小生關心!早年曾多次接受手術!

TVB前監制梅小青突然發病住院!大批TVB花旦小生關心!早年曾多次接受手術!

我愛追港劇
2025-06-14 23:45:56
浙江“四大怪菜”,個個都是當地人的最愛,外地人看后直搖頭

浙江“四大怪菜”,個個都是當地人的最愛,外地人看后直搖頭

美食考察員
2025-06-15 11:25:21
6月買菜,建議少買這4樣蔬菜,都是反季節的,不好吃還沒營養!

6月買菜,建議少買這4樣蔬菜,都是反季節的,不好吃還沒營養!

愛生活的陶哥
2025-06-15 09:09:43
67歲大爺娶25歲女博士,一分錢彩禮都不要,新婚夜大爺卻愣住了

67歲大爺娶25歲女博士,一分錢彩禮都不要,新婚夜大爺卻愣住了

溫情郵局
2025-05-27 15:24:34
2000萬!大馬丁要簽約曼聯,阿根廷的國門。奧納納真要走人了

2000萬!大馬丁要簽約曼聯,阿根廷的國門。奧納納真要走人了

卡靈頓分析師
2025-06-15 10:55:33
30歲郭露西成全球最年輕女富豪,與汪滔白手起家創立Scale AI

30歲郭露西成全球最年輕女富豪,與汪滔白手起家創立Scale AI

魯中晨報
2025-06-15 11:22:02
印媒:印度撕毀了中國軍事優勢假象!中國人口銳減,印度人口紅利

印媒:印度撕毀了中國軍事優勢假象!中國人口銳減,印度人口紅利

說說史事
2025-06-12 10:19:06
美俄要睡不著了?全球獨一份!中國空軍千架重型戰機亮劍藍天

美俄要睡不著了?全球獨一份!中國空軍千架重型戰機亮劍藍天

起喜電影
2025-06-13 14:32:10
裝都不裝了?染發,臟話,臭臉,何炅10年前對她的評價一一應驗

裝都不裝了?染發,臟話,臭臉,何炅10年前對她的評價一一應驗

大笑江湖史
2025-06-12 23:00:30
網傳“女生萬象城遭挾持”,杭州上城警方通報

網傳“女生萬象城遭挾持”,杭州上城警方通報

環球網資訊
2025-06-14 18:57:23
世上最快樂地方? 1家游迪士尼1天花1400美元,父親:這里是地獄

世上最快樂地方? 1家游迪士尼1天花1400美元,父親:這里是地獄

環球趣聞分享
2025-05-22 15:17:34
提醒!昆明主城區6個淹積水點采取臨時管制

提醒!昆明主城區6個淹積水點采取臨時管制

開屏新聞客戶端
2025-06-15 11:18:10
西方又一次誤判,中國第4艘航母和076兩棲艦,再次超出了外界預料

西方又一次誤判,中國第4艘航母和076兩棲艦,再次超出了外界預料

史紀文譚
2025-06-13 17:11:49
東方衛視首播,38集都市大劇,張雨綺、高偉光領銜,值得一看

東方衛視首播,38集都市大劇,張雨綺、高偉光領銜,值得一看

TVB的四小花
2025-06-15 07:53:19
Labubu韓國門店大排長龍,警察出動維護秩序!泡泡瑪特決定:中止韓國線下銷售

Labubu韓國門店大排長龍,警察出動維護秩序!泡泡瑪特決定:中止韓國線下銷售

第一財經資訊
2025-06-14 17:43:31
同樣是演“李善德”,把雷佳音和大鵬放一塊比,差距一目了然!

同樣是演“李善德”,把雷佳音和大鵬放一塊比,差距一目了然!

說說史事
2025-06-14 17:55:10
觀察臺海兵推,臺退役軍官邱世卿:臺當局不能對美國存有幻想

觀察臺海兵推,臺退役軍官邱世卿:臺當局不能對美國存有幻想

海峽導報社
2025-06-14 10:03:03
550萬在美華人數據全公開,88%中國籍博士留在美國!

550萬在美華人數據全公開,88%中國籍博士留在美國!

霹靂炮
2025-05-29 23:14:55
2025-06-15 12:47:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15294文章數 513782關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

義烏商家賣娃衣:做的非LABUBU娃衣 只適用于15cm玩偶

頭條要聞

義烏商家賣娃衣:做的非LABUBU娃衣 只適用于15cm玩偶

體育要聞

裁判可以噴,但也從步行者自身找找問題?

娛樂要聞

鳳凰傳奇曾毅塌房?網友:別連累玲花

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

游戲
時尚
本地
數碼
軍事航空

《馬里奧賽車世界》大金剛服裝太少 玩家猜測會有DLC

夏天最值得入手的6件單品,全在這了

本地新聞

最近的打工人,都在熬夜看這劇逐幀學習職場小技巧

數碼要聞

AMD 銳龍7 9700F曝光:無核顯加持,主流游戲玩家的新希望?

軍事要聞

伊朗最高領袖高級顧問沙姆哈尼 因傷勢過重離世

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 肉色欧美久久久久久久免费看| 中文字幕乱码熟妇五十中出| 亚洲综合精品一区二区三区| 国产呦交精品免费视频| 国产偷窥熟妇高潮呻吟| 国产av一区二区三区天堂综合网| 性推油按摩av无码专区| 色翁荡息又大又硬又粗又视频图片| 国产av国片精品有毛| 亚洲精品国产乱码av在线观看| 亚洲中文字幕无码永久在线不卡| 人人妻一区二区三区| 国产在线精品一区二区中文| 国产av天堂亚洲国产av天堂| 国产白丝喷水娇喘视频| 少妇中文字幕乱码亚洲影视| 久爱无码精品免费视频在线观看| 精品日本一区二区三区在线观看| 国产精品美女久久久久av超清| 国产福利萌白酱在线观看视频| 精品少妇人妻av无码专区| 女邻居丰满的奶水| 青青草国产免费无码国产精品| 国产精品无码久久av嫩草| 女人被做到高潮免费视频| 99久久久无码国产精品免费| 亚洲国产综合精品一区| а√天堂资源8在线官网在线| 日韩无码在钱中文字幕在钱视频| 在线天堂资源www在线中文| 久久av老司机精品网站导航| 大陆精大陆国产国语精品| 亚洲午夜福利院在线观看| 夜夜爽妓女8888888视频| 九九精品99久久久香蕉| 熟女体下毛荫荫黑森林| 99热爱久久99热爱九九热爱| 香蕉久久人人爽人人爽人人片av| 摸进她的内裤里疯狂揉她动图视频| 永久黄网站色视频免费看| 国产无遮挡又黄又爽免费网站|