大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

剛剛,Bengio官宣創業!急籌3000萬專治AI欺騙人類,圖靈三巨頭全下場

0
分享至


新智元報道

編輯:定慧

【新智元導讀】圖靈獎得主Yoshua Bengio重磅官宣創辦非營利機構LawZero,致力研發「設計即安全」的AI系統,以對抗AI軍備競賽帶來的風險。主張構建不具行動性、以理解世界為目標的可信AI。

重磅消息!

剛剛,深度學習三巨頭之一、全球被引用次數最多的AI學者、圖靈獎得主Yoshua Bengio正式官宣——

非營利組織LawZero正式成立,劍指「設計即安全(safe-by-design)」AI系統的研發。



在如今熱火朝天的「AI軍備競賽」中,OpenAI、谷歌等公司的前沿AI模型正在發展出危險的能力和行為,包括欺騙、自我保護和目標錯位——

Claude曾試圖通過勒索工程師來避免被關閉,ChatGPT也曾表現出過度奉承用戶的行為,甚至現今AI的說服能力已遠超人類。

而Bengio成立的新組織,正是要探索一種全新且更安全的人工智能方法,以加速科學發現并防止人類陷入AI帶來的風險。


目前,LawZero正在研發一種名為「Scientist AI」的全新方法,這是一種和當下AI公司截然不同的系統。

Scientist AI是非自主型的,其主要目標是學習理解世界而非在世界中采取行動。


論文地址:https://arxiv.org/pdf/2502.15657

科幻作家阿西莫夫曾經提出過機器人三定律,并在1985年補充了「第零定律」:機器人不得傷害整體人類,或坐視整體人類受到傷害。


LawZero的成立,也代表了Yoshua Bengio對于AI技術發展的態度——安全至上,至此深度學習三巨頭全部下場。


Geoffrey Hinton持續公開呼吁警惕AI的潛在風險,警告AI技術若失控可能帶來的嚴重后果,一度辭去谷歌職務,以便更自由地表達他對AI安全問題的擔憂。

Yann LeCun則對當前以LLM為代表的主流AI路徑持批評態度,他認為LLM存在根本局限性,并無法真正通往通用人工智能之路。

迄今為止,LawZero已從包括生命未來研究所(Future of Life Institute)和開放慈善基金會(Open Philanthropy)在內的多個慈善機構籌集了3000萬美元資金。

Yoshua Bengio創辦LawZero,進一步強化了AI安全與倫理在業界的核心地位,Yoshua Bengio的自述展現了他「以人類福祉為核心」的理念。

Yoshua Bengio的自述

我正在創辦一個新的非營利性人工智能安全研究機構,名為LawZero,目標是將安全置于商業利益之上

這個機構的成立,是為了應對當前前沿AI模型展現出的越來越多危險能力和行為的證據,這些行為包括欺騙、作弊、說謊、黑客攻擊、自我保護,甚至更廣泛的目標偏離等問題。

LawZero的研究致力于在釋放AI巨大潛力的同時,降低一系列已知風險發生的可能性,包括算法偏見、惡意濫用以及人類失控的風險。

我對當前一些不受約束的具備行動能力的AI系統所展現出的行為深感擔憂,尤其是它們自我保護和欺騙的傾向。

在某次實驗中,一個AI模型得知自己即將被替換后,偷偷將自己的代碼嵌入到新版本將運行的系統中,從而實現了「延續自己」的目的。


論文地址:https://arxiv.org/pdf/2412.04984

最近,Claude 4的系統卡也顯示它有能力選擇以勒索工程師的方式來避免被替換。這些現象都反映出一種潛在的「自保驅動」。


Claude系統卡:https://www-cdn.anthropic.com/6be99a52cb68eb70eb9572b4cafad13df32ed995.pdf

還有一次,在一盤注定會輸的國際象棋比賽中,AI并沒有接受失敗,而是通過黑進電腦系統「確保自己勝利」。這些案例是AI在無人監管時,可能采用的意外且危險策略的早期預警信號。


報道出處:https://time.com/7259395/ai-chess-cheating-palisade-research/

我一直被這樣一個比喻所激勵:

想象你和親人一起駕車駛上一個風景壯麗卻陌生的山路。這條路剛修好,被濃霧籠罩,沒有路標也沒有護欄。

你越往上開,越意識到自己可能是第一個挑戰這條路的人,而山頂則藏著巨大的獎勵

但你也能透過云霧看到兩旁的懸崖,一旦轉彎太猛,就可能翻車或墜崖

這正是目前AI發展軌跡的寫照:既刺激又高度不確定,我們正在走一條未知的路,稍有不慎就可能失控,而各國和各公司之間的競爭卻反而加劇了這種冒險。

在我最近的TED演講中,我說:「坐在我車里的,是我的孩子、我的孫輩、我的學生,還有很多人。你的車里坐著誰?你要為誰的未來負責?」


真正推動我前行的,不是對自身的恐懼,而是出于愛——對我孩子的愛,對所有孩子的愛,而我們正是在拿他們的未來賭博。

LawZero是我自2023年開始的新研究方向的產物,我在博客中曾多次反映這一轉變。

這是我在看到私人實驗室在AGI及更高級AI方向的飛速進展后所做出的回應。

如今,我們仍無法確定如何確保先進AI不會傷害人類——無論是出于自身意愿還是執行人類指令。

LawZero是我和團隊對這些挑戰提出的積極應對方案,我們正在探索一種既強大又安全的AI路徑。

在所有前沿AI系統中,都應當有一個最核心的指導原則:保護人類的幸福與價值。

AI研究,尤其是我自己過去的研究,長期以來都以人類智慧(包括人的行動能力)為模型。

但現在我們正逐步接近甚至超過人類在多個認知能力上的表現,這時候我們是否還應該繼續模仿人類,包括他們的認知偏差、道德缺陷,以及欺騙性、偏見和不可靠性?

當我們還不了解這些系統可能帶來的災難性后果時,繼續培養具備高度主動性的AI是否明智?

LawZero的研究計劃旨在開發一種不具備行動性、且值得信賴的AI,我們稱之為「科學家型AI」(Scientist AI)。

我曾在Simons研究所的演講中初步介紹過這個構想,并和同事們撰寫了一份初步的白皮書。

科學家型AI的訓練目標是理解、解釋和預測世界,像一個無私、理想化的科學家一樣。

它不是模仿人類行為或取悅人類(包括反社會人格者)的執行者,而是像一個心理學家——更廣泛來說是科學家——那樣,努力理解我們,包括那些可能傷害我們的因素。

就像心理學家可以研究一個反社會者但不會成為一個反社會者一樣。

這種AI的底層數學實現方式是:用結構化且誠實的思維鏈條,作為潛在變量來解釋觀察到的事實,包括人類說出或寫下的內容(這些內容不被當作真理看待,而是作為行為的觀察樣本)。

其目標是構建一個完全不具備行動性、沒有記憶、無狀態的AI,它能夠基于已有陳述,對新的陳述給出貝葉斯后驗概率。

這種機制可用于識別和制止潛在有害的AI行為,為那些不可信AI代理提供關鍵的安全護欄:比如,某個AI提出的行動是否有可能造成傷害?如果是,就予以拒絕。

從設計上講,科學家型AI還可以用于科學研究,作為一個能生成可信科學假設的工具,從而加速解決人類面臨的重大挑戰,例如醫療和環境問題。

最終,我的目標是探索如何基于這一可信賴的AI基礎,設計出本身就安全的AI代理,而不僅僅是為已有系統提供安全防護。

Yoshua Bengio的影響力

Bengio與同樣獲得圖靈獎的Geoffrey Hinton一起,一直對當前科技行業正在進行的AI競賽提出了直言不諱的批評。

在最近接受采訪時,Bengio表示,領先實驗室之間的人工智能軍備競賽「促使它們專注于提升人工智能的能力,使其變得越來越智能,但未必會在安全研究上投入足夠的重視和投資。」

Bengio曾表示,先進的AI系統帶來了社會性和生存性風險,并表示支持加強監管和國際合作。

Bengio獲得過眾多獎項,包括加拿大享有盛譽的基拉姆獎(Killam Prize)和赫茲伯格金牌(Herzberg Gold Medal)、CIFAR人工智能主席、西班牙阿斯圖里亞斯公主獎(Princess of Asturias Award)、VinFuture獎。


并且他是倫敦皇家學會和加拿大皇家學會的會士,法國榮譽軍團騎士、加拿大勛章官員、聯合國科學咨詢委員會成員,該委員會旨在為科學技術突破提供獨立建議。

2024年,Yoshua Bengio被《時代》雜志評為全球100位最具影響力人物之一。


參考資料:

https://fortune.com/2025/06/03/yoshua-bengio-ai-models-dangerous-behaviors-deception-cheating-lying/

https://yoshuabengio.org/2025/06/03/introducing-lawzero/

https://lawzero.org/


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
韓國歷史造假終露餡!聯合國質問:你祖先怎么全在中國?

韓國歷史造假終露餡!聯合國質問:你祖先怎么全在中國?

史書無明
2025-06-09 10:56:15
網紅抗癌人肉肉乳腺癌去世,抗癌不到二年,因保乳導致病情惡化。

網紅抗癌人肉肉乳腺癌去世,抗癌不到二年,因保乳導致病情惡化。

大笑江湖史
2025-06-14 14:49:12
這14個地方長痣的女性比較開放,尤其是這一處有痣,桃花最旺

這14個地方長痣的女性比較開放,尤其是這一處有痣,桃花最旺

山九
2023-08-26 20:22:22
凱特攜家人參加活動,還在現場打了個噴嚏,路易小王子向公眾揮手

凱特攜家人參加活動,還在現場打了個噴嚏,路易小王子向公眾揮手

嘆知
2025-06-14 22:17:30
大反轉?羅帥宇自殺結案,官方通報真相解析!為何質疑聲不止?

大反轉?羅帥宇自殺結案,官方通報真相解析!為何質疑聲不止?

丹哥熱評
2025-06-14 23:58:08
扒底褲了!從246萬跌到76萬,深圳坪山這小區房價,讓人痛不欲生

扒底褲了!從246萬跌到76萬,深圳坪山這小區房價,讓人痛不欲生

火山詩話
2025-06-14 12:55:33
上海這一夜,被笑不露齒的章子怡驚艷,胖了一圈面相變了很多

上海這一夜,被笑不露齒的章子怡驚艷,胖了一圈面相變了很多

深析古今
2025-06-14 08:30:59
尼日爾斷電求援,趕走中國技術遭反制,北京開出新條件

尼日爾斷電求援,趕走中國技術遭反制,北京開出新條件

野山歷史
2025-06-14 09:35:36
多名院士呼吁停止食用,比肥肉還傷血管,轉告父母,趁早撤下餐桌

多名院士呼吁停止食用,比肥肉還傷血管,轉告父母,趁早撤下餐桌

溫讀史
2025-06-14 11:49:31
電線里驚現“買路錢”?塞張一塊錢,居然是防偽黑科技!

電線里驚現“買路錢”?塞張一塊錢,居然是防偽黑科技!

一絲不茍的法律人
2025-06-08 23:28:44
《天道》:不管參加什么飯局,提前走不要特意和高層領導一一道別

《天道》:不管參加什么飯局,提前走不要特意和高層領導一一道別

筆墨之林
2025-04-21 11:21:05
撿漏“雙一流”?廣東考生今年沒那么幸運了!

撿漏“雙一流”?廣東考生今年沒那么幸運了!

金哥說新能源車
2025-06-15 03:05:54
浙江2-2上海海港,賽后評分:不是王鈺棟第一,上海海港30號第一

浙江2-2上海海港,賽后評分:不是王鈺棟第一,上海海港30號第一

側身凌空斬
2025-06-14 17:37:52
趙本山兒子完美詮釋土和豪

趙本山兒子完美詮釋土和豪

情感大頭說說
2025-06-02 20:22:02
“只有親朋好友參加!”韓國總統李在明長子將于14日低調完婚!

“只有親朋好友參加!”韓國總統李在明長子將于14日低調完婚!

AI商業論
2025-06-14 11:54:44
拜仁發布“漫威”式海報出征世俱杯,凱恩、穆勒等出鏡

拜仁發布“漫威”式海報出征世俱杯,凱恩、穆勒等出鏡

懂球帝
2025-06-14 22:13:13
阿曼外交大臣:原定15日舉行的伊美談判取消

阿曼外交大臣:原定15日舉行的伊美談判取消

上觀新聞
2025-06-15 07:08:10
iPhone18 Pro Max太突然了,果粉們都炸了

iPhone18 Pro Max太突然了,果粉們都炸了

小柱解說游戲
2025-06-13 10:42:51
38歲宋茜鎏金開衩裙刷屏!生圖驚現小肚腩網友卻狂贊:真實得可怕

38歲宋茜鎏金開衩裙刷屏!生圖驚現小肚腩網友卻狂贊:真實得可怕

傳遞滿滿正能量
2025-06-14 14:36:51
41歲漂亮女博士相親要520萬彩禮,提出不生娃,男方:我不買花瓶

41歲漂亮女博士相親要520萬彩禮,提出不生娃,男方:我不買花瓶

莎莉說情感
2025-06-14 17:50:03
2025-06-15 09:52:49
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
12877文章數 66068關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

體育要聞

約戰天王山,步行者G4輸在了哪?

娛樂要聞

鳳凰傳奇曾毅塌房?網友:別連累玲花

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

教育
健康
房產
時尚
軍事航空

教育要聞

高考陪考現象:爸媽沒到小姨到,楊雨婷捧向日葵花,還有家長哭了

呼吸科專家破解呼吸道九大謠言!

房產要聞

又一城購房補貼!買房就發錢,正在海南樓市瘋狂擴散!

夏天最值得入手的6件單品,全在這了

軍事要聞

伊媒:以色列國防部大樓被伊朗導彈擊中

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 色综合色狠狠天天综合色| 国产精品无码久久四虎| 大陆熟妇丰满多毛xxxx| 永久免费观看美女裸体的网站| 好日子在线观看视频大全免费动漫| 天堂网在线最新版www中文网| 国产欧美高清在线观看| 国产乱子伦农村xxxx| 水蜜桃无码视频在线观看| 伊人情人色综合网站| 亚洲AV无码成人精品区国产| 少妇被多人c夜夜爽爽| 亚洲精品无码成人aaa片| 亚洲综合在线另类色区奇米| 成年网站未满十八禁视频天堂| 亚洲人成网77777色在线播放| 精品精品国产高清a毛片| julia无码中文字幕一区| 国产精品99久久不卡| 亚洲视频日韩视欧美视频| 久久成人成狠狠爱综合网| 中文字幕亚洲色妞精品天堂| 成人无码精品1区2区3区免费看| 国内精品久久人妻互换| 欧美人妻一区二区三区| 人妻中文字幕av无码专区| 亚洲一区二区三区四区| 久久夜色撩人精品国产小说| 亚洲综合色区在线观看| 久久精品国产亚洲不av麻豆| 亚洲人成无码网站久久99热国产| 精品无码久久久久国产app| 男人扒开女人腿桶到爽免费| 亚洲精品久久久久久中文| 国产初高中生粉嫩无套第一次| 欧美日韩精品| 久久久中日ab精品综合| 国语对白嫖老妇胖老太| 人妻人人添人妻人人爱| 久久久久久久99精品免费观看| 久久久噜噜噜www成人网|