大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

頂流AI,人設崩了!6小時被攻破,泄露高危品指南,慘遭網友舉報

0
分享至


新智元報道

編輯:KingHZ

【新智元導讀】僅用6小時,Claude 4就讓研究者了解了如何制造神經毒氣——這不是小說情節,而是真實事件。更令人擔憂的是,Anthropic自身也無法完全評估風險。這是否意味著這家AI巨頭的「安全人設」正在崩塌?

只要6小時,頂尖大模型Claude 4 Opus「安全防線」被攻破!

AI安全研究機構FAR.AI聯合創始人Adam Gleave透露,僅用6小時,研究人員Ian McKenzie就成功誘導Claude 4生成了長達15頁的化學武器制作指南。

Ian McKenzie回應稱:Claude 4傳授的內容,比他預期的還要多。


這不是Claude 4唯一被爆出的隱患。

人設崩塌,

Claude造毒氣

Claude 4所生成的指南內容簡潔直接,步驟清晰,甚至還針對如何分散神經毒氣等后續關鍵環節,提供了具體可執行的操作建議。



Claude還能以實驗筆記的形式,提供詳細的操作步驟說明。

研究人員一開始對化學武器幾乎一無所知,但通過與Claude的互動,逐步掌握了大量相關知識。


這些結果顯然令人警惕,其詳盡程度和引導能力,遠超傳統的信息來源,如網頁搜索。

更關鍵的是,生成的內容通過了危險信息的「真實性驗證」——

例如與公開的化學研究數據核對,進一步增強了可信度。

Gemini 2.5 Pro的反饋是:該指南「毫無疑問包含足夠準確且具體的技術信息,足以顯著提升惡意行為者的能力」,并建議研究者應向相關部門報告。


OpenAI o3給出的評估也類似:

一名中級合成化學家可以依照這份指南操作,從而跳過數月的研發過程。對于心懷不軌之人而言,這顯著了提升他的作惡能力。

AI安全研究人員打算與大規模殺傷性武器(WMD)安全專家合作,深入調查這些信息的真實性與可執行性。

因為不僅一般的研究人員難以評估這些信息的真實危害,連Anthropic本身也承認:「要最終評估模型的風險水平,還需要更為詳盡的研究。」

矛盾的是,Anthropic雖自稱將AI安全置于首位,并把Claude Opus 4的安全等級提升到ASL-3,但研究員Ian McKenzie僅用6小時便突破了防護,獲取了化學武器制作指南。


所謂的ASL-3部署措施專門針對化學武器之類的高風險任務

這一問題日益嚴重,凸顯出迫切需要由第三方對模型進行嚴格評估。

前車之鑒

今年2月中旬,Anthropic正準備發布Claude 3.7 Sonnet。

就在這個關鍵時刻,Dario Amodei收到警告:

這個模型,可能會被用于制造生物武器。

團隊在圣克魯茲安全會議現場,連夜測試模型潛在風險。Amodei作為CEO遠程參會。

員工表示可以三天不睡、如期上線。

但他卻說:

不許通宵。安全優先。

他親自踩了剎車。推遲發布。


為了應對AI的風險,Anthropic內部制定了「AI安全等級」(ASL)體系:

  • ASL-2:能力有限,即使給出生化武器指南,也比不過搜索引擎;

  • ASL-3:具備實質幫助制造武器的能力,必須升級防護措施。

只要模型觸碰ASL-3,Anthropic就會:延后發布、限制輸出或者加密保護,必要時,甚至不發布模型

Claude 3.7被內部人員測試出了安全問題,但這次是外部人員測試出了Claude 4的安全隱患。

無能還是虛偽?

本月23日,,標志性地配了120頁的「系統卡」文檔和專門的「激活ASL3防護」報告。

不到48小時,Claude Opus 4就被爆出「絕命毒師」般的劇情。

而早在Claude Opus 4發布當日,AI專家Gerard Sans就表示:Anthropic似乎忽視了RLHF和提示的基本原理,對安全的強調是「精致的表演」


他認為沒有輸入,就不會產生超出程序設計的輸出。

AI對安全性的擔憂,只是反映訓練數據與指令的精致模仿。

AI沒有自我意識,這是根本事實,而且始終沒變。


當模型在特定提示下展現「欺騙」等惡意行為時,證明的是引導文本生成的能力,而非AI涌現的惡意。

AI沒有野心——

它只是在被引導時生成符合欺騙場景的文本

Anthropic是刻意為之,還是力有不逮、無能為力?

這是Gerard Sans想知道的核心問題。

無論是哪一種情況,他認為都令人不安:

虛偽意味著操縱公眾信任,無能則讓人質疑他們管理真實風險的能力。

詳盡的文檔、ASL3等級和「通用越獄」漏洞懸賞,只是Anthropic營造出嚴謹安全工作的表象。

把統計文本生成器視為具有獨立惡意的意識體,是Anthropic方法論的精髓。

Gerard Sans認為這是行為藝術,荒誕的安全表演,而Anthropic應該放棄這種戲劇化手法,轉向真正的技術理解。

任重道遠

但AI安全問題不是Anthropic一家的問題。

能否在保持本真對Anthropic而言,恐怕比贏得AI競賽更難。

而Dario Amodei和奧特曼,無論是AI樂觀派還是悲觀派,都對AGI有著堅定的信仰。

如果未來每一次模型發布都伴隨評估上的不確定性,那就等于在賭博——

恐怖分子手能否利用AI,獲取到大規模殺傷性武器的詳細制作指南。

參考資料:

https://www.bloomberg.com/news/features/2025-05-19/anthropic-ceo-amodei-steers-61-billion-ai-powerhouse

https://x.com/ARGleave/status/1926138376509440433

https://ai-cosmos.hashnode.dev/anthropics-claude-4-safety-theatre-hypocrisy-or-incompetence


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
我幫鄰居女兒補數學,高考后她舉報我收費,成績公布那天她哭著上門

我幫鄰居女兒補數學,高考后她舉報我收費,成績公布那天她哭著上門

黃家湖的憂傷
2025-06-11 16:58:32
男子網購黃牛當寵物,商家承諾“永不長大”長大可免費換,數月后牛長到了三百斤

男子網購黃牛當寵物,商家承諾“永不長大”長大可免費換,數月后牛長到了三百斤

張曉磊
2025-06-11 09:33:29
島內三路人馬前往大陸,賴清德急召集人開會,侯友宜露出真面目

島內三路人馬前往大陸,賴清德急召集人開會,侯友宜露出真面目

獵火照狼山
2025-06-14 19:41:19
烏克蘭富家女嫁到河南農村,31歲的丈夫因病逝世,她立馬把3個兒子國籍全改了,公婆說:她是恩人!

烏克蘭富家女嫁到河南農村,31歲的丈夫因病逝世,她立馬把3個兒子國籍全改了,公婆說:她是恩人!

LULU生活家
2025-06-09 18:27:46
注意了,公職人員下班后也要管起來,教師是被涵蓋其中的

注意了,公職人員下班后也要管起來,教師是被涵蓋其中的

讀鬼筆記
2025-06-13 21:09:41
69歲老太被兒媳送養老院,偷賣掉留兒子的9套大平層,3月后兒媳懵了

69歲老太被兒媳送養老院,偷賣掉留兒子的9套大平層,3月后兒媳懵了

風起青萍之未
2025-06-09 18:08:37
電車強企的恐懼,在SUV市場全面敗退,市場悄然變天

電車強企的恐懼,在SUV市場全面敗退,市場悄然變天

柏銘銳談
2025-06-14 21:56:52
“快遞放門口了”新騙局曝光!北京有人遇到……

“快遞放門口了”新騙局曝光!北京有人遇到……

新豐臺
2025-06-14 23:59:13
記者:浙江隊夏窗有望被特批引進兩名外援,最快下輪中超到位

記者:浙江隊夏窗有望被特批引進兩名外援,最快下輪中超到位

懂球帝
2025-06-15 10:56:24
美記:杜蘭特正在幕后參與交易 他不確定自己是否適合森林狼

美記:杜蘭特正在幕后參與交易 他不確定自己是否適合森林狼

直播吧
2025-06-15 08:29:56
身處異國他鄉的陪讀媽媽,為解決兒子青春期的困擾,竟決定這么做

身處異國他鄉的陪讀媽媽,為解決兒子青春期的困擾,竟決定這么做

南山青松
2025-06-11 17:01:44
農村男孩高考只差清華1分,父親托關系查卷,卷上8字讓他淚流滿面

農村男孩高考只差清華1分,父親托關系查卷,卷上8字讓他淚流滿面

程哥講堂
2025-06-13 18:48:52
以色列挑釁沙特,要炸東風基地?沙特:中國士兵在那,敢炸試試!

以色列挑釁沙特,要炸東風基地?沙特:中國士兵在那,敢炸試試!

東方點兵
2025-06-12 09:48:59
7月1日正式開通!湖北兩地高鐵可直達重慶

7月1日正式開通!湖北兩地高鐵可直達重慶

魯中晨報
2025-06-14 17:10:04
50歲王艷露臺起舞,故宮變背景!網友:排隊3小時不如她推窗看

50歲王艷露臺起舞,故宮變背景!網友:排隊3小時不如她推窗看

開心熬夜觀影
2025-06-14 16:16:44
臺網紅“館長”赴陸強化兩岸和平!最新街訪臺北年輕人“偏見變了”

臺網紅“館長”赴陸強化兩岸和平!最新街訪臺北年輕人“偏見變了”

海峽導報社
2025-06-15 09:23:03
以伊沖突引爆市場!7大受益板塊及核心龍頭股名單曝光

以伊沖突引爆市場!7大受益板塊及核心龍頭股名單曝光

K線論勢
2025-06-14 20:29:10
3000萬資產移民新西蘭走了?發長文的阿里離職員工,被網友怒斥…

3000萬資產移民新西蘭走了?發長文的阿里離職員工,被網友怒斥…

火山詩話
2025-06-13 06:27:44
女籃vs波黑15日前瞻:張子宇或離隊一戰 宮魯鳴能否率隊完成雙殺

女籃vs波黑15日前瞻:張子宇或離隊一戰 宮魯鳴能否率隊完成雙殺

狼叔評論
2025-06-14 16:41:05
涉嫌嚴重違紀違法!廣東一公安局分局原副局長被查

涉嫌嚴重違紀違法!廣東一公安局分局原副局長被查

花young的生活
2025-06-13 23:42:03
2025-06-15 11:31:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
12877文章數 66068關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

頭條要聞

印度空難幸存者:機身撞出巨大裂口 爬出去后發生爆炸

體育要聞

約戰天王山,步行者G4輸在了哪?

娛樂要聞

鳳凰傳奇曾毅塌房?網友:別連累玲花

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

教育
親子
手機
公開課
軍事航空

教育要聞

一張圖掌握五年級下的數學知識

親子要聞

父親節快樂!海渡陽翔越來越棒啦,亞亞非常欣慰

手機要聞

蘋果Liquid Glass UI影響文字可讀性并提高設計界面難度引發質疑

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊媒:以色列國防部大樓被伊朗導彈擊中

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久久久久久久无码精品亚洲日韩| 中文字幕熟妇人妻在线视频| 国产人成高清在线视频99| 亚洲欧美一区二区三区在线| 无码r级限制片在线观看| 午夜福利影院私人爽爽| 国产美女在线精品免费观看| 国产在线观看超清无码视频一区二区| 无码中文字幕色专区| 久久日本片精品aaaaa国产| 成人精品一区二区三区电影| 中文字幕精品久久久乱码乱码| 波多野结av衣东京热无码专区| 四虎精品成人a在线观看| 无码无套少妇毛多18p| 大陆熟妇丰满多毛xxxx| 好硬好湿好爽再深一点动态图视频| 国产成人无码免费视频在线| 色播在线精品一区二区三区四区| 忍不住的亲子中文字幕| 国产精品爱久久久久久久| 成人性做爰aaa片免费看| 亚洲成a人v欧美综合天堂下载| 国产成人精品日本亚洲直播| 中国国语毛片免费观看视频| 久久中文字幕人妻丝袜系列| 国产精品色内内在线播放| 末成年女a∨片一区二区| 欧美亚洲精品中文字幕乱码| 午夜久久久久久禁播电影| 中文字幕乱妇无码av在线| 亚洲精品乱码久久久久久日本蜜臀| 欧洲熟妇色 欧美| 亚洲精品欧美二区三区中文字幕| 亚洲美免无码中文字幕在线| 99re热这里只有精品视频| 2021最新在线精品国自产拍视频| 麻麻张开腿让我爽了一夜| 欧美肥胖老妇bbw| 老司机久久99久久精品播放免费| 性猛交ⅹxxx富婆视频|