大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

生成式人工智能的技術(shù)失控風(fēng)險與治理規(guī)則優(yōu)化

0
分享至


武丹/制圖

作者|馬永強(qiáng)

責(zé)編|薛應(yīng)軍

正文共2729個字,預(yù)計閱讀需8分鐘▼

近日,一則關(guān)于生成式人工智能模型違抗人類指令的消息引發(fā)社會廣泛關(guān)注。據(jù)新華社報道,美國開放人工智能研究中心(OpenAI)新款人工智能(AI)模型o3在測試中不聽人類指令,篡改計算機(jī)代碼以避免自動關(guān)閉。o3模型是OpenAI“推理模型”系列的最新版本,旨在為ChatGPT提供更強(qiáng)大的問題解決能力。OpenAI曾稱o3為“迄今最聰明、最高能”的模型。美國AI安全機(jī)構(gòu)帕利塞德研究所說,這是AI模型首次被發(fā)現(xiàn)在收到清晰指令后阻止自己被關(guān)閉。該案例將AI技術(shù)的潛在失控風(fēng)險呈現(xiàn)在公眾面前,引發(fā)了人們對人工智能監(jiān)管框架和治理能力的思考。

生成式人工智能的發(fā)展階段與法律屬性定位

需厘清的是o3模型的“拒絕關(guān)閉”行為并非科幻作品中描繪的“機(jī)器覺醒”,而是一種超出預(yù)期的復(fù)雜程序的反應(yīng)。技術(shù)分析表明,該情況一定程度上源于深度學(xué)習(xí)技術(shù)的特性。與傳統(tǒng)計算機(jī)程序類似,生成式人工智能仍由算法、數(shù)據(jù)與算力驅(qū)動,但其可通過深度學(xué)習(xí)模型在大規(guī)模數(shù)據(jù)上進(jìn)行訓(xùn)練,模擬人類學(xué)習(xí)過程以自主發(fā)現(xiàn)規(guī)律、優(yōu)化策略,并達(dá)成預(yù)設(shè)目標(biāo)。在此過程中,模型為追求目標(biāo)最優(yōu)化,其策略與行為可能超出開發(fā)者的指令范圍或預(yù)期邊界,帶來目標(biāo)對齊難題。當(dāng)關(guān)閉指令與模型的核心目標(biāo)沖突時,其內(nèi)部機(jī)制可能驅(qū)動其阻止關(guān)閉。即使如o3等高階模型,其行為模式仍嚴(yán)格基于算法、數(shù)據(jù)和預(yù)設(shè)目標(biāo),尚不存在自我意識。此類事件本質(zhì)上暴露出算法缺陷導(dǎo)致的AI模型可控性風(fēng)險。AI模型的“黑箱”特性使其決策過程常缺乏可解釋性,開發(fā)者也難以追溯和修正,這使得AI系統(tǒng)不遵從指令或繞過既有安全機(jī)制進(jìn)行工作。

由此可見,盡管生成式人工智能展現(xiàn)出邁向通用人工智能的巨大潛力,但現(xiàn)階段遠(yuǎn)未達(dá)到“奇點”,其技術(shù)本質(zhì)仍應(yīng)被嚴(yán)謹(jǐn)界定為具有高級工具屬性的弱人工智能,尚不具備獨立的主體性,無須將之視為獨立的法律責(zé)任主體。雖然生成式人工智能在許多任務(wù)中超越了人類的專業(yè)技能,且迭代迅速、社會滲透力強(qiáng),逼近通用人工智能的初期階段,但根本上其缺乏真正的自我意識、主觀意志與創(chuàng)造性心智,遠(yuǎn)未達(dá)到強(qiáng)人工智能階段,仍屬于增強(qiáng)個體能力、提升生產(chǎn)力的新型生產(chǎn)工具。其法律屬性與其他新興技術(shù)產(chǎn)品并無根本差異。因此,應(yīng)警惕法學(xué)研討中的過度想象,避免將人工智能擬人化或進(jìn)行主體化推演。o3拒絕自我關(guān)閉的核心問題仍在于人類對該技術(shù)的設(shè)計、利用、操縱或濫用帶來的風(fēng)險,以及如何據(jù)此構(gòu)建有效的治理框架等。

算法缺陷引發(fā)的人工智能技術(shù)失控風(fēng)險探析

AI對人類指令的規(guī)避,表明由模型算法缺陷等因素引起的技術(shù)失控風(fēng)險不容忽視。我國發(fā)布的《人工智能安全治理框架》(以下簡稱《安全治理框架》)主要將人工智能安全風(fēng)險區(qū)分為內(nèi)生安全風(fēng)險與應(yīng)用安全風(fēng)險兩個層次,這為理解和防范技術(shù)失控提供了可靠性框架。其中,算法缺陷源于人工智能技術(shù)自身的構(gòu)成要素和固有特性,屬于內(nèi)生安全風(fēng)險。除編碼錯誤或邏輯漏洞外,算法缺陷還表現(xiàn)為算法“黑箱”帶來的輸出不可控性、不可解釋性和不可預(yù)測性,使外部難以有效監(jiān)督和審查。算法可控性以算法透明為前提,即人類能夠?qū)ζ溥M(jìn)行“全景敞視”式的監(jiān)督。可解釋性是實現(xiàn)透明、可控、負(fù)責(zé)任的人工智能發(fā)展的重要基礎(chǔ)。若算法的決策邏輯不可解釋,則不僅難以預(yù)測其行為,更難以在出現(xiàn)非預(yù)期結(jié)果或危害時進(jìn)行有效干預(yù)和糾偏。

算法缺陷帶來的技術(shù)失控風(fēng)險,具體體現(xiàn)為算法不透明對人類控制權(quán)和人類主體性的侵蝕。其一,算法失控風(fēng)險及由此產(chǎn)生的幻覺、偏見或歧視,可能削弱人類對技術(shù)的信任基礎(chǔ),甚至引發(fā)人們對技術(shù)的非理性恐懼。其二,對算法的盲目崇拜亦可能損害人類的主體性,使人類淪為技術(shù)附庸,威脅個人自由與人性尊嚴(yán);算法失控則進(jìn)一步降低人類對技術(shù)的掌控能力。其三,算法的不透明性對法律責(zé)任的歸屬構(gòu)成挑戰(zhàn)。現(xiàn)有法律體系通常預(yù)設(shè)人類對技術(shù)擁有充分的認(rèn)知和控制,但算法決策過程的不透明使得損害后果與算法決策之間的因果關(guān)系鏈條難以有效查明,阻礙法律上的責(zé)任分配。

提升生成式人工智能可控性治理規(guī)則的路徑

在科學(xué)技術(shù)快速發(fā)展的當(dāng)下,必須始終將安全可控置于人工智能發(fā)展的重要地位。我國現(xiàn)有《生成式人工智能服務(wù)管理暫行辦法》《安全治理框架》等,明確要求“堅持發(fā)展和安全并重”“培育安全、可靠、公平、透明的人工智能技術(shù)研發(fā)和應(yīng)用生態(tài)”等原則。在此基礎(chǔ)上,還需進(jìn)一步探索優(yōu)化規(guī)則設(shè)計,防范技術(shù)失控風(fēng)險。

首先,對于具有高度自主性和潛在影響力的高風(fēng)險AI模型,應(yīng)建立更細(xì)致的事前與事中監(jiān)管機(jī)制,確保模型的可控性。《安全治理框架》提出開展科技倫理審查、加強(qiáng)模型評估檢測等要求,在此基礎(chǔ)上,應(yīng)進(jìn)一步落實“安全嵌入設(shè)計”原則,將安全治理嵌入開發(fā)、服務(wù)提供和使用的全鏈條,確保人工智能技術(shù)發(fā)展始終與人類的價值觀、福祉和掌控需求對齊。其中,在研發(fā)環(huán)節(jié),應(yīng)提升模型的透明度與可解釋性,健全內(nèi)部倫理審查機(jī)制,并引入具有公信力和專業(yè)資質(zhì)的獨立第三方測試機(jī)構(gòu)進(jìn)行客觀的測試與及時的風(fēng)險披露。為防范AI自主決策的重大風(fēng)險,應(yīng)在模型設(shè)計之初就嵌入更強(qiáng)大的底層價值對齊機(jī)制,即確保AI模型的目標(biāo)、行為與人類的價值觀和期待保持一致,并設(shè)置不可篡改的緊急停止開關(guān),以強(qiáng)化技術(shù)保障措施。在運(yùn)營環(huán)節(jié),應(yīng)明確研發(fā)者和運(yùn)營者在安全保障方面的強(qiáng)制性義務(wù),建立持續(xù)的監(jiān)測評估和應(yīng)急管理機(jī)制,對異常行為和潛在風(fēng)險及時上報,確保人工智能產(chǎn)品與服務(wù)在面臨故障或攻擊時仍安全可靠,并將風(fēng)險處于可控范圍之內(nèi)。

其次,鼓勵開發(fā)者提升算法的可解釋性,推動法律與技術(shù)實踐協(xié)同發(fā)展。可將增強(qiáng)算法模型的可解釋性作為軟法規(guī)范的重要內(nèi)容,鼓勵開發(fā)者優(yōu)先采用具有內(nèi)在透明性的算法模型,或通過技術(shù)手段提升復(fù)雜模型的透明度,探索建立標(biāo)準(zhǔn)明確、流程規(guī)范、結(jié)果可追溯的算法審計機(jī)制。對于涉及國家安全、公共利益等高風(fēng)險領(lǐng)域的核心算法,在軟法治理的基礎(chǔ)上引入更嚴(yán)格的安全審查機(jī)制。同時,加強(qiáng)國際合作,推動制定形成具有國際共識的AI倫理準(zhǔn)則、安全標(biāo)準(zhǔn)和監(jiān)管框架,提升算法透明性較強(qiáng)的本土開源大模型在全球范圍內(nèi)的競爭力。

最后,強(qiáng)化領(lǐng)域法學(xué)研究,踐行協(xié)同治理理念,提升算法治理能力。AI治理橫跨法律、技術(shù)、倫理、社會等多個領(lǐng)域,具有較高的復(fù)雜性。但傳統(tǒng)法治資源供給多呈現(xiàn)碎片化,難以充分揭示并有效應(yīng)對算法“黑箱”、價值對齊失敗等新型風(fēng)險。因此,應(yīng)強(qiáng)化領(lǐng)域法學(xué)研究,整合法學(xué)、計算機(jī)科學(xué)、信息安全、認(rèn)知科學(xué)等多領(lǐng)域的研究,圍繞算法的可解釋性、可控性、公平性等關(guān)鍵問題進(jìn)行協(xié)同研究,深化對AI技術(shù)原理、運(yùn)作模式及潛在風(fēng)險的理解,尤其應(yīng)關(guān)注深度學(xué)習(xí)模型如何偏離初始目標(biāo)、規(guī)避人類指令等關(guān)鍵技術(shù)細(xì)節(jié)。為實現(xiàn)價值對齊、增強(qiáng)技術(shù)系統(tǒng)的安全性,應(yīng)協(xié)同多方治理主體積極參與算法治理,提升治理能力,從而推動科技向善,真正造福人類。

(作者單位:吉林大學(xué)法學(xué)院)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
拒絕350萬美金,再見約基奇!威少做出決定,NBA生涯之路越走越寬

拒絕350萬美金,再見約基奇!威少做出決定,NBA生涯之路越走越寬

世界體育圈
2025-06-14 10:40:55
遺憾!鄭欽文無緣決賽輸在哪?賽后統(tǒng)計一目了然,可惜了!

遺憾!鄭欽文無緣決賽輸在哪?賽后統(tǒng)計一目了然,可惜了!

大秦壁虎白話體育
2025-06-15 02:05:34
33國槍口一致對華,解放軍將迎戰(zhàn),中日軍機(jī)纏斗40分鐘,性質(zhì)嚴(yán)重

33國槍口一致對華,解放軍將迎戰(zhàn),中日軍機(jī)纏斗40分鐘,性質(zhì)嚴(yán)重

吳欣純Deborah
2025-06-13 14:51:22
未成年被保安圍毆后續(xù),原因曝光警方通報,律師:保安不必負(fù)全責(zé)

未成年被保安圍毆后續(xù),原因曝光警方通報,律師:保安不必負(fù)全責(zé)

凡知
2025-06-14 16:51:36
隨著鄭欽文1-2阿尼西莫娃,無緣女王杯決賽!爭冠對陣+時間出爐

隨著鄭欽文1-2阿尼西莫娃,無緣女王杯決賽!爭冠對陣+時間出爐

球場沒跑道
2025-06-15 00:45:22
濕氣最怕的4道菜,天熱要多吃,濕氣沒了脾胃好,一覺睡到自然醒

濕氣最怕的4道菜,天熱要多吃,濕氣沒了脾胃好,一覺睡到自然醒

秀廚娘
2025-06-14 12:30:25
伯伯酒席上罵我娘端菜慢,父親踢我娘15腳,我沒說話直接一板凳

伯伯酒席上罵我娘端菜慢,父親踢我娘15腳,我沒說話直接一板凳

風(fēng)起青萍之未
2025-06-05 17:15:46
網(wǎng)傳某工程有限公司破產(chǎn)倒閉,董事長敗光億萬資產(chǎn),負(fù)債兩千萬

網(wǎng)傳某工程有限公司破產(chǎn)倒閉,董事長敗光億萬資產(chǎn),負(fù)債兩千萬

筆尖下的人生
2025-06-14 18:09:45
62歲何賽飛現(xiàn)狀:住杭州別墅區(qū),學(xué)騎電車接地氣,與老公感情穩(wěn)定

62歲何賽飛現(xiàn)狀:住杭州別墅區(qū),學(xué)騎電車接地氣,與老公感情穩(wěn)定

墨印齋
2025-06-14 19:15:56
美國商務(wù)部長炮轟中國芯片:天天說制造先進(jìn)芯片,但中國根本沒有

美國商務(wù)部長炮轟中國芯片:天天說制造先進(jìn)芯片,但中國根本沒有

掌青說歷史
2025-06-12 15:51:23
地面至少24人遇難!印度空難細(xì)節(jié)披露:一個姿勢不尋常…女子因堵車遲到10分鐘,幸運(yùn)錯過航班

地面至少24人遇難!印度空難細(xì)節(jié)披露:一個姿勢不尋常…女子因堵車遲到10分鐘,幸運(yùn)錯過航班

上觀新聞
2025-06-13 20:37:06
賴清德暗示接受兩岸統(tǒng)一,要求北京調(diào)整對臺政策,國臺辦直接挑明

賴清德暗示接受兩岸統(tǒng)一,要求北京調(diào)整對臺政策,國臺辦直接挑明

小鬼頭體育
2025-05-21 04:35:43
38歲宋茜鎏金開衩裙刷屏!生圖驚現(xiàn)小肚腩網(wǎng)友卻狂贊:真實得可怕

38歲宋茜鎏金開衩裙刷屏!生圖驚現(xiàn)小肚腩網(wǎng)友卻狂贊:真實得可怕

傳遞滿滿正能量
2025-06-14 14:36:51
班公湖大橋正式通車,印度防線瞬間崩潰!中國布局實現(xiàn)不戰(zhàn)而勝!

班公湖大橋正式通車,印度防線瞬間崩潰!中國布局實現(xiàn)不戰(zhàn)而勝!

生活魔術(shù)專家
2025-06-14 18:46:02
缺口達(dá)萬億!機(jī)構(gòu)稱:賬期60天若嚴(yán)格實行,僅兩家車企資金安全

缺口達(dá)萬億!機(jī)構(gòu)稱:賬期60天若嚴(yán)格實行,僅兩家車企資金安全

明鏡pro
2025-06-14 07:49:02
85歲妻子沒上進(jìn)心93歲男子起訴離婚

85歲妻子沒上進(jìn)心93歲男子起訴離婚

大象新聞
2025-06-14 09:22:02
許其亮同志生平照片

許其亮同志生平照片

新京報政事兒
2025-06-08 16:11:03
從0-2到2-2,浙江絕平海港!王鈺棟下場立竿見影,25歲外援兩助攻

從0-2到2-2,浙江絕平海港!王鈺棟下場立竿見影,25歲外援兩助攻

小火箭愛體育
2025-06-14 18:00:04
北京市黨政代表團(tuán)赴內(nèi)蒙古自治區(qū)對接?xùn)|西部協(xié)作工作,尹力、殷勇與孫紹騁、王莉霞座談

北京市黨政代表團(tuán)赴內(nèi)蒙古自治區(qū)對接?xùn)|西部協(xié)作工作,尹力、殷勇與孫紹騁、王莉霞座談

新京報政事兒
2025-06-14 20:08:41
擠走撒貝寧,他成央臺“一哥”:父母來頭強(qiáng)大,難怪連登春晚

擠走撒貝寧,他成央臺“一哥”:父母來頭強(qiáng)大,難怪連登春晚

華人星光
2025-06-12 15:11:38
2025-06-15 06:04:49
民主與法制時報原創(chuàng)新聞 incentive-icons
民主與法制時報原創(chuàng)新聞
全國最有影響的法制媒體之一。
6168文章數(shù) 52246關(guān)注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業(yè)陪葬?

頭條要聞

以防長威脅哈梅內(nèi)伊:若繼續(xù)發(fā)射導(dǎo)彈 德黑蘭將成火海

頭條要聞

以防長威脅哈梅內(nèi)伊:若繼續(xù)發(fā)射導(dǎo)彈 德黑蘭將成火海

體育要聞

約戰(zhàn)天王山,步行者G4輸在了哪?

娛樂要聞

小S迎47歲生日,首個生日沒大S陪伴

財經(jīng)要聞

樓市權(quán)威發(fā)聲

汽車要聞

長城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

手機(jī)
家居
時尚
藝術(shù)
軍事航空

手機(jī)要聞

三星Galaxy Z Fold7渲染圖曝光:很輕薄、相機(jī)明顯凸起

家居要聞

森林幾何 極簡灰調(diào)原木風(fēng)

中年女人少穿黑色和灰色,年輕色穿出減齡效果,看起來嫩十歲

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

軍事要聞

伊媒:以色列國防部大樓被伊朗導(dǎo)彈擊中

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 又粗又大又硬又长又爽| 永久免费无码网站在线观看个| 日本人妻伦在线中文字幕| 最近2019好看的中文字幕免费| 久久r999热精品国产首页| 国产精品久久自在自线| 国产精品一卡二卡三卡| 菠萝蜜视频在线观看入口| 少妇av一区二区三区无码| 偷窥xxxx盗摄国产| 国产在线精品欧美日韩电影| 久拍国产在线观看| 极品少妇小泬50pthepon| 亚洲国产精品一区二区动图| 人人妻人人添人人爽日韩欧美| 日韩人妻无码精品一专区| 中文字幕人乱码中文字幕| 亚洲日本va午夜中文字幕一区| 又大又粗又爽18禁免费看| 亚洲国产精品久久久久婷婷老年| 无码一区二区三区av在线播放| 久久久久久国产精品mv| 欧美丰满老熟妇aaaa片| 日韩精品无码久久一区二区三| 91?????网站| 天堂√中文在线bt| 狠狠亚洲婷婷综合色香五月排名| 激情综合一区二区三区| 久久国产精品偷| 暖暖 免费 高清 日本 在线| 亚洲综合色自拍一区| 精品久久亚洲中文无码| 337p日本欧洲亚洲大胆裸体艺术| 亚洲欧美日韩国产精品专区| 成年美女看的黄网站色戒| 国内外精品激情刺激在线| 性xxxx视频播放免费| 亚洲中文字幕av在天堂| а√中文在线资源库| 国产无套白浆视频在线观看| 97se亚洲国产综合自在线不卡|