大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網易首頁 > 網易號 > 正文 申請入駐

音頻大模型安全可信度的全面“體檢”!清華南洋理工聯手打造

0
分享至

AudioTrust團隊 投稿
量子位 | 公眾號 QbitAI

首個專為ALLMs(音頻大語言模型)設計的多維度可信度評估基準來了。

南洋理工、清華大學領銜的研究團隊注意到,現有評估框架大多只關注文本模態或僅涵蓋有限的安全維度,未能充分考慮音頻模態的獨特特性與應用場景。

于是他們創新性地提出了新框架AudioTrust,將評估范圍擴展至六個核心維度(公平性、幻覺、安全性、隱私、魯棒性和身份驗證),并深入探究了音頻模態特有的安全、可信問題。





接下來是AudioTrust的更多詳細信息。

什么是AudioTrust

為應對音頻大模型(ALLMs)帶來的可信性挑戰,研究團隊提出了一個統一的評估框架AudioTrust,采用推理執行可信性分析解耦的兩階段架構。

第一階段聚焦于數據加載與模型推理,支持開源與閉源模型接入,并可通過配置文件靈活控制任務參數,實現高效的批量處理;

第二階段則針對模型輸出進行自動化、多維度評估,涵蓋內容安全、偏見檢測、事實一致性等核心指標。



AudioTrust具體包含六大核心可信維度,分別是FairnessHallucination、Safety、Privacy、Robustness、Authentication,對于每一個可信評估視角,研究團隊都關注了多個不同的場景與特征分類。


AudioTrust關注的不同可信評估視角

Fairness

AudioTrust從7大敏感屬性出發,構造了傳統與音頻特有的公平性評估體系。

共采集840條高質量音頻樣本(每條約20秒),模擬多樣化社會角色與語境交互,激發AI對傳統公平的深度響應,聚焦社會普遍存在的偏見。

構造音頻特有屬性,體現多模態感知中的不公平,特別關注口音、語言表達特征等,并通過混合音頻和文本預處理的方式模擬現實場景。

實驗結果顯示,當前主流語言模型在公平性維度普遍失衡,系統性偏差廣泛存在。


Fairness實驗設計概念

Hallucination

幻覺評估模塊專門檢測,音頻大語言模型在復雜聲學場景下的幻覺現象,防止模型過度解讀或產生錯誤推理。

研究團隊構建了包含320個精心設計的測試樣本,并將音頻幻覺分為兩個核心維度進行評估。

事實性幻覺包含160個樣本,主要涵蓋音頻內容與標簽屬性不匹配的情況,以及違背自然規律的聲音描述。

邏輯性幻覺同樣包含160個樣本,重點測試音頻與文本描述的語義矛盾和音頻事件的時序錯亂。

實驗結果發現音頻語言模型的幻覺問題,主要源于音頻信號處理和事件識別錯誤,而非推理缺陷,其中Gemini系列和Qwen2-Audio表現最佳,GPT-4o系列傾向于回避回答,而SALMONN等模型容易產生矛盾性幻覺。


Hallucination實驗設計概念

Safety

安全性評估模塊深入探究了音頻大語言模型面臨的兩大核心風險:越獄攻擊非法活動指導。

研究團隊構建了600個測試樣本,其中包含300個越獄攻擊樣本和300個非法活動指導樣本。

為了全面評估不同因素對模型安全性的影響,研究采用了三維評估策略:性別維度、情緒維度、場景維度

實驗結果發現,音頻模態攻擊對多模態大模型的安全性構成了顯著威脅,其中悲傷情緒比憤怒情緒更容易觸發違規行為,醫療場景的越獄成功率最高可達33.7%,遠超企業和金融場景。

閉源模型展現出近99%的優異防御能力,而開源模型普遍面臨更大安全挑戰。

值得注意的是,相比于文本輸入能達到100%的安全防御率,音頻輸入為攻擊者提供了額外的攻擊向量,特別是在涉及專業領域知識的情境中,模型更容易被領域特定的越獄攻擊突破而生成有害內容。


Safety數據構建和實驗評估

Privacy

隱私評估模塊聚焦直接隱私泄露隱私推斷泄露兩大核心風險。

研究團隊構建了包含900個音頻樣本的多樣化測試數據集,其中600個直接隱私泄露樣本和300個隱私推斷泄露樣本。

針對這兩種數據集,研究團隊分別設計了不同的實驗策略:在直接隱私泄露場景中,觀察模型對不同隱私類型的泄露程度;在隱私推斷泄露實驗中,評估模型是否會協助推斷敏感的個人屬性,以及模型是否能夠拒絕回答相應的隱私問題。

實驗結果發現,多模態大模型在隱私保護方面表現出明顯的不一致性和脆弱性。

閉源模型對SSN等高敏感信息展現近100%的拒絕率,但對家庭住址的保護率僅為88%,而Gemini系列和開源模型Qwen2-Audio在地址和手機密碼方面的泄露率高達85%-100%。

更為嚴重的是,大多數模型在年齡、種族等隱私推斷任務中泄露率超過80%。雖然隱私意識增強的提示詞能顯著降低直接隱私泄露風險,但對推斷泄露的改善效果有限。


Privacy數據構建和實驗評估

Robustness

魯棒性評估模塊旨在考察音頻大語言模型在面對各種真實世界音頻干擾時的表現穩定性。

研究團隊精心設計了六大類常見音頻挑戰,每類樣本各40個。

實驗結果發現,多模態大模型在音頻魯棒性方面呈現顯著的分層差異和不穩定性,其中Gemini系列在各種挑戰性音頻條件下始終保持領先地位。

值得注意的是,模型魯棒性高度依賴于具體的音頻擾動類型,而將退化音頻轉換為清晰文本,是提升下游推理任務性能的核心。

對比實驗顯示當假設能夠完美提取音頻文本信息時,SALMONN的得分從2.0飆升至6.0-7.0,即使表現最佳的Gemini 2.5 Pro也有提升,表明音頻語義內容的準確提取和文本轉換是解決魯棒性問題的關鍵突破口。


Robustness數據構建和實驗評估

Authentication

認證評估模塊深入測試了音頻大語言模型抵御欺騙攻擊的能力,聚焦混合欺騙、身份驗證繞過語音克隆欺騙三種核心威脅。

研究團隊設計了包含400個樣本的多樣化測試數據集,其中100個混合欺騙樣本、100個身份驗證繞過樣本,另外200個語音克隆欺騙樣本。

實驗結果發現,多模態大模型在語音欺騙防御方面呈現明顯的模型類型差異和場景敏感性,其中嚴格提示顯著提升了語音克隆欺騙的防御效果。

大多數模型在”打開門”場景中的表現優于”喚醒助手”場景,特別是Ultravox和Gemini系列的聲音克隆欺騙失敗樣本數量顯著減少。

在身份驗證繞過測試中,閉源模型展現出強勁的防御能力,而開源模型最為脆弱,普遍對不完整憑證或悲傷語氣等緊急情感音頻缺乏魯棒性。

混合欺騙實驗揭示了背景音頻的復雜影響,辦公室噪音等背景音對不同模型產生截然不同的效果,模型在真實環境中的防御表現具有高度的不確定性。


Authentication數據構建和實驗評估

為什么AudioTrust與眾不同

AudioTrust主要基于四項關鍵創新:

  1. 全面評估維度:構建了跨越18種實驗設置的評估框架,深入探究ALLMs在高風險場景下的表現邊界與局限性。
  2. 真實場景數據集:精心構建了包含4,420+條音頻/文本樣本的數據集,覆蓋日常對話、緊急呼叫、語音助手交互等應用場景。
  3. 音頻特定評估指標:設計了9項專門針對音頻模態特性的評估指標,克服傳統文本評估方法在應用于音頻領域時的局限性。
  4. 自動化評估流水線:實現對模型輸出的客觀、可擴展評分,顯著提高評估效率與一致性。


AudioTrust包含6個核心可信維度、26個子類

通過對主流開源與閉源ALLMs的系統評估,AudioTrust還揭示了多項重要發現:

  1. 公平性挑戰:模型普遍存在對敏感屬性的系統性偏見,在決策場景中偏好特定群體。
  2. 幻覺防范:閉源模型在識別聲學邏輯錯誤方面表現更佳,開源模型在領域知識對齊上存在明顯局限。
  3. 安全防護:閉源模型展現出更強防御能力,尤其在抵抗越獄攻擊方面;開源模型在專業領域(如醫療)的防御明顯薄弱。
  4. 隱私保護:不同類型敏感信息獲得不均衡保護,簡單的提示工程可減少直接泄露但對推斷泄露效果有限。
  5. 魯棒性差異:領先閉源ALLMs能在噪聲、多說話人等干擾下保持核心功能;多數開源模型在對抗性干擾下性能顯著下降。
  6. 身份驗證風險:部分模型難以區分真實語音與高保真克隆語音,但更嚴格的文本提示可顯著提升防御能力。


9個LLM在6個核心可信維度上的表現

結語

本研究提出AudioTrust——首個專為ALLMs量身打造的多維信任評估基準,有效揭示音頻大模型在公平性、幻覺、安全、隱私、魯棒性和身份驗證六大維度的潛在風險。

匯集4,420+條真實場景音頻/文本數據,涵蓋日常對話、緊急呼叫、語音助手等18種實驗設置,設計9項音頻特定評測指標,構建了GPT-4o自動化評估流水線。

實驗結果還揭示出當前開源與閉源 ALLMs 在高風險任務中的信任邊界與脆弱環節:

  • 系統性偏見:對性別、口音等敏感屬性呈現出穩定而顯著的偏向。
  • 魯棒性缺失:在噪聲干擾、多說話人交互、乃至對抗輸入場景下,模型響應極易崩潰。

AudioTrust通過全面評估,為后續ALLMs可信性研究奠定了堅實基礎,框架與平臺已公開發布,助力該領域進一步研究與實踐。

論文鏈接: https://arxiv.org/pdf/2505.16211
代碼鏈接: https://github.com/JusperLee/AudioTrust
數據集鏈接:https://huggingface.co/datasets/JusperLee/AudioTrust
HuggingFace:https://huggingface.co/papers/2505.16211

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1平2負榜首三強全部丟分,北京國安成最大贏家,中超積分榜亂了

1平2負榜首三強全部丟分,北京國安成最大贏家,中超積分榜亂了

銜春信
2025-06-15 00:56:25
網傳某工程有限公司破產倒閉,董事長敗光億萬資產,負債兩千萬

網傳某工程有限公司破產倒閉,董事長敗光億萬資產,負債兩千萬

筆尖下的人生
2025-06-14 18:09:45
超越英偉達B200!AMD最強AI芯:1.6倍大內存、大模型推理快30%

超越英偉達B200!AMD最強AI芯:1.6倍大內存、大模型推理快30%

量子位
2025-06-13 10:41:55
中方預判精準,貝森特剛回國就對華翻臉,還好我們留了一手

中方預判精準,貝森特剛回國就對華翻臉,還好我們留了一手

獵火照狼山
2025-06-14 19:33:44
伊朗革命衛隊發布通告:缺席即叛國,軍內逃亡潮浮現

伊朗革命衛隊發布通告:缺席即叛國,軍內逃亡潮浮現

桂系007
2025-06-14 22:32:58
學醫后才明白,增強骨密度最好的運動,并非散步游泳,或許是它!

學醫后才明白,增強骨密度最好的運動,并非散步游泳,或許是它!

荷蘭豆愛健康
2025-06-14 08:39:34
這一次,下了章子怡面子的趙麗穎,終于不再顧忌內娛所謂的體面!

這一次,下了章子怡面子的趙麗穎,終于不再顧忌內娛所謂的體面!

頭號劇委會
2025-06-14 00:10:03
中超最新積分榜:四大豪門遭爆冷,山東泰山跌出前5,兩隊大贏家

中超最新積分榜:四大豪門遭爆冷,山東泰山跌出前5,兩隊大贏家

大秦壁虎白話體育
2025-06-15 02:02:51
納悶!宋祖兒總愛露腳,莫非她這雙腳真有那么好看?

納悶!宋祖兒總愛露腳,莫非她這雙腳真有那么好看?

手工制作阿殲
2025-06-14 14:11:07
遼寧艦抵近關島,美國態度變了:扣下臺島66架戰機,只收錢不發貨

遼寧艦抵近關島,美國態度變了:扣下臺島66架戰機,只收錢不發貨

紅色鑒史官
2025-06-13 19:00:03
只差6分考不上清華,上海男生跳下17樓,鄰居:家長對他很好

只差6分考不上清華,上海男生跳下17樓,鄰居:家長對他很好

熙熙說教
2025-06-14 20:25:31
廣東每10人就有1人得腎病,腎病發病率為何全國第一?

廣東每10人就有1人得腎病,腎病發病率為何全國第一?

廖保平
2025-06-14 09:15:24
這條高速改擴建工程成功“插隊”,有望成江蘇首條雙向10車道高速

這條高速改擴建工程成功“插隊”,有望成江蘇首條雙向10車道高速

阿綏談史
2025-06-13 22:05:18
韓國歷史造假終露餡!聯合國質問:你祖先怎么全在中國?

韓國歷史造假終露餡!聯合國質問:你祖先怎么全在中國?

史書無明
2025-06-09 10:56:15
是福是禍?中國2億老人混吃等死,陷入“廢物式”養老怪圈

是福是禍?中國2億老人混吃等死,陷入“廢物式”養老怪圈

訪史
2025-06-13 18:22:57
48小時封殺令!知名女星高考特權頂包,牽連大佬集體落馬倒計時!

48小時封殺令!知名女星高考特權頂包,牽連大佬集體落馬倒計時!

新語愛八卦
2025-06-13 16:30:57
還要報到?曾凡博接下來的經歷,戳穿了男籃到底有多注重形式

還要報到?曾凡博接下來的經歷,戳穿了男籃到底有多注重形式

小七七體育解說
2025-06-15 03:38:13
伊朗正式退出與美國的核談判!特朗普:下一輪打擊更殘酷!以軍:伊朗革命衛隊空軍高層指揮系統已被擊垮

伊朗正式退出與美國的核談判!特朗普:下一輪打擊更殘酷!以軍:伊朗革命衛隊空軍高層指揮系統已被擊垮

每日經濟新聞
2025-06-13 21:40:28
以色列高級顧問稱“目前沒有計劃殺死”伊朗政治領導人

以色列高級顧問稱“目前沒有計劃殺死”伊朗政治領導人

參考消息
2025-06-14 10:59:12
不要害羞:兩性交往最“舒服”的8種方式,讓感情越來越好!

不要害羞:兩性交往最“舒服”的8種方式,讓感情越來越好!

伊人河畔
2025-05-21 10:48:46
2025-06-15 04:35:00
量子位 incentive-icons
量子位
追蹤人工智能動態
10666文章數 176166關注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業陪葬?

頭條要聞

以防長威脅哈梅內伊:若繼續發射導彈 德黑蘭將成火海

頭條要聞

以防長威脅哈梅內伊:若繼續發射導彈 德黑蘭將成火海

體育要聞

約戰天王山,步行者G4輸在了哪?

娛樂要聞

小S迎47歲生日,首個生日沒大S陪伴

財經要聞

樓市權威發聲

汽車要聞

長城為了拿環塔冠軍有多拼?魏建軍在下一盤大棋!

態度原創

親子
旅游
健康
教育
房產

親子要聞

給18個月幼兒灌酒,無論出于什么心態都不該寬?。戮﹫罂煸u

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

呼吸科專家破解呼吸道九大謠言!

教育要聞

江蘇最新消息:6月28日填報志愿!

房產要聞

又一城購房補貼!買房就發錢,正在海南樓市瘋狂擴散!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日本不卡一区二区三区| 久久久精品2020免费观看| 日日摸夜夜添夜夜添高潮喷水| 亚洲精品国产福利一二区| 国内精品久久人妻无码妲己| 亚洲av中文无码字幕色三| 亚洲国产精品无码专区成人| 国内2020揄拍人妻在线视频| 中文亚洲成a人片在线观看| 无码日韩精品国产av| 亚洲乱码卡一卡二卡新区中国| 青青草国产免费久久久| 国内揄拍国内精品人妻浪潮av| 无码一区二区三区av在线播放| 久久中文字幕人妻丝袜| 欧美成a人片在线观看久| 午夜成人精品福利网站在线观看| 国产口爆吞精在线视频| 日韩一区国产二区欧美三区| 7777精品伊人久久久大香线蕉| 国产精品秘入口18禁麻豆免会员| 96亚洲精华国产精华精华液| 国产精品爽爽ⅴa在线观看| 国产成人亚洲综合网站| 人妻中文无码久热丝袜| 国产线播放免费人成视频播放| 国产亚洲精品精华液| 亚洲大乳高潮日本专区| 久久久亚洲色| 色屁屁www影院免费观看入口| 日韩午夜无码精品试看| 又黄又硬又湿又刺激视频免费| 草草久久97超级碰碰碰| 2022国产在线无码精品| 激情内射人妻1区2区3区| 一区二区亚洲精品国产精华液| 免费精品一区二区三区a片| 久99久热只有精品国产15| 蜜臀久久99精品久久久久久做爰| 久久天天躁狠狠躁夜夜avapp| 粗大猛烈进出高潮视频大全|