大香大香伊人在钱线久久,亚洲日韩欧美国产高清αv,日本强伦姧人妻久久影片,亚洲国产成人欧美在线观看

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI也會“喵喵叫”:MIT團(tuán)隊(duì)讓機(jī)器學(xué)會模仿聲音

0
分享至


(來源:MIT Technology Review)

無論是描述故障汽車發(fā)動機(jī)的聲音,還是模仿鄰居家貓咪的叫聲,當(dāng)語言難以準(zhǔn)確傳達(dá)時(shí),聲音模仿反而是一種更為生動有效的表達(dá)方式。

聲音模仿就像是用隨手涂鴉來表達(dá)你眼中的景象,不同之處在于,它依靠聲道來模擬聲音,而非用鉛筆繪圖。雖然這種方式看似復(fù)雜,但其實(shí)每個(gè)人都會自然而然地這樣做。不妨親自嘗試一下,試著用你的聲音模仿救護(hù)車的警笛聲、烏鴉的叫聲或鐘聲。

受到人類交流方式和認(rèn)知科學(xué)的啟發(fā),MIT 計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室的研究人員開發(fā)出一種 AI 系統(tǒng),無需額外訓(xùn)練,即便從未“聽過”人類的聲音模仿,也能生成類似人類的聲音模仿。

為實(shí)現(xiàn)這一目標(biāo),研究人員設(shè)計(jì)了一個(gè)模擬人類聲道的系統(tǒng),能夠再現(xiàn)聲帶振動如何通過喉嚨、舌頭和嘴唇的形狀變化發(fā)出聲音。隨后,他們采用一種受認(rèn)知啟發(fā)的 AI 算法來控制該聲道模型,使其能夠根據(jù)人類在不同情境下選擇的表達(dá)方式,生成相應(yīng)的聲音模仿。

該模型能夠高效地將各種真實(shí)世界的聲音轉(zhuǎn)化為類似人類的模仿聲,包括樹葉沙沙作響、蛇的嘶嘶聲以及救護(hù)車接近時(shí)的警笛聲。此外,這一模型還可以“反向”工作,通過人類的聲音模仿推測真實(shí)世界中的聲音。這種方式類似于某些計(jì)算機(jī)視覺系統(tǒng)能夠根據(jù)草圖還原高清圖像。例如,該模型可以準(zhǔn)確地區(qū)分人類模仿貓發(fā)出的“喵喵叫”和“嘶嘶聲”。

未來,這一模型有望催生更直觀的“基于模仿”的聲音設(shè)計(jì)界面、更具擬人化特點(diǎn)的虛擬現(xiàn)實(shí) AI 角色,甚至應(yīng)用于幫助學(xué)生學(xué)習(xí)新語言的方法。

該研究的共同第一作者包括 MIT 博士生 Kartik Chandra、博士生 Karima Ma 以及本科研究員 Matthew Caren。他們指出,計(jì)算機(jī)圖形學(xué)領(lǐng)域的研究人員早已認(rèn)識到,真實(shí)感并不是視覺表達(dá)的終極目標(biāo)。例如,一幅抽象畫或孩子用蠟筆隨手涂鴉的作品,往往能與照片一樣富有表現(xiàn)力。

Chandra 表示:“過去幾十年,素描算法的進(jìn)步不僅帶來了新的藝術(shù)工具,還推動了 AI 和計(jì)算機(jī)視覺的突破,甚至深化了我們對人類認(rèn)知的理解。正如素描是對圖像的抽象和非真實(shí)寫實(shí)的表現(xiàn)形式,我們的方法同樣捕捉了人類在表達(dá)所聽聲音時(shí)的抽象、通過擬聲詞等語言來形容的方式。這讓我們得以更深入地理解聽覺抽象的過程。”

Matthew Caren 對此補(bǔ)充道:“這個(gè)項(xiàng)目旨在理解聲音模仿的本質(zhì),并通過計(jì)算機(jī)模型對其進(jìn)行模擬。我們將聲音模仿視為聽覺領(lǐng)域中類似于‘視覺領(lǐng)域素描’的一種表達(dá)方式。”



模仿藝術(shù)三步走

研究團(tuán)隊(duì)開發(fā)了三個(gè)層次逐步遞進(jìn)的模型版本,以便將其與人類的聲音模仿進(jìn)行比較。首先,他們構(gòu)建了一個(gè)基線模型,旨在盡可能生成與真實(shí)世界聲音相似的模仿聲音。然而,這個(gè)模型與人類的模仿方式存在較大差距。

接著,研究人員設(shè)計(jì)了一個(gè)溝通型模型。根據(jù) Caren 的解釋,這個(gè)模型會考慮聽眾對某種聲音的獨(dú)特感知特征。例如,你可能會通過模仿引擎的轟鳴聲來表現(xiàn)摩托艇的聲音,因?yàn)檫@種聲音最具辨識度,盡管它可能不是最響亮的部分,如水花四濺的聲音。這個(gè)改進(jìn)后的模型生成的聲音模仿比基線模型更貼近人類的表達(dá)方式,但研究團(tuán)隊(duì)仍希望進(jìn)一步優(yōu)化。

為此,研究人員在模型中引入了推理層。Chandra 表示:“聲音模仿的效果會受到投入的努力程度影響。要生成完全準(zhǔn)確的聲音,需要付出時(shí)間和精力。”因此,升級后的模型會避免產(chǎn)生過于快速、響亮或音調(diào)極高或極低的聲音,因?yàn)槿藗冊谌粘υ捴型ǔ2粫@樣表達(dá)。最終,這一改進(jìn)模型生成的聲音模仿更加符合人類特點(diǎn),更真實(shí)地反映了人們在模仿同一聲音時(shí)所做出的選擇。

在模型構(gòu)建完成后,研究團(tuán)隊(duì)開展了一項(xiàng)行為實(shí)驗(yàn),測試人類評審如何看待 AI 生成與人類生成的聲音模仿,并評估哪種更受歡迎。值得注意的是,實(shí)驗(yàn)結(jié)果顯示,參與者在25%的情況下更偏好 AI 模型生成的聲音。尤其是在模仿摩托艇聲音時(shí),AI 模型的偏好率高達(dá) 75%,而在模仿槍聲時(shí),這一偏好率達(dá)到 50%。



邁向更具表現(xiàn)力的聲音技術(shù)

Caren 對音樂和藝術(shù)領(lǐng)域的技術(shù)充滿熱情,他設(shè)想這一模型可以幫助藝術(shù)家更高效地與計(jì)算系統(tǒng)溝通聲音,并為電影制作人和其他內(nèi)容創(chuàng)作者提供更貼合特定情境的細(xì)膩AI聲音。這項(xiàng)技術(shù)還可能使音樂家通過模仿那些難以用文字描述的聲音,快速檢索聲音數(shù)據(jù)庫,提升創(chuàng)作效率。

與此同時(shí),Caren、Chandra和 Ma 正積極探索該模型在其他領(lǐng)域的潛在應(yīng)用,例如語言的發(fā)展過程、嬰兒如何學(xué)習(xí)說話,甚至是鸚鵡和鳴禽等鳥類的模仿行為。

不過,該模型的當(dāng)前版本仍有改進(jìn)空間。例如,它在處理某些如“z”的輔音時(shí)存在困難,導(dǎo)致對蜜蜂嗡嗡聲等聲音的模仿不夠準(zhǔn)確。此外,該模型尚無法復(fù)現(xiàn)人類對語音、音樂,或在不同語言中對某些聲音,比如心跳聲,進(jìn)行不同方式模仿的能力。

斯坦福大學(xué)語言學(xué)教授 Robert Hawkins 指出,語言中充滿了擬聲詞和模仿但并不完全復(fù)制所描述事物的詞匯,比如 “meow” 這個(gè)詞與貓咪真實(shí)的叫聲就不完全一致。Hawkins 表示:“從真實(shí)的貓叫聲到 ‘meow’ 這個(gè)詞的形成過程,揭示了在語言進(jìn)化中生理機(jī)制、社會推理和交流之間復(fù)雜的相互作用。” Hawkins 并未參與這項(xiàng)研究,但他認(rèn)為:“這個(gè)模型是將這些過程的理論形式化并加以驗(yàn)證的重要一步,展示了人類聲道的物理限制和社交交流的壓力共同作用,解釋了聲音模仿的分布現(xiàn)象。”

Caren、Chandra 和 Ma 與另外兩位 MIT 計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室的成員共同撰寫了這篇論文,他們是 MIT 電氣工程與計(jì)算機(jī)科學(xué)系副教授 Jonathan Ragan-Kelley,以及MIT 大腦與認(rèn)知科學(xué)系教授、Brains, Minds, and Machines 中心成員 Joshua Tenenbaum。該研究得到了赫茲基金會和美國國家科學(xué)基金會的部分資助,并在 12 月初發(fā)表在 SIGGRAPH Asia 會議上。

https://news.mit.edu/2025/teaching-ai-communicate-sounds-humans-do-0109

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
開始衰老的 6 個(gè)跡象,如果一個(gè)不占,說明你很年輕

開始衰老的 6 個(gè)跡象,如果一個(gè)不占,說明你很年輕

增肌減脂
2025-06-12 15:10:03
成也亂打,敗也亂打,步行者距離3-1領(lǐng)先雷霆,就差1次“剎車”

成也亂打,敗也亂打,步行者距離3-1領(lǐng)先雷霆,就差1次“剎車”

看球老人
2025-06-14 15:46:35
瑜伽褲女神,背影殺+瑜伽短褲,視覺沖擊拉滿!

瑜伽褲女神,背影殺+瑜伽短褲,視覺沖擊拉滿!

云端小院
2025-06-14 09:13:11
澳洲不是美國跟屁蟲!澳總理:吃中國飯賺中國錢,不能砸中國的鍋

澳洲不是美國跟屁蟲!澳總理:吃中國飯賺中國錢,不能砸中國的鍋

愛下廚的阿釃
2025-06-14 14:10:37
血戰(zhàn)俄城!哈里伯頓:G5的現(xiàn)場將會充滿敵意 我們必須做好準(zhǔn)備

血戰(zhàn)俄城!哈里伯頓:G5的現(xiàn)場將會充滿敵意 我們必須做好準(zhǔn)備

直播吧
2025-06-14 16:05:04
中美談判桌上的“連環(huán)計(jì)”,王文濤外交新招:一周讓中美關(guān)系生變

中美談判桌上的“連環(huán)計(jì)”,王文濤外交新招:一周讓中美關(guān)系生變

任紀(jì)煙
2025-06-13 11:50:18
CCTV5直播中超延遲20分鐘,信譽(yù)與權(quán)威受質(zhì)疑

CCTV5直播中超延遲20分鐘,信譽(yù)與權(quán)威受質(zhì)疑

老慃尾聲體育解說
2025-06-14 13:52:37
羅帥宇家屬多次拒絕和長沙警方見面!對方想要遺留的電腦和手機(jī)

羅帥宇家屬多次拒絕和長沙警方見面!對方想要遺留的電腦和手機(jī)

奇思妙想草葉君
2025-06-13 22:59:36
騰訊打出「AI崗位薪酬不限」的底氣來自哪?

騰訊打出「AI崗位薪酬不限」的底氣來自哪?

機(jī)器之心Pro
2025-06-13 14:14:12
攻勢迅猛的熱辣素人,擁有黃金比例的女神—Solazola

攻勢迅猛的熱辣素人,擁有黃金比例的女神—Solazola

吃瓜黨二號頭目
2025-06-14 12:06:45
事實(shí)證明不是敘利亞軍隊(duì)不能打,而是前總統(tǒng)巴沙爾能力太差!

事實(shí)證明不是敘利亞軍隊(duì)不能打,而是前總統(tǒng)巴沙爾能力太差!

凱撒談兵
2025-03-09 18:20:12
上海一女子,在封閉陽臺用200個(gè)礦泉水瓶種菜,實(shí)現(xiàn)了蔬菜自由

上海一女子,在封閉陽臺用200個(gè)礦泉水瓶種菜,實(shí)現(xiàn)了蔬菜自由

小嵩
2025-06-02 10:32:36
一切才剛開始!24/25賽季結(jié)束僅13天,皇馬已換新帥+1億豪購3強(qiáng)援

一切才剛開始!24/25賽季結(jié)束僅13天,皇馬已換新帥+1億豪購3強(qiáng)援

直播吧
2025-06-14 09:02:29
江蘇一男子吃酒席得了1包好煙,他拿到小賣部想給老婆換點(diǎn)吃的,誰料,老板娘得知原因后不禁淚目

江蘇一男子吃酒席得了1包好煙,他拿到小賣部想給老婆換點(diǎn)吃的,誰料,老板娘得知原因后不禁淚目

不二大叔
2025-06-10 21:46:43
伊朗“圣城旅”指揮官被定點(diǎn)清除 與哈梅內(nèi)伊握手的都已喪生

伊朗“圣城旅”指揮官被定點(diǎn)清除 與哈梅內(nèi)伊握手的都已喪生

桑未落
2025-06-14 13:32:43
8億千金餐廳內(nèi)與友人輪住食一支煙,片段流出后疑再公審拍片者

8億千金餐廳內(nèi)與友人輪住食一支煙,片段流出后疑再公審拍片者

粵睇先生
2025-06-14 14:43:59
加長,7座,大號Model Y真要來了

加長,7座,大號Model Y真要來了

小怪吃美食
2025-06-13 18:37:14
我偷偷將岳母床頭的避孕藥,換成維生素,3月后她下腹微凸釀成慘劇

我偷偷將岳母床頭的避孕藥,換成維生素,3月后她下腹微凸釀成慘劇

星宇共鳴
2025-06-07 12:16:14
外圍崩了!昨晚歐美股市全線大跌,中概股重挫,原油大漲近8%!

外圍崩了!昨晚歐美股市全線大跌,中概股重挫,原油大漲近8%!

小舟談歷史
2025-06-14 09:40:38
養(yǎng)傷248天!皇馬27冠巨星回來了:復(fù)出訓(xùn)練,能趕上世俱杯

養(yǎng)傷248天!皇馬27冠巨星回來了:復(fù)出訓(xùn)練,能趕上世俱杯

葉青足球世界
2025-06-13 15:58:32
2025-06-14 16:23:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨(dú)家合作
15292文章數(shù) 513779關(guān)注度
往期回顧 全部

科技要聞

一輛新車比特斯拉FSD都便宜,全行業(yè)陪葬?

頭條要聞

伊朗出手15分鐘內(nèi)3次導(dǎo)彈齊射 被指計(jì)劃打擊美軍基地

頭條要聞

伊朗出手15分鐘內(nèi)3次導(dǎo)彈齊射 被指計(jì)劃打擊美軍基地

體育要聞

32隊(duì)爭10億獎(jiǎng)金,全新世俱杯來了!

娛樂要聞

鳳凰傳奇曾毅手表引爭議 含性暗示元素

財(cái)經(jīng)要聞

樓市權(quán)威發(fā)聲

汽車要聞

長城為了拿環(huán)塔冠軍有多拼?魏建軍在下一盤大棋!

態(tài)度原創(chuàng)

房產(chǎn)
手機(jī)
本地
公開課
軍事航空

房產(chǎn)要聞

又一城購房補(bǔ)貼!買房就發(fā)錢,正在海南樓市瘋狂擴(kuò)散!

手機(jī)要聞

6499元起!華為Pura 80 Pro/Pro+今日首銷:標(biāo)配麒麟9020

本地新聞

最近的打工人,都在熬夜看這劇逐幀學(xué)習(xí)職場小技巧

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊媒:以色列國防部大樓被伊朗導(dǎo)彈擊中

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲日韩成人无码不卡网站| 97国产婷婷综合在线视频| 五月丁香六月激情综合在线视频| 丰满少妇女裸体bbw| 亚洲欧洲日产国码中文字幕| 呻吟国产av久久一区二区| 久久亚洲精品无码av| 少妇无码太爽了在线播放| 久久综合综合久久高清免费| 天天做天天爱夜夜爽毛片毛片| 99国产欧美久久久精品蜜芽| 无码区日韩特区永久免费系列| 国产精品成人网址在线观看| 亚洲国产精品无码久久久久高潮| 亚洲中文字幕在线观看| 精品伊人久久久99热这里只| 国产亚洲精品久久久久久打不开| 亚洲一区二区三区国产精品无码| 亚洲乱码国产一区三区| 免费国产成人高清在线视频| 国产精品久线在线观看| 久久强奷乱码老熟女网站| 一本色道久久99一综合| 777精品久无码人妻蜜桃| 在线va免费看成| 国产精品乱码人妻一区二区三区| 免费午夜无码18禁无码影视| 欧美人妻日韩精品| 无码欧精品亚洲日韩一区| 日本欧美视频在线观看三区| 欧美丰满老熟妇aaaa片| 天天噜日日噜狠狠噜免费| 中文成人久久久久影院免费观看| 人妻激情偷乱一区二区三区| 亚洲成av人在线观看天堂无码| 精品久久久无码中文字幕天天| 撕开奶罩揉吮奶头视频| 久久久久四虎精品免费入口| 国产成人综合久久精品免费| 成人精品一区二区三区在线观看| 天天夜碰日日摸日日澡|