網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

為什么人們喜歡鑒定 AI？

2025-05-29 12:16:43　來(lái)源: 虹線

北京舉報(bào)

分享至

上周，我發(fā)了一篇。

講的是在 AI 時(shí)代，文字的消費(fèi)速度和生產(chǎn)速度終于趕上了短視頻。

那篇文章至少 80% 的文字是 AI 生成的，我在文章的結(jié)尾直接說(shuō)明了這一點(diǎn)，于是不出意外的，在評(píng)論區(qū)里至少有一半的評(píng)論在做“AI 鑒定”。

比如這個(gè)：

再比如這個(gè)：

還有這個(gè)：

相信在最近今年寫(xiě)過(guò)稿子的創(chuàng)作者對(duì)類(lèi)似這樣的 AI 鑒定評(píng)論都已經(jīng)非常熟悉了。我完全沒(méi)有針對(duì)我自己的讀者的意思，但遺憾的是，在評(píng)論區(qū)對(duì)上一篇文章具體段落進(jìn)行的 AI 鑒定幾乎全部失敗。

簡(jiǎn)單來(lái)說(shuō)，所有在上一篇文章中被指出不夠人味，不像我文風(fēng)的段落，都是我寫(xiě)的。

實(shí)際上讓我非常震驚的是，幾個(gè)指出具體段落“AI 味兒太重”的評(píng)論，精準(zhǔn)的從全篇 AI 中挑出了我自己手工改的部分。比如開(kāi)頭的第五段，還有“寫(xiě)作的 5G 時(shí)代”和“華麗墨水”的部分。

還有一些在后臺(tái)沒(méi)放出來(lái)，甚至有一位關(guān)注我 5 年以上的老讀者，在這場(chǎng)鑒定中都擲出了錯(cuò)誤的骰子，這是為什么呢？

原因可能出乎意料：AI 能夠很好的模擬我的風(fēng)格，但“真正的我”卻不一定遵循我的風(fēng)格。

我從 2013 年開(kāi)始用這個(gè) ID 發(fā)表一些作品，但至今，發(fā)表在這個(gè) ID 下的公開(kāi)文章不超過(guò) 100 篇，平均每年 8.3 篇，可以說(shuō)是一個(gè)非常低產(chǎn)的自媒體作者。當(dāng)我把我的所有文字都喂給 AI 進(jìn)行風(fēng)格學(xué)習(xí)的時(shí)候，AI 能在幾秒鐘里充分吸取這 100 篇文章的精髓，歸納其中我自己都未發(fā)現(xiàn)的規(guī)律和表達(dá)方法，最終呈現(xiàn)出比“現(xiàn)在的我”更“我”的文字。

這非常容易理解，我甚至自己去看自己 10 年前的文章都會(huì)感到非常陌生，想不出“當(dāng)時(shí)為什么會(huì)用這個(gè)詞”，但 AI 卻會(huì)將其作為“我風(fēng)格的一部分”進(jìn)行參考。

那么，AI 鑒定還有必要嗎？

鑒定 AI 毫無(wú)用處

直白來(lái)講，在我看來(lái)，鑒定內(nèi)容是否由 AI 創(chuàng)作更像是一種賽博時(shí)代的刻舟求劍。

我們不妨仍舊從我自己的文章說(shuō)起，為什么鑒定我的內(nèi)容是否由 AI 創(chuàng)作毫無(wú)意義呢？

很簡(jiǎn)單，任何以“評(píng)論尸”這個(gè) ID 發(fā)表出來(lái)的文章，無(wú)論其內(nèi)容讓你覺(jué)得“這很評(píng)論尸”還是“這味兒不對(duì)”，它都代表了我當(dāng)下的觀點(diǎn)和判斷，是我認(rèn)可并愿意署上我名字的作品。

如果它的風(fēng)格與讀者印象中的“評(píng)論尸”有所不同，原因可能有很多：可能是我最近在嘗試新的表達(dá)方式，可能是我對(duì)某個(gè)問(wèn)題的看法發(fā)生了轉(zhuǎn)變，當(dāng)然，也可能是其中一部分或大部分內(nèi)容由 AI 輔助生成。但無(wú)論如何，是我，而不是某個(gè)模型，對(duì)這篇文章的最終呈現(xiàn)負(fù)責(zé)。

即便現(xiàn)在這篇文章大部分仍舊是由 AI 生成的，你讀到的是“評(píng)論尸”的文章，而不是一份等待你批改的“AI 模仿評(píng)論尸風(fēng)格測(cè)試卷”。

而“評(píng)論尸”的文章是否對(duì)讀者有價(jià)值，并不仰仗評(píng)論尸使用什么工具寫(xiě)作——如果我持續(xù)性發(fā)布毫無(wú)價(jià)值的文章，即便每篇都是我自己手寫(xiě)的，也不可避免的會(huì)被讀者厭棄。

而這種邏輯，并不僅僅適用于個(gè)人寫(xiě)作。我們可以輕易地將其擴(kuò)展到其他更嚴(yán)肅、更需要真實(shí)性的領(lǐng)域。

比如新聞報(bào)道。

我們都痛恨假新聞，都希望媒體能提供真實(shí)、客觀的信息，AI 生成似乎從字面意義上就和“真相”相去甚遠(yuǎn)。

但是，至少稍微想一下就知道，AI 在可以制造假新聞的同時(shí)，也可以成倍速的提升真新聞的生產(chǎn)速度：記者采訪之后，甚至可以一筆不寫(xiě)，直接將錄音丟給 ChatGPT，讓它直接生成基于真實(shí)采訪和事件的真正稿子。

這樣的稿子過(guò)不了 AI 生成鑒定，但卻是實(shí)打?qū)嵉恼嫘侣劇?/p>

相反，一篇由某個(gè)“資深記者”坐在辦公室里，對(duì)著鍵盤(pán)憑空捏造、添油加醋編出來(lái)的“獨(dú)家新聞”，每一個(gè)字都是“純手工打造”，洋溢著“人味兒”，它就是真新聞了嗎？顯然不是。

在新聞?lì)I(lǐng)域，我們真正關(guān)注的，是信息的來(lái)源是否可靠，事實(shí)陳述是否準(zhǔn)確，邏輯鏈條是否完整，是否存在刻意的誤導(dǎo)和偏見(jiàn)。至于這篇稿子是記者一字一句敲出來(lái)的，還是在 AI 輔助下完成的，反而是次要問(wèn)題。

再來(lái)看看學(xué)術(shù)論文領(lǐng)域。這里似乎是 AI 鑒定的“重災(zāi)區(qū)”，畢竟學(xué)術(shù)誠(chéng)信關(guān)乎整個(gè)知識(shí)體系的根基。但同樣，簡(jiǎn)單粗暴地用“AI 生成比例”來(lái)衡量一篇論文的價(jià)值，也是一種懶惰且無(wú)效的辦法。

對(duì)于理科論文，其核心價(jià)值在于實(shí)驗(yàn)的可重復(fù)性和理論的創(chuàng)新性。一篇描述新材料、新藥物或者新算法的論文，無(wú)論寫(xiě)得多么文采飛揚(yáng)、滴水不漏，如果其他實(shí)驗(yàn)室的科學(xué)家按照論文中描述的方法，無(wú)法重復(fù)出相同或相似的實(shí)驗(yàn)結(jié)果，那么這篇論文在學(xué)術(shù)上就是站不住腳的，甚至可能是學(xué)術(shù)欺詐。

反過(guò)來(lái)說(shuō)，如果一項(xiàng)研究確實(shí)取得了突破性進(jìn)展，實(shí)驗(yàn)數(shù)據(jù)扎實(shí)可靠，邏輯推導(dǎo)嚴(yán)謹(jǐn)無(wú)誤，甚至可以被研究者完美復(fù)現(xiàn)。那么作者在撰寫(xiě)論文時(shí)，使用了 AI 工具來(lái)生成全文，會(huì)削弱其學(xué)術(shù)價(jià)值嗎？恐怕不會(huì)，甚至可能因此而獲得更多科研獎(jiǎng)項(xiàng)。

對(duì)于文科論文，情況稍有不同，但也遵循相似的邏輯。文科論文的價(jià)值，主要體現(xiàn)在其提出的觀點(diǎn)、分析框架或研究方法是否具有新穎性和啟發(fā)性，能否為我們理解世界、解決問(wèn)題提供有益的視角。

一篇文學(xué)評(píng)論，如果能對(duì)經(jīng)典作品提出令人耳目一新的解讀，發(fā)掘出前人未曾注意到的深層意涵；一篇社會(huì)學(xué)研究，如果能構(gòu)建一個(gè)更具解釋力的理論模型來(lái)分析復(fù)雜的社會(huì)現(xiàn)象；一篇經(jīng)濟(jì)學(xué)論文，如果能提出一種更精準(zhǔn)的預(yù)測(cè)方法或更有效的政策建議——這樣的論文，無(wú)論其寫(xiě)作過(guò)程是否使用 AI，都是有價(jià)值的。

以防你沒(méi)見(jiàn)過(guò)什么是外國(guó)山海經(jīng)

前段時(shí)間，在抖音和快手上都流行起了一系列 AIGC 的怪物短片，這類(lèi)抽象的怪物短視頻被中國(guó)網(wǎng)友稱(chēng)為“外國(guó)山海經(jīng)”。與那些試圖將圖像和視頻與真實(shí)世界模擬的滴水不漏的作品不同，“外國(guó)山海經(jīng)”是一系列“一眼假”的作品。

但這并不妨礙它在 Tiktok 和抖音上都收獲了數(shù)百億次的播放，原因自然是這些 AI 小視頻在實(shí)用性層面上滿足了人們?cè)诙桃曨l場(chǎng)景的原初需求——圖一樂(lè)。

這在某種程度上驗(yàn)證了我之前在《鼠巢，AIGC，可頌貓，短視頻》中的觀點(diǎn)，從實(shí)用性角度講，AI 并不需要完全模擬人類(lèi)創(chuàng)作者的風(fēng)格，因?yàn)殡S著時(shí)代變遷，人類(lèi)讀者的審美遷移可能會(huì)導(dǎo)致他們更喜歡 AI 生成的東西。

所以，繞了一圈回到最初的問(wèn)題：鑒定 AI 有用嗎？從實(shí)用性的角度看，在絕大多數(shù)情況下，這更像是一種心理安慰或者技術(shù)上的“潔癖”。一段文字、一篇報(bào)道、一份研究，其真正的價(jià)值在于它所承載的信息、思想和功能。

如果它對(duì)你有用，能給你帶來(lái)啟發(fā)，幫助你理解事物，那么它是人寫(xiě)的還是 AI 寫(xiě)的，又有多大關(guān)系呢？

我們?yōu)槭裁聪矚g鑒定 AI？

但話又說(shuō)回來(lái)了，為什么自 ChatGPT 上線以來(lái)，“AI 鑒定”類(lèi)評(píng)論總是充斥著各大社交媒體的評(píng)論區(qū)呢？

一個(gè)顯而易見(jiàn)的事實(shí)是，人們對(duì) AI 生成的內(nèi)容普遍存在一種系統(tǒng)性的偏見(jiàn)。這種偏見(jiàn)并非空穴來(lái)風(fēng)，自 2023 年以來(lái)，已經(jīng)有多項(xiàng)研究已經(jīng)證實(shí)了這一現(xiàn)象。

比如今年 3 月發(fā)表的一篇心理學(xué)論文就非常直白，標(biāo)題就叫《用戶更喜歡大語(yǔ)言模型生成的內(nèi)容——直到他們直到這是 AI 生成的》（Users Favor LLM-Generated Content—Until They Know It’s AI）。研究中指出，“當(dāng) AI 來(lái)源被揭示時(shí)，這種（對(duì) AI 內(nèi)容的）偏好會(huì)顯著降低，這表明評(píng)估性判斷受到內(nèi)容來(lái)源披露的影響，而不僅僅是其質(zhì)量?！?換句話說(shuō)，同樣的內(nèi)容，一旦被打上“AI 生成”的標(biāo)簽，就仿佛戴上了一副有色眼鏡。

在 2025 年中的另一篇論文（Ai Bias for Creative Writing: Subjective Assessment Versus Willingness to Pay），詳細(xì)描述了他們的實(shí)驗(yàn)：

他們讓參與者讀同一篇 GPT-4 寫(xiě)的故事。一組人被告知這是人類(lèi)作家寫(xiě)的，另一組則被告知是 AI 寫(xiě)的。結(jié)果，被告知是 AI 寫(xiě)的那組，對(duì)故事的評(píng)價(jià)（比如創(chuàng)意、真實(shí)感）明顯更差，盡管故事內(nèi)容完全一樣。這說(shuō)明，單單一個(gè)“AI創(chuàng)作”的標(biāo)簽，就能讓人戴上有色眼鏡，評(píng)價(jià)更苛刻。

這種偏見(jiàn)的存在，使得“AI 鑒定”行為本身就帶上了一層預(yù)設(shè)的立場(chǎng)：我們似乎總是在期待找出 AI 的“非人之處”，以印證其“不過(guò)如此”或者“終究是機(jī)器”的判斷。但問(wèn)題是，這種偏見(jiàn)從何而來(lái)？

一個(gè)可能的解釋是，這源于一種深刻的“人類(lèi)中心主義”。

在 2023 年一篇關(guān)于 AI 畫(huà)作的論文（Human perception of art in the age of artificial intelligence）中出現(xiàn)了這樣一種奇怪的現(xiàn)象：

在不告知作品來(lái)源的情況下，要求參與者選出更喜歡的一幅。參與者顯著偏好 AI 創(chuàng)作的畫(huà)作。

明確告知其中一幅是 AI 生成的，要求參與者判斷是哪一幅。參與者能顯著識(shí)別哪幅畫(huà)作是 AI 創(chuàng)作的。

這意味著，人們更喜歡 AI 畫(huà)作，但在給予提示的情況下，又能分辨 AI 畫(huà)作。

原論文沒(méi)有對(duì)這種矛盾的現(xiàn)象做出合理的解釋?zhuān)瑢⑵錃w結(jié)為“人類(lèi)中心主義”，即 AI 無(wú)法模仿人類(lèi)的某些人類(lèi)性的東西，而人可能對(duì)這類(lèi)東西具有更強(qiáng)的偏好性。

但在我看來(lái)，這可能意味著，在更廣泛的社交場(chǎng)合下，表達(dá)“我不喜歡看 AI 作品”可能是一種表演行為。

剛好，我還找到了另一項(xiàng)研究證明了這個(gè)觀點(diǎn)。2025 年的一篇名為《使用人工智能的社會(huì)評(píng)價(jià)懲罰的證據(jù)》（Evidence of a social evaluation penalty for using AI）直接指出，使用 AI 工具的個(gè)體會(huì)面臨他人對(duì)其能力和動(dòng)機(jī)的負(fù)面評(píng)價(jià)，這構(gòu)成了一種“社會(huì)評(píng)估懲罰”。

“社會(huì)評(píng)估懲罰”這一概念在研究結(jié)論中十分關(guān)鍵。他們認(rèn)為，人們之所以會(huì)負(fù)面評(píng)價(jià) AI 的使用者，部分原因在于觀察者傾向于將使用 AI 輔助的行為歸因于個(gè)人缺陷（例如能力不足或缺乏動(dòng)力），而非情境因素。這種歸因偏差，使得公開(kāi)承認(rèn)使用 AI 成為一種具有社交風(fēng)險(xiǎn)的行為。

那么反過(guò)來(lái)思考，積極參與“鑒定 AI”并成功“識(shí)破”AI 的人，又能從中獲得什么呢？答案可能并非是“我鑒定出 AI 內(nèi)容就能少被騙”，而是“我能鑒定 AI 所以我的審美水平高”。

想象一下這樣的場(chǎng)景：在社交媒體上，當(dāng)有人發(fā)布了一段疑似 AI 生成的文字或圖片時(shí)，第一個(gè)站出來(lái)準(zhǔn)確指出其“AI 痕跡”的人，往往會(huì)獲得其他用戶的點(diǎn)贊和認(rèn)同。這種認(rèn)同感，源于其展現(xiàn)出的“辨別能力”——一種在信息爆炸時(shí)代顯得尤為寶貴的素養(yǎng)。通過(guò)成功鑒定 AI，我們仿佛在宣告：“我沒(méi)有被機(jī)器愚弄，我擁有洞察真相的火眼金睛?！?這在無(wú)形中提升了其在社交網(wǎng)絡(luò)中的地位和話語(yǔ)權(quán)。

這是一種典型的，由社交動(dòng)力驅(qū)動(dòng)的，攀比行為。

本質(zhì)上也許和文化消費(fèi)主義一脈相承。

但我們不會(huì)停止表演 AI 鑒定

行文至此，我們似乎可以得出一個(gè)有些分裂但又合乎邏輯的結(jié)論：

實(shí)質(zhì)性的 AI 鑒定會(huì)消失，但 AI 鑒定表演行為將在互聯(lián)網(wǎng)上長(zhǎng)存。

實(shí)質(zhì)性 AI 鑒定，是指那些旨在維護(hù)內(nèi)容生態(tài)、論文嚴(yán)謹(jǐn)性或驗(yàn)證新聞?wù)鎮(zhèn)危o AI 內(nèi)容打上標(biāo)簽的“AI 鑒定”。

這類(lèi)鑒定的生命力可能比我們想象的要短暫，因?yàn)樗从谝粋€(gè)深刻的“AI 鑒定悖論”——AI 的成功，本質(zhì)上是對(duì)人類(lèi)智慧與創(chuàng)造模式的深度模仿。巧了，鑒定 AI 的技術(shù)也依賴于 AI。

這意味著，我們正在用一種“魔法”去對(duì)抗另一種“魔法”，用 AI 去理解和識(shí)別 AI。這場(chǎng)“矛”與“盾”的競(jìng)賽，其終點(diǎn)幾乎是注定的：AI 對(duì)人類(lèi)的模擬將日臻完美，直至達(dá)到一個(gè)連 AI 自己和人類(lèi)都難以分辨的奇點(diǎn)。到那時(shí)，試圖從技術(shù)層面精準(zhǔn)區(qū)分“人造”與“機(jī)造”的努力都將成為徒勞。

當(dāng)機(jī)器的筆觸與人類(lèi)的靈感融為一體，難分彼此之時(shí)，我們對(duì)內(nèi)容的評(píng)判標(biāo)準(zhǔn)，或許將不得不回歸到那些更樸素、更實(shí)在的維度——正如我們一開(kāi)始所討論的那樣。

一篇文字、一幅畫(huà)作、一段旋律，其價(jià)值將不再取決于它的“出身”，而是取決于它能否提供真正的信息增益，能否引發(fā)深刻的情感共鳴，能否在實(shí)用層面解決用戶的問(wèn)題。質(zhì)量、真實(shí)性、以及對(duì)消費(fèi)者的實(shí)際效用，將重新成為衡量?jī)?nèi)容好壞的黃金標(biāo)準(zhǔn)。那些試圖通過(guò)在 AI 生成內(nèi)容中“打標(biāo)簽”來(lái)維護(hù)內(nèi)容質(zhì)量的體系，最終會(huì)發(fā)現(xiàn)這是一種低效甚至無(wú)效的手段。

然而，這是否意味著“鑒定 AI”這種行為會(huì)徹底從人類(lèi)社會(huì)中消失呢？恐怕不會(huì)。

正如我在上一節(jié)提到的那樣，“鑒定 AI”早已超越了技術(shù)辨識(shí)的范疇，演化為一種復(fù)雜的社會(huì)心理學(xué)現(xiàn)象。它深深植根于人類(lèi)的心理需求和社會(huì)互動(dòng)模式之中。那種通過(guò)“識(shí)破”AI 來(lái)彰顯自身洞察力、在社交比較中獲得優(yōu)越感的驅(qū)動(dòng)力，并不會(huì)因?yàn)?AI 模仿能力的登峰造極而減弱，反而會(huì)變得越來(lái)越具有社交光環(huán)。

在未來(lái)，純粹由人類(lèi)手工創(chuàng)作的文章、繪畫(huà)、音樂(lè)，或許會(huì)像前些年受追捧的“老師傅手炒茶”一樣，成為一種稀缺的、帶有某種情懷和文化附加值的“奢侈品”。它們的存在，更多的是滿足一小部分人對(duì)“原真性”的極致追求，普通大眾或許難以企及，也未必真正需要。

但即便如此，依然會(huì)有無(wú)數(shù)人樂(lè)此不疲地在信息的海洋中搜尋 AI 的蛛絲馬跡，熱衷于發(fā)表自己的“鑒定報(bào)告”。因?yàn)樵谶@場(chǎng)游戲中，展示“我能鑒定 AI”這個(gè)姿態(tài)本身，比是否真的能準(zhǔn)確鑒定出 AI 更為重要。我自己也經(jīng)常在一些分享文章的群中“鑒定 AI”，但現(xiàn)在想來(lái)，這種行為確實(shí)只會(huì)發(fā)生在“有觀眾”的場(chǎng)合。

事實(shí)上，在 ChatGPT 上線后我發(fā)布的每篇文章都有 AI 的參與，只是參與的程度不同，其中一些也達(dá)到了 80% 的水平。但只有我主動(dòng)標(biāo)明 AIGC 的文章下面，才會(huì)出現(xiàn) AI 鑒定類(lèi)評(píng)論，這在某種程度上也驗(yàn)證了 AI 鑒定是一種表演的觀點(diǎn)。因?yàn)?AIGC 打標(biāo)是一個(gè)舞臺(tái)，只有提供了舞臺(tái)，表演才有意義。

因此，實(shí)質(zhì)性的、以技術(shù)為基礎(chǔ)的 AI 鑒定或許會(huì)在“AI 鑒定悖論”的演進(jìn)中逐漸式微，甚至消亡。但作為一種社會(huì)行為、一種心理需求的“鑒定 AI”，卻可能作為一種獨(dú)特的文化印記，長(zhǎng)久地存在于人類(lèi)與人工智能共舞的漫長(zhǎng)時(shí)代中。

這或許正是我們作為活了 700 萬(wàn)年的碳基生命，與技術(shù)現(xiàn)代性間始終無(wú)法調(diào)和的張力所在吧。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.