上周,我發(fā)了一篇 。
講的是在 AI 時(shí)代,文字的消費(fèi)速度和生產(chǎn)速度終于趕上了短視頻。
那篇文章至少 80% 的文字是 AI 生成的,我在文章的結(jié)尾直接說(shuō)明了這一點(diǎn),于是不出意外的,在評(píng)論區(qū)里至少有一半的評(píng)論在做“AI 鑒定”。
比如這個(gè):
再比如這個(gè):
還有這個(gè):
相信在最近今年寫(xiě)過(guò)稿子的創(chuàng)作者對(duì)類(lèi)似這樣的 AI 鑒定評(píng)論都已經(jīng)非常熟悉了。我完全沒(méi)有針對(duì)我自己的讀者的意思,但遺憾的是,在評(píng)論區(qū)對(duì)上一篇文章具體段落進(jìn)行的 AI 鑒定幾乎全部失敗。
簡(jiǎn)單來(lái)說(shuō),所有在上一篇文章中被指出不夠人味,不像我文風(fēng)的段落,都是我寫(xiě)的。
實(shí)際上讓我非常震驚的是,幾個(gè)指出具體段落“AI 味兒太重”的評(píng)論,精準(zhǔn)的從全篇 AI 中挑出了我自己手工改的部分。比如開(kāi)頭的第五段,還有“寫(xiě)作的 5G 時(shí)代”和“華麗墨水”的部分。
還有一些在后臺(tái)沒(méi)放出來(lái),甚至有一位關(guān)注我 5 年以上的老讀者,在這場(chǎng)鑒定中都擲出了錯(cuò)誤的骰子,這是為什么呢?
原因可能出乎意料:AI 能夠很好的模擬我的風(fēng)格,但“真正的我”卻不一定遵循我的風(fēng)格。
我從 2013 年開(kāi)始用這個(gè) ID 發(fā)表一些作品,但至今,發(fā)表在這個(gè) ID 下的公開(kāi)文章不超過(guò) 100 篇,平均每年 8.3 篇,可以說(shuō)是一個(gè)非常低產(chǎn)的自媒體作者。當(dāng)我把我的所有文字都喂給 AI 進(jìn)行風(fēng)格學(xué)習(xí)的時(shí)候,AI 能在幾秒鐘里充分吸取這 100 篇文章的精髓,歸納其中我自己都未發(fā)現(xiàn)的規(guī)律和表達(dá)方法,最終呈現(xiàn)出比“現(xiàn)在的我”更“我”的文字。
這非常容易理解,我甚至自己去看自己 10 年前的文章都會(huì)感到非常陌生,想不出“當(dāng)時(shí)為什么會(huì)用這個(gè)詞”,但 AI 卻會(huì)將其作為“我風(fēng)格的一部分”進(jìn)行參考。
那么,AI 鑒定還有必要嗎?
鑒定 AI 毫無(wú)用處
直白來(lái)講,在我看來(lái),鑒定內(nèi)容是否由 AI 創(chuàng)作更像是一種賽博時(shí)代的刻舟求劍。
我們不妨仍舊從我自己的文章說(shuō)起,為什么鑒定我的內(nèi)容是否由 AI 創(chuàng)作毫無(wú)意義呢?
很簡(jiǎn)單,任何以“評(píng)論尸”這個(gè) ID 發(fā)表出來(lái)的文章,無(wú)論其內(nèi)容讓你覺(jué)得“這很評(píng)論尸”還是“這味兒不對(duì)”,它都代表了我當(dāng)下的觀點(diǎn)和判斷,是我認(rèn)可并愿意署上我名字的作品。
如果它的風(fēng)格與讀者印象中的“評(píng)論尸”有所不同,原因可能有很多:可能是我最近在嘗試新的表達(dá)方式,可能是我對(duì)某個(gè)問(wèn)題的看法發(fā)生了轉(zhuǎn)變,當(dāng)然,也可能是其中一部分或大部分內(nèi)容由 AI 輔助生成。但無(wú)論如何,是我,而不是某個(gè)模型,對(duì)這篇文章的最終呈現(xiàn)負(fù)責(zé)。
即便現(xiàn)在這篇文章大部分仍舊是由 AI 生成的,你讀到的是“評(píng)論尸”的文章,而不是一份等待你批改的“AI 模仿評(píng)論尸風(fēng)格測(cè)試卷”。
而“評(píng)論尸”的文章是否對(duì)讀者有價(jià)值,并不仰仗評(píng)論尸使用什么工具寫(xiě)作——如果我持續(xù)性發(fā)布毫無(wú)價(jià)值的文章,即便每篇都是我自己手寫(xiě)的,也不可避免的會(huì)被讀者厭棄。
而這種邏輯,并不僅僅適用于個(gè)人寫(xiě)作。我們可以輕易地將其擴(kuò)展到其他更嚴(yán)肅、更需要真實(shí)性的領(lǐng)域。
比如新聞報(bào)道。
我們都痛恨假新聞,都希望媒體能提供真實(shí)、客觀的信息,AI 生成似乎從字面意義上就和“真相”相去甚遠(yuǎn)。
但是,至少稍微想一下就知道,AI 在可以制造假新聞的同時(shí),也可以成倍速的提升真新聞的生產(chǎn)速度:記者采訪之后,甚至可以一筆不寫(xiě),直接將錄音丟給 ChatGPT,讓它直接生成基于真實(shí)采訪和事件的真正稿子。
這樣的稿子過(guò)不了 AI 生成鑒定,但卻是實(shí)打?qū)嵉恼嫘侣劇?/p>
相反,一篇由某個(gè)“資深記者”坐在辦公室里,對(duì)著鍵盤(pán)憑空捏造、添油加醋編出來(lái)的“獨(dú)家新聞”,每一個(gè)字都是“純手工打造”,洋溢著“人味兒”,它就是真新聞了嗎?顯然不是。
在新聞?lì)I(lǐng)域,我們真正關(guān)注的,是信息的來(lái)源是否可靠,事實(shí)陳述是否準(zhǔn)確,邏輯鏈條是否完整,是否存在刻意的誤導(dǎo)和偏見(jiàn)。至于這篇稿子是記者一字一句敲出來(lái)的,還是在 AI 輔助下完成的,反而是次要問(wèn)題。
再來(lái)看看學(xué)術(shù)論文領(lǐng)域。這里似乎是 AI 鑒定的“重災(zāi)區(qū)”,畢竟學(xué)術(shù)誠(chéng)信關(guān)乎整個(gè)知識(shí)體系的根基。但同樣,簡(jiǎn)單粗暴地用“AI 生成比例”來(lái)衡量一篇論文的價(jià)值,也是一種懶惰且無(wú)效的辦法。
對(duì)于理科論文,其核心價(jià)值在于實(shí)驗(yàn)的可重復(fù)性和理論的創(chuàng)新性。一篇描述新材料、新藥物或者新算法的論文,無(wú)論寫(xiě)得多么文采飛揚(yáng)、滴水不漏,如果其他實(shí)驗(yàn)室的科學(xué)家按照論文中描述的方法,無(wú)法重復(fù)出相同或相似的實(shí)驗(yàn)結(jié)果,那么這篇論文在學(xué)術(shù)上就是站不住腳的,甚至可能是學(xué)術(shù)欺詐。
反過(guò)來(lái)說(shuō),如果一項(xiàng)研究確實(shí)取得了突破性進(jìn)展,實(shí)驗(yàn)數(shù)據(jù)扎實(shí)可靠,邏輯推導(dǎo)嚴(yán)謹(jǐn)無(wú)誤,甚至可以被研究者完美復(fù)現(xiàn)。那么作者在撰寫(xiě)論文時(shí),使用了 AI 工具來(lái)生成全文,會(huì)削弱其學(xué)術(shù)價(jià)值嗎?恐怕不會(huì),甚至可能因此而獲得更多科研獎(jiǎng)項(xiàng)。
對(duì)于文科論文,情況稍有不同,但也遵循相似的邏輯。文科論文的價(jià)值,主要體現(xiàn)在其提出的觀點(diǎn)、分析框架或研究方法是否具有新穎性和啟發(fā)性,能否為我們理解世界、解決問(wèn)題提供有益的視角。
一篇文學(xué)評(píng)論,如果能對(duì)經(jīng)典作品提出令人耳目一新的解讀,發(fā)掘出前人未曾注意到的深層意涵;一篇社會(huì)學(xué)研究,如果能構(gòu)建一個(gè)更具解釋力的理論模型來(lái)分析復(fù)雜的社會(huì)現(xiàn)象;一篇經(jīng)濟(jì)學(xué)論文,如果能提出一種更精準(zhǔn)的預(yù)測(cè)方法或更有效的政策建議——這樣的論文,無(wú)論其寫(xiě)作過(guò)程是否使用 AI,都是有價(jià)值的。
以防你沒(méi)見(jiàn)過(guò)什么是外國(guó)山海經(jīng)
前段時(shí)間,在抖音和快手上都流行起了一系列 AIGC 的怪物短片,這類(lèi)抽象的怪物短視頻被中國(guó)網(wǎng)友稱(chēng)為“外國(guó)山海經(jīng)”。與那些試圖將圖像和視頻與真實(shí)世界模擬的滴水不漏的作品不同,“外國(guó)山海經(jīng)”是一系列“一眼假”的作品。
但這并不妨礙它在 Tiktok 和抖音上都收獲了數(shù)百億次的播放,原因自然是這些 AI 小視頻在實(shí)用性層面上滿足了人們?cè)诙桃曨l場(chǎng)景的原初需求——圖一樂(lè)。
這在某種程度上驗(yàn)證了我之前在《鼠巢,AIGC,可頌貓,短視頻》中的觀點(diǎn),從實(shí)用性角度講,AI 并不需要完全模擬人類(lèi)創(chuàng)作者的風(fēng)格,因?yàn)殡S著時(shí)代變遷,人類(lèi)讀者的審美遷移可能會(huì)導(dǎo)致他們更喜歡 AI 生成的東西。
所以,繞了一圈回到最初的問(wèn)題:鑒定 AI 有用嗎?從實(shí)用性的角度看,在絕大多數(shù)情況下,這更像是一種心理安慰或者技術(shù)上的“潔癖”。一段文字、一篇報(bào)道、一份研究,其真正的價(jià)值在于它所承載的信息、思想和功能。
如果它對(duì)你有用,能給你帶來(lái)啟發(fā),幫助你理解事物,那么它是人寫(xiě)的還是 AI 寫(xiě)的,又有多大關(guān)系呢?
我們?yōu)槭裁聪矚g鑒定 AI?
但話又說(shuō)回來(lái)了,為什么自 ChatGPT 上線以來(lái),“AI 鑒定”類(lèi)評(píng)論總是充斥著各大社交媒體的評(píng)論區(qū)呢?
一個(gè)顯而易見(jiàn)的事實(shí)是,人們對(duì) AI 生成的內(nèi)容普遍存在一種系統(tǒng)性的偏見(jiàn)。這種偏見(jiàn)并非空穴來(lái)風(fēng),自 2023 年以來(lái),已經(jīng)有多項(xiàng)研究已經(jīng)證實(shí)了這一現(xiàn)象。
比如今年 3 月發(fā)表的一篇心理學(xué)論文就非常直白,標(biāo)題就叫《用戶更喜歡大語(yǔ)言模型生成的內(nèi)容——直到他們直到這是 AI 生成的》(Users Favor LLM-Generated Content—Until They Know It’s AI)。研究中指出,“當(dāng) AI 來(lái)源被揭示時(shí),這種(對(duì) AI 內(nèi)容的)偏好會(huì)顯著降低,這表明評(píng)估性判斷受到內(nèi)容來(lái)源披露的影響,而不僅僅是其質(zhì)量?!?換句話說(shuō),同樣的內(nèi)容,一旦被打上“AI 生成”的標(biāo)簽,就仿佛戴上了一副有色眼鏡。
在 2025 年中的另一篇論文(Ai Bias for Creative Writing: Subjective Assessment Versus Willingness to Pay),詳細(xì)描述了他們的實(shí)驗(yàn):
他們讓參與者讀同一篇 GPT-4 寫(xiě)的故事。一組人被告知這是人類(lèi)作家寫(xiě)的,另一組則被告知是 AI 寫(xiě)的。結(jié)果,被告知是 AI 寫(xiě)的那組,對(duì)故事的評(píng)價(jià)(比如創(chuàng)意、真實(shí)感)明顯更差,盡管故事內(nèi)容完全一樣。這說(shuō)明,單單一個(gè)“AI創(chuàng)作”的標(biāo)簽,就能讓人戴上有色眼鏡,評(píng)價(jià)更苛刻。
這種偏見(jiàn)的存在,使得“AI 鑒定”行為本身就帶上了一層預(yù)設(shè)的立場(chǎng):我們似乎總是在期待找出 AI 的“非人之處”,以印證其“不過(guò)如此”或者“終究是機(jī)器”的判斷。但問(wèn)題是,這種偏見(jiàn)從何而來(lái)?
一個(gè)可能的解釋是,這源于一種深刻的“人類(lèi)中心主義”。
在 2023 年一篇關(guān)于 AI 畫(huà)作的論文(Human perception of art in the age of artificial intelligence)中出現(xiàn)了這樣一種奇怪的現(xiàn)象:
在不告知作品來(lái)源的情況下,要求參與者選出更喜歡的一幅。參與者顯著偏好 AI 創(chuàng)作的畫(huà)作。
明確告知其中一幅是 AI 生成的,要求參與者判斷是哪一幅。參與者能顯著識(shí)別哪幅畫(huà)作是 AI 創(chuàng)作的。
這意味著,人們更喜歡 AI 畫(huà)作,但在給予提示的情況下,又能分辨 AI 畫(huà)作。
原論文沒(méi)有對(duì)這種矛盾的現(xiàn)象做出合理的解釋?zhuān)瑢⑵錃w結(jié)為“人類(lèi)中心主義”,即 AI 無(wú)法模仿人類(lèi)的某些人類(lèi)性的東西,而人可能對(duì)這類(lèi)東西具有更強(qiáng)的偏好性。
但在我看來(lái),這可能意味著,在更廣泛的社交場(chǎng)合下,表達(dá)“我不喜歡看 AI 作品”可能是一種表演行為。
剛好,我還找到了另一項(xiàng)研究證明了這個(gè)觀點(diǎn)。2025 年的一篇名為《使用人工智能的社會(huì)評(píng)價(jià)懲罰的證據(jù)》(Evidence of a social evaluation penalty for using AI)直接指出,使用 AI 工具的個(gè)體會(huì)面臨他人對(duì)其能力和動(dòng)機(jī)的負(fù)面評(píng)價(jià),這構(gòu)成了一種“社會(huì)評(píng)估懲罰”。
“社會(huì)評(píng)估懲罰”這一概念在研究結(jié)論中十分關(guān)鍵。他們認(rèn)為,人們之所以會(huì)負(fù)面評(píng)價(jià) AI 的使用者,部分原因在于觀察者傾向于將使用 AI 輔助的行為歸因于個(gè)人缺陷(例如能力不足或缺乏動(dòng)力),而非情境因素。這種歸因偏差,使得公開(kāi)承認(rèn)使用 AI 成為一種具有社交風(fēng)險(xiǎn)的行為。
那么反過(guò)來(lái)思考,積極參與“鑒定 AI”并成功“識(shí)破”AI 的人,又能從中獲得什么呢?答案可能并非是“我鑒定出 AI 內(nèi)容就能少被騙”,而是“我能鑒定 AI 所以我的審美水平高”。
想象一下這樣的場(chǎng)景:在社交媒體上,當(dāng)有人發(fā)布了一段疑似 AI 生成的文字或圖片時(shí),第一個(gè)站出來(lái)準(zhǔn)確指出其“AI 痕跡”的人,往往會(huì)獲得其他用戶的點(diǎn)贊和認(rèn)同。這種認(rèn)同感,源于其展現(xiàn)出的“辨別能力”——一種在信息爆炸時(shí)代顯得尤為寶貴的素養(yǎng)。通過(guò)成功鑒定 AI,我們仿佛在宣告:“我沒(méi)有被機(jī)器愚弄,我擁有洞察真相的火眼金睛?!?這在無(wú)形中提升了其在社交網(wǎng)絡(luò)中的地位和話語(yǔ)權(quán)。
這是一種典型的,由社交動(dòng)力驅(qū)動(dòng)的,攀比行為。
本質(zhì)上也許和文化消費(fèi)主義一脈相承。
但我們不會(huì)停止表演 AI 鑒定
行文至此,我們似乎可以得出一個(gè)有些分裂但又合乎邏輯的結(jié)論:
實(shí)質(zhì)性的 AI 鑒定會(huì)消失,但 AI 鑒定表演行為將在互聯(lián)網(wǎng)上長(zhǎng)存。
實(shí)質(zhì)性 AI 鑒定,是指那些旨在維護(hù)內(nèi)容生態(tài)、論文嚴(yán)謹(jǐn)性或驗(yàn)證新聞?wù)鎮(zhèn)危o AI 內(nèi)容打上標(biāo)簽的“AI 鑒定”。
這類(lèi)鑒定的生命力可能比我們想象的要短暫,因?yàn)樗从谝粋€(gè)深刻的“AI 鑒定悖論”——AI 的成功,本質(zhì)上是對(duì)人類(lèi)智慧與創(chuàng)造模式的深度模仿。巧了,鑒定 AI 的技術(shù)也依賴于 AI。
這意味著,我們正在用一種“魔法”去對(duì)抗另一種“魔法”,用 AI 去理解和識(shí)別 AI。這場(chǎng)“矛”與“盾”的競(jìng)賽,其終點(diǎn)幾乎是注定的:AI 對(duì)人類(lèi)的模擬將日臻完美,直至達(dá)到一個(gè)連 AI 自己和人類(lèi)都難以分辨的奇點(diǎn)。到那時(shí),試圖從技術(shù)層面精準(zhǔn)區(qū)分“人造”與“機(jī)造”的努力都將成為徒勞。
當(dāng)機(jī)器的筆觸與人類(lèi)的靈感融為一體,難分彼此之時(shí),我們對(duì)內(nèi)容的評(píng)判標(biāo)準(zhǔn),或許將不得不回歸到那些更樸素、更實(shí)在的維度——正如我們一開(kāi)始所討論的那樣。
一篇文字、一幅畫(huà)作、一段旋律,其價(jià)值將不再取決于它的“出身”,而是取決于它能否提供真正的信息增益,能否引發(fā)深刻的情感共鳴,能否在實(shí)用層面解決用戶的問(wèn)題。質(zhì)量、真實(shí)性、以及對(duì)消費(fèi)者的實(shí)際效用,將重新成為衡量?jī)?nèi)容好壞的黃金標(biāo)準(zhǔn)。那些試圖通過(guò)在 AI 生成內(nèi)容中“打標(biāo)簽”來(lái)維護(hù)內(nèi)容質(zhì)量的體系,最終會(huì)發(fā)現(xiàn)這是一種低效甚至無(wú)效的手段。
然而,這是否意味著“鑒定 AI”這種行為會(huì)徹底從人類(lèi)社會(huì)中消失呢?恐怕不會(huì)。
正如我在上一節(jié)提到的那樣,“鑒定 AI”早已超越了技術(shù)辨識(shí)的范疇,演化為一種復(fù)雜的社會(huì)心理學(xué)現(xiàn)象。它深深植根于人類(lèi)的心理需求和社會(huì)互動(dòng)模式之中。那種通過(guò)“識(shí)破”AI 來(lái)彰顯自身洞察力、在社交比較中獲得優(yōu)越感的驅(qū)動(dòng)力,并不會(huì)因?yàn)?AI 模仿能力的登峰造極而減弱,反而會(huì)變得越來(lái)越具有社交光環(huán)。
在未來(lái),純粹由人類(lèi)手工創(chuàng)作的文章、繪畫(huà)、音樂(lè),或許會(huì)像前些年受追捧的“老師傅手炒茶”一樣,成為一種稀缺的、帶有某種情懷和文化附加值的“奢侈品”。它們的存在,更多的是滿足一小部分人對(duì)“原真性”的極致追求,普通大眾或許難以企及,也未必真正需要。
但即便如此,依然會(huì)有無(wú)數(shù)人樂(lè)此不疲地在信息的海洋中搜尋 AI 的蛛絲馬跡,熱衷于發(fā)表自己的“鑒定報(bào)告”。因?yàn)樵谶@場(chǎng)游戲中,展示“我能鑒定 AI”這個(gè)姿態(tài)本身,比是否真的能準(zhǔn)確鑒定出 AI 更為重要。我自己也經(jīng)常在一些分享文章的群中“鑒定 AI”,但現(xiàn)在想來(lái),這種行為確實(shí)只會(huì)發(fā)生在“有觀眾”的場(chǎng)合。
事實(shí)上,在 ChatGPT 上線后我發(fā)布的每篇文章都有 AI 的參與,只是參與的程度不同,其中一些也達(dá)到了 80% 的水平。但只有我主動(dòng)標(biāo)明 AIGC 的文章下面,才會(huì)出現(xiàn) AI 鑒定類(lèi)評(píng)論,這在某種程度上也驗(yàn)證了 AI 鑒定是一種表演的觀點(diǎn)。因?yàn)?AIGC 打標(biāo)是一個(gè)舞臺(tái),只有提供了舞臺(tái),表演才有意義。
因此,實(shí)質(zhì)性的、以技術(shù)為基礎(chǔ)的 AI 鑒定或許會(huì)在“AI 鑒定悖論”的演進(jìn)中逐漸式微,甚至消亡。但作為一種社會(huì)行為、一種心理需求的“鑒定 AI”,卻可能作為一種獨(dú)特的文化印記,長(zhǎng)久地存在于人類(lèi)與人工智能共舞的漫長(zhǎng)時(shí)代中。
這或許正是我們作為活了 700 萬(wàn)年的碳基生命,與技術(shù)現(xiàn)代性間始終無(wú)法調(diào)和的張力所在吧。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.