滿屏都在盛贊DeepSeek,甚至《黑神話悟空》的主創(chuàng)馮驥都表示“DeepSeek是國運級別的科技成果”。
2025年1月27日,DeepSeek更是超越ChatGPT,登頂蘋果美國區(qū)免費App下載排行榜第一。
有一說一,DeepSeek確實好,開源免費、簡單小巧、訓練成本低都是優(yōu)點,而且會給出看似縝密的推理過程。
DeepSeek有多好,舉個例子,假如我們現(xiàn)在把“我是脫口秀演員何廣智,請你模仿我的風格,給我寫吃飯的段子,需要講夠5分鐘”這個問題丟給主流的幾家國產(chǎn)大模型,沒有哪家比DeepSeek回答得更好
不過DeepSeek也有一些明顯的不足,現(xiàn)在階段還不能過高評價。
1、套路化、公式化的創(chuàng)作,AI味還是很濃
我們閱讀文章時,經(jīng)常會說這是華爾街體、虎嗅體一樣,有很明顯的創(chuàng)作特征。這種明顯的特征被機器學習利用后,機器會把這種特征規(guī)則化、套路化,最終呈現(xiàn)的內(nèi)容看起來非常專業(yè)嚴謹,卻反而暴露出機器短板--一看就是機器創(chuàng)作。
DeepSeek的創(chuàng)作也是如此,充斥著更嚴謹?shù)奶茁坊瘎?chuàng)作。它呈現(xiàn)內(nèi)容真的太好了,有人說“它比人還好”,這不完全是一句褒義詞,另外一層含義是,看起來還是像機器寫的。
當然,這一點要比國家其他大模型好很多。
2、低級錯誤頻發(fā),無法對呈現(xiàn)內(nèi)容自我校準
前兩年,主流大模型出現(xiàn)過“林黛玉倒拔垂楊柳”之類的張冠李戴的錯誤。現(xiàn)在雖然有所改進,但各種低級錯誤頻發(fā),且一本正經(jīng)呈現(xiàn)的案例也時有發(fā)生。
DeepSeek也不例外,這幾天我在使用時發(fā)現(xiàn)了大量的錯誤呈現(xiàn)。在我提問關(guān)于“丁道師”的內(nèi)容,發(fā)現(xiàn)了大量非常低級的錯誤,這些錯誤按理說很容易識別,但DeepSeek還是執(zhí)拗地給出了自己的答案。
比如這句話:“您提到的“丁道師”應(yīng)是中國互聯(lián)網(wǎng)行業(yè)資深分析師、知名科技評論人丁道師(本名丁磊),他在互聯(lián)網(wǎng)經(jīng)濟、電商、新媒體等領(lǐng)域有長期觀察和研究。”
實則丁道師并非丁磊,如此混淆,實在不該。
3、對因果關(guān)系理解欠佳
之前有位大佬提到過一個假設(shè),大意是“如果我們現(xiàn)在到處發(fā)文章和論文,論證人可以把石頭當飯吃,長期以往,機器就以為人可以把石頭當飯吃,可能就會輸出這樣的內(nèi)容。”
現(xiàn)在國內(nèi)的幾家大模型服務(wù),包括DeepSeek也遇到這個問題。
比如這個論述“呂梁被評為中國電商扶貧示范市”,呂梁其實從來都沒有被評為中國電商扶貧示范市,咱們國家也沒有這樣一個評選。
這種因果關(guān)系的錯亂,是這樣導(dǎo)致的:有作者認為呂梁可以作為一個電商扶貧示范市看待,并且把這個論述發(fā)到了多種權(quán)威媒體。結(jié)果現(xiàn)在被DeepSeek一通深度推理過后,就變成了“呂梁被評為中國電商扶貧示范市”。
寫在最后:總而言之,以理性的眼光看待 DeepSeek 的成果至關(guān)重要。須知,任何科技創(chuàng)新都需遵循科技發(fā)展的一般規(guī)律,DeepSeek 自然也不例外。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.