在臺北國際電腦展上,英特爾正式發(fā)布銳炫Pro B系列顯卡,該系列在發(fā)布前就已經(jīng)受到了許多的關(guān)注。不過并非因為AI性能,而是傳聞銳炫Pro B系列將以消費級的價格,提供更大的顯存和同級別領(lǐng)先的AI算力,這就足以讓不少個人用戶感到興奮了。
先來看看本次發(fā)布的產(chǎn)品規(guī)格,銳炫Pro B系列首發(fā)共有兩款產(chǎn)品,分別是B50和B60,規(guī)格上有著不少區(qū)別。其中B50擁有16個Xe核心和128個XMX引擎,峰值算力可達170 TOPS,配備16GB DDR6顯存,顯存帶寬為224GB/s,TDP僅為70W,并且支持PCIe 5.0×8連接,售價僅299美元(人民幣2156元)。
圖源:英特爾
B60則擁有20個Xe核心和160個XMX引擎,峰值算力可達197TOPS,并且配備24GB DDR6顯存,顯存帶寬為456GB/s,主板功耗支持在120~200W之間調(diào)整,同樣支持PCIe 5.0 x8接口,售價則是500美元(人民幣3605元)。
圖源:英特爾
對比銳炫Pro A系列,B系列不管是AI性能還是通用性能都有了大幅度的增長,部分性能的漲幅達到130%,徹底彌補了前代性能不足的弊端。而且,與前代專注于AI運算不同,B50的圖形工作性能直接提高了3.4倍,甚至可以滿足更復(fù)雜的圖形運算需求。
單從算力性能來看,B50和B60都不算突出,即使是B60也就勉強摸到了RTX 4060的水平,但是消費級顯卡本就因為采用了新的張量核心而在AI算力上具有優(yōu)勢。比如最新的50系顯卡,即使是最低端的RTX 5060也有614的AI算力,與英偉達的專業(yè)計算卡A100差不多,前者價格只要2499元,后者價格則直接跳到五位數(shù)。
如果把B50和B60拿去對比英偉達的專業(yè)卡,基本可以對標(biāo)A5000和A4000兩款顯卡,價格分別在10000元和6000元左右,分別是B60的三倍和B50的兩倍多。說實話,即使有英偉達的CUDA生態(tài)加持,對于普通用戶和小型企業(yè)來說,英特爾依然提供了更具誘惑力和性價比的選擇。
英特爾要掀翻個人AI市場?
自從AI大模型火了之后,本地部署端側(cè)模型就成為不少PC愛好者的折騰方向,但是大家很快發(fā)現(xiàn)端側(cè)部署AI大模型,面臨的最大問題不是算力不足,而是“顯存”不足。很多人覺得AI大模型的端側(cè)體驗取決于算力,其實這個看法并不完全正確,對于個人使用的本地AI模型來說,顯存的重要性其實要更高一些。
因為顯存直接決定了你可以運行多大規(guī)模的AI大模型,以小雷自己的RTX 4070Ti Super為例,顯存是16GB,那么在確保使用體驗的情況下,最大可以部署32B參數(shù)量的模型,與滿血版的DeepSeek有著接近20倍的參數(shù)量差距,基本上體驗是大打折扣的。
簡單來說,即使顯卡的AI算力爆表,如果顯存不足以運行大參數(shù)量的AI大模型,那么最終的體驗都不會好,因為AI算力只能決定生成token的速度,也就是回復(fù)你的用時更短,而模型參數(shù)量則直接決定回答的質(zhì)量和準(zhǔn)確性。
反之,如果你有足夠的顯存去部署大參數(shù)量的AI模型,那么即使算力性能一般,無非就是生成回答的速度慢一些,個人使用的話忍忍也就過去了。如今的個人AI市場基本上處于“算力誠可貴,顯存價更高”的狀態(tài),畢竟單看算力的話RTX 5090幾乎是A100 80G版的兩倍,前者售價三萬就已經(jīng)被不少人吐槽了,后者價格卻接近十八萬。
圖源:淘寶
所以,顯存的重要性應(yīng)該不用小雷再過多敘述了吧?對于普通用戶來說,花十幾萬買一張專業(yè)卡顯然是不劃算的,但是消費級顯卡在互聯(lián)協(xié)議上的閹割,讓用戶無法通過多卡串聯(lián)來拓展顯存,也就讓端側(cè)部署AI的體驗變得十分尷尬。
為了解決顯存問題,甚至出現(xiàn)了改裝顯存的RTX 2080Ti 22G版(原版為11G),因為其支持完全版本的NVLink,可以實現(xiàn)顯存共享,按單位顯存成本和算力來看,算是個人AI服務(wù)器里性價比最高的選擇之一。
但是,在英特爾的B50和B60面世后,這些經(jīng)過改裝的RTX 2080Ti 22G版估計就要失業(yè)了,畢竟2080Ti本身的算力也就130TOPS,而且改裝的顯存存在不穩(wěn)定等隱患。作為對比,擁有24G顯存和197TOPS算力的B60只要3600+,而且支持PCIe 5.0協(xié)議下的8卡互聯(lián),推理和訓(xùn)練速度都遠(yuǎn)超老方案。
圖源:英特爾
對于普通用戶來說,只需要不到一萬的成本,就可以得到一臺能夠部署中等參數(shù)規(guī)模AI大模型的PC,在8卡互聯(lián)的情況下,196GB的顯存甚至可以勉強滿足1.58-bit 量化版的滿血DeepSeek本地部署,顯卡成本也就不到三萬(服務(wù)器主板等另算)。
可以說,B50和B60對于個人AI愛好者而言,無疑是真正的“性價比之選”,如果不考慮模型訓(xùn)練效率等問題,它可以輕松讓你在家里搭建一個小型AI服務(wù)器。
生存壓力下,英特爾另辟蹊徑
前段時間,英特爾公布了第一季度財報,報告顯示,英特爾第一財季營收為127億美元(約合人民幣916億元),與上年同期的127億美元相比持平;應(yīng)占凈虧損為8億美元(約合人民幣57億元),與上年同期的應(yīng)占凈虧損4億美元(約合人民幣29億元)相比擴大115%
可以說生成的壓力迫使英特爾加速業(yè)務(wù)的推進,并且尋找更多的利潤增長點。不過,雖然英特爾的B50和B60兩款消費級AI顯卡都有著不錯的性價比,與英偉達的差距仍然沒有縮小多少,巨頭的訂單仍然會像雪片一樣涌向英偉達而不是英特爾。
無他,對于大型企業(yè)來說,價格并非關(guān)鍵,算力效率才是關(guān)鍵,因為這決定了他們能否更早完成AI訓(xùn)練,在下一輪AI競賽中領(lǐng)先對手。
所以,英特爾顯然不打算與英偉達爭奪大型企業(yè)用戶,而是瞄準(zhǔn)了小型企業(yè)和個人市場。就像我前面說的那樣,對于個人用戶來說,銳炫Pro B系列顯卡確實是不錯的選擇,對于小型工作室和企業(yè)而言也是如此。
圖源:英特爾
試想一下,花上十來萬你就可以部署一個擁有數(shù)百G顯存,理論上支持部署主流大型AI模型的服務(wù)器,這將比以往所有同級別的AI服務(wù)器方案都便宜得多(目前的主流方案一般需要數(shù)百萬的成本)。
換言之,英特爾直接把小型企業(yè)的AI轉(zhuǎn)型門檻抹去了大半,僅留下了“技術(shù)問題”,畢竟熟悉AI領(lǐng)域的人才如今都是香饃饃,想招到人手并不容易。當(dāng)高昂的硬件成本不復(fù)存在,那么還有什么理由不去嘗試著擁抱一下AI呢?
雖然小型企業(yè)的單個采購份額遠(yuǎn)不能和大型企業(yè)相比,但是從市場角度來說,小型企業(yè)的數(shù)量也是非常可觀。而且英特爾可以與各種服務(wù)器供應(yīng)商如浪潮、聯(lián)想等合作,為企業(yè)提供一步到位的AI解決方案,這些基于英特爾AI計算卡設(shè)計的方案將因為低廉的硬件成本而更容易被客戶所接受。
可以說,在英偉達忽略的市場里,英特爾正在用自己的方式為顯卡業(yè)務(wù)找尋新的出路,而且真的有可能成功,對于英特爾來說,這個新的業(yè)務(wù)已是難得的增長點,必須牢牢把握住。
不過,英特爾可能并非唯一這么想的企業(yè),AMD也在臺北國際電腦展上發(fā)布了Radeon AI PRO R9700,這款A(yù)I計算卡基于消費級核心打造,擁有32GB的顯存并最高支持四卡串聯(lián),雖然上限與英特爾有所差距,但是也有著更強的算力。
此外,還有諸如Arm等半導(dǎo)體企業(yè),也對消費級的AI市場“虎視眈眈”,Arm去年就已經(jīng)宣布與眾多合作伙伴一起推動Arm架構(gòu)的AI芯片生態(tài)發(fā)展與研發(fā),同時開發(fā)屬于自己的AI芯片。這些產(chǎn)品不僅面向服務(wù)器市場,也將面向消費級市場,依賴Arm架構(gòu)的出色能效比,或許有一天我們可以實現(xiàn)小型設(shè)備上的大規(guī)模AI模型部署也說不定。
AI的浪潮里,科技企業(yè)不進則退,對于已經(jīng)深陷漩渦之中的半導(dǎo)體企業(yè)來說更是如此,誰能抓住機遇跨入下一階段,誰就能夠在未來領(lǐng)導(dǎo)這個行業(yè)。
5月20日-5月23日,25年臺北國際電腦展在中國·臺北舉辦。
作為全球領(lǐng)先的 AIoT 和新創(chuàng)產(chǎn)業(yè)大展,今年主題為AI Next。
歡迎與雷科技一起關(guān)注臺北電腦展上的AI PC、AI 芯片、AI硬件,一起感受撲面而來的AI狂潮。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.