而且其性能測試結果也現身Geekbench數據庫。這款僅8大核的處理器在Geekbench 6多核測試中,分數高達16308,超越了16核心的i9-12900KS。i9-14901KE單核測試得分為3018,展現出卓越的單核性能,與24核心的i9-14900K相比僅低2.2%。該處理器專為嵌入式平臺設計,配備36MB L3緩存、16MB L2緩存,基礎頻率為3.8 GHz,最大可提升至5.8 GHz,平均運行頻率約5.5 GHz,TDP為125W,并支持完全解鎖的超頻功能。
(8905499)
PU這幾年在核心數量上可謂是大幅增加,從過去的雙核、四核一路來到了現在的6核乃至8核以上,但是無論核心數量怎么增加,大部分CPU的核心數量總是保持偶數增長,不會出現3核心、5核心的偶數核心CPU,這里的原因何在呢?
其實對于CPU芯片設計來說,只有設計成偶數核心才能最大化利用芯片面積,比如雙核可能是個矩形,四核可能拼起來接近正方形,而6核心可能又成為一個矩形,總之,只要是偶數核心,就可以保持矩形的整體布局,從而最大化利用芯片本身的矩形。
而且,矩形有利于CPU的模塊化設計,無論芯片廠商想做幾個核心都可以更加輕松的來更改設計,可以參考一下AMD的銳龍3000系列處理器,就是典型的模塊化設計,如果設計成3核心、5核心的CPU,那么一來不好充分利用芯片本身的面積,而來則不利于模塊化結構的增減。
當然,過去AMD也推出過3核心的CPU,不過即使如此,當年的3核心CPU本身也是4核心產品,只是AMD為了讓一些瑕疵品能夠再度利用,還有一些是人為屏蔽一個核心,同時也是為了和英特爾進行差異化競爭所推出的產物,即使到了今天,AMD和英特爾做類似的核心數量刪減也不是難事,只是已經沒有了必要。
內容來源于@什么值得買APP,觀點僅代表作者本人 |作者:iN在
今天咱們來說一個很多數碼博主們根本不會告訴你的事情。
這件事的來頭在于這樣的一個回復:
能問出“目前還有什么其他指令集是影響CPU性能的嗎?”這樣的話實際上就說明了讀者開始用心了。
CPU是一個相當復雜的產品,其復雜程度非一般人所能想象。面對選擇,很多數碼博主們也很難給普通用戶來說明白不同的CPU所使用的不同技術的優缺點。面對這樣的問題,大家就將原本很復雜的產品參數抽象為了多大頻率、幾納米制程、第幾代CPU和幾個核心這樣籠統的“技術表象”。
這種認知雖然在面對日常生活的時候基本夠用,但很初級。為什么這樣說,咱們先說iN最近看的一本小說的情節:
匈奴的冒頓單于糾結了三十萬騎兵,要攻打漢人的土地,在誓師大會上冒頓高呼“草原的男兒們,我們要踏平長城,將南方的土地搶到手中,讓漢人為我們放羊,把田地改作牧場”……
作為漢人咱們有沒有感覺到一絲不對頭?“丫怎么就只知道放牧?”這就是“認知局限性”的問題了。作為當時北方游牧民族他們很難想象盈車嘉穗車水馬龍;更難想象軟紅十丈紙醉金迷。
科技領域的復雜性和廣度其實也遠遠超出普通用戶的理解范圍,尤其是涉及到CPU技術的詳細內容時。普通的用戶也和冒頓單于一樣只知道土地可以放牧而已。
不服氣嗎?那么咱們來問幾個靈魂拷問的問題:
為什么intel的酷睿CPU會分為i9、i7、i5、i3這幾個不同的產品線?他們之間的區別到底是什么?
為什么從12代酷睿開始CPU開始分大小核了?
為什么前兩天發布的iPad Pro先于蘋果的筆記本和臺式機率先使用了M4的CPU?
為什么intel和AMD的CPU封裝和核心不一樣?
為什么CPU分消費者市場和專業市場?
……
如果這些問題你都不知道正確的答案,那么在數碼領域中,你就是一個“冒頓單于”,他雖然能搶下的土地卻不會善加利用,而你卻可能會因為買到了一個錯誤的CPU而沾沾自喜。
蹭下熱度,咱們先說下蘋果為什么將最新的M4 CPU用在iPad上的深層次原因。這是最近iN的小伙伴們和iN討論的最多的話題。很多人認為蘋果過于激進要開發一個性能逆天的產品。而iN認為的更深層次的原因則在于蘋果的M4芯片生產線產能不足并且良品率拉胯。
這話怎么講?你要了解CPU的生成制造的例程。
蘋果的CPU一般會分為四個不同的等級在基礎版CPU之上還有PRO、MAX和ULTRA三個更高層次的產品。
那么如果要開設一個生產線生產蘋果的CPU會怎么做呢?每個不同等級的CPU單獨開設一個生產線嗎?這樣的成本是不是太高了?
實際上任何制造CPU的廠商都會在晶圓上刻蝕最復雜最高端的CPU產品。
在制造的過程中,如果制造出的芯片出現瑕疵,就會屏蔽掉芯片上的一些核心,將芯片降低等級進行銷售。
蘋果就更極端了,制造一枚M ULTRA CPU在硅晶圓上所消耗的面積是一枚普通M芯片的8倍,當8個M芯片的位置上全部合格的話,就可以生產出一枚 ULTRA,否則這個8 M芯片個面積上的晶圓就會被切割,被切割成一枚 MAX芯片和一枚PRO芯片,以及兩枚M芯片,當然了,切割出的兩枚M芯片大概率只有一枚是可以使用的,
這是因為在一個晶圓上由于良品率的問題,不得不做出的妥協。不僅僅是這樣,一些被廢除的單個的die(裸晶)本身也不是壞得徹底,在屏蔽掉某些不合格的電路之后還是可以繼續降低檔次來使用。例如我們在選擇蘋果電腦的時候有一個CPU選擇的選項:
讓用戶在購買的時候選擇10核處理器還是12核處理器,以及是使用16核圖像處理器還是19核圖形處理器。這種選擇如果倒過來說,這樣寫:
都是寫上12核處理器,只不過有一批殘次品壞掉了兩個核心,還有都是19核圖形處理器,只不過這批殘次品壞掉了3個圖形核心,如果你愿意買就給你減價2250塊錢。
所以瑕疵最多性能最差的CPU就是在生產最高端的CPU時候產生的缺陷品。這些CPU就會迅速的下沉到更低一級的產品中。
例如這次的Ipad Pro
你甚至會發現不同容量的iPad 所配備的CPU核心數是不相同的。
所以在蘋果,一塊ULTRA生產出來,會依據核心的完好程度來劃分核心數,會依據裸晶的好壞被切割成MAX、PRO和基礎芯片,這樣產品的差異化就被做出來了。
同樣在INTEL和AMD則是依據裸晶的好壞程度被劃分成了不同產品線的CPU,例如i9、i7、i5、i3,至于CPU的頻率指標則通過從最高頻率降低到特定頻率來規避掉本身就已經在裸晶上存在的缺陷。這樣你就應該理解為什么酷睿CPU會分為i9、i7、i5、i3這幾個不同的產品線并且在不同的產品線上還會區分那么多的頻率了吧?
對于大小核心則是另一個話題——指令
從12代處理器開始,Intel就開始了混合架構的設計,也就是大家俗稱的大小核。這實際上就是一個去冗余的過程。
CPU的核心被分為了性能核(大核)和效能核(小核)。從微架構上來說,性能核心采用了Golden Cove微架構:
效能核心則使用了Gracemont微架構
從架構圖上我們可以看出這兩個核心的不同,但同時我們也可以看到這兩個核心及其相近的功能部分。這些極其相近的功能部分其實就是CPU的主要功能。
小核并不是因為小而不具備大核的性能,而是根本沒有作出完成大核心所能完成指令的電路。
例如AVX-512指令集,全部的功能都可以在大核上運行,但在小核上只能支持部分功能。
因此,如果在運行游戲的時候開啟了AVX-512功能,那么大核的負載會立刻提升,但是小核的負載則完全不會有任何變化。
再例如FP16(Half-Precision Floating Point),也就是16位的半精度浮點數計算只能在大核上運行,而在小核心上沒有任何支持。類似的指令有很多,比如AMX、VNNI、TSX……
所以說——什么是指令?
如果從底層編寫程序的角度來說,CPU的指令(Instruction)是指通過操作碼和操作數定義出來的CPU可以執行的操作類型和操作方式
但如果從CPU的硬件設計角度來說,指令是指一塊特定功能的電路以及激活這個電路的一系列電信號。
所以有一個很重要的概念就是——如果要更多的功能就需要更大的芯片面積及更大的功率消耗,最終就是更高的采購和使用成本。那種既要馬兒跑又要馬兒不吃草的便宜事僅僅存在于想象中。對于CPU來說并不存在便宜又快功耗又低的CPU。
同樣也因為各種CPU內部的電路配置不同以及對應的市場需求不同,CPU被分為了消費級CPU和專業級CPU。
也正因為如此,iN一般會告訴朋友,用J1900這類工業CPU做NAS還想要高性能的人不是笨就是傻了。本來便宜的東西也不是這樣使用的。
回到今天的話題,怎么選CPU:很簡單的一個判斷,在價格公道的前提下購買你買得起的最貴的CPU。這是由CPU的制造原理所決定的,只有最高階的CPU才能最接近當初設計這一系列CPU的最原始設計指標在每代CPU中除了最頂級的那個型號之外,所有的CPU其實都是或多或少的閹割版。
這種閹割并不由商品的組裝工藝而決定,并不像是我們買輛車,不必要的配置可以減配,而是僅僅通過屏蔽的方式隱藏了CPU在制造過程中的缺陷。購買的CPU越低端,其實就是CPU本身的缺陷越多。這也是可以解釋很多人的一個疑問的原因:
很多人在討論為什么同一型號的CPU功耗不一樣,甚至還派生出了CPU有體質的區別,讀懂上面的文章,你應該會理解——在制造過程中缺陷是隨機的多種多樣的,因此即便是相同型號的CPU由于“壞掉”的部分有差異就會帶來“體質”上的區別。CPU的銷售型號只是一個標定CPU損壞程度的范圍標識而已。
另外,很多人在購買顯卡的時候已經學會了問一句這個顯卡支持不支持“光追”。其實在顯卡上,“光追”最終下沉到電路上的時候就是一組電路,也就是一組指令。但很少有人問所購買的CPU是不是支持AVX-512、是不是支持AV1硬解碼、是不是支持AES加速……原因則是CPU的這些指令功能對于普通用戶感覺不足。但是如果我們要拿到一個CPU的參數功能表,例如下面這張:
大多數用戶根本不知道這些密密麻麻的參數會對自己的系統體驗造成多么大的影響。例如在不開啟一些功能的時候系統運行是這樣的:
注意CPU占用率相當平整平順。
但如果關閉了一些設置你會發現CPU的占用率立刻飆升:
但是,在普通用戶的感覺下,未必能很明確的得知為什么速度慢了,這種現象積累起來就導致用戶覺得電腦“一卡一卡”的。這樣也就成了很多用戶覺得自己的計算機慢的一個主要原因。
有的時候升級一個新的CPU,這個CPU的特性提供了某些功能的直接加速,用戶會覺得卡頓的現象得以緩解。但更多的情況下則是一個CPU提供了一些特性但又減少了一些特性,這就讓用戶覺得換了CPU但系統根本沒有明顯的速度提高。
出現這樣的現象實際上就是用戶會不會讀CPU的特性表,以及會不會和自己的常用任務相匹配的技能缺失了。
同時,還有一個很重要的要點——現在是一個分水嶺時期。很多AI應用開始逐步的由云端轉到本地運行。最近幾個月iN給朋友的購買建議其實都是在選擇帶有NPU的處理器。
原因則在于現在個人計算機上NPU的適配應用還是不太普及,但在一些特殊的任務下NPU本身在適合的框架下已經可以突出其存在意義了。
尤其是在一些小機器上,NPU的價值對于AI來說遠高于一塊中端顯卡的價值度。
作者聲明本文無利益相關,歡迎值友理性交流,和諧討論~