言
我們做性能測試的時候,除了使用工具編寫腳本并執行之外,最核心的工作就是做性能測試結果分析和問題調優。然后在做性能測試的時候,非常常見的一類問題就是CPU的問題。所以,要專業做性能測試就免不了要深入學習一下CPU的原理和常見的分析和監控的命令。
概念:CPU(中央處理器:Central Processing Unit)),是一塊超大規模的集成電路,是計算機的運算核心【拿到數據后先計算】和控制核心【然后再根據計算結果去控制】。
功能:主要是解釋計算機指令以及處理計算機軟件中的數據。電腦中所有操作都由CPU負責讀取指令,對指令譯碼并執行指令的核心部件。
計算機程序編譯后 0101二進制代碼,CPU接受到這個指令,解釋指令拿到數據,處理數據。
CPU由3個模塊組成,三個部分由內部總線連接起來:
控制單元:根據計算結果去控制數據的流向,把內存的指令、數據讀入寄存器,控制計算機
運算單元:拿到數據先計算數據
存儲單元:臨時的數據存儲在存儲單元,比磁和-內存更小,速度更快。
我們搭建好性能測試環境后,進行性能測試之前,最好能先去看一下服務器CPU的基本信息和參數。所以,我們先來學習幾個CPU查看的命令。
通過上圖:這個虛擬機的物理cpu2個,每個物理cpu的邏輯CPU個數為1個,所以邏輯CPU的個數就是2個。
wc -l: wc 是一個命令,用于計算文件中的字節數、字數和行數。-l 選項告訴 wc 只計算行數。
Sockets=物理cpu
Cores per Socket=一個插槽上CPU核數
Threads per core=每個核上超線程數
CPUs=邏輯cpu
我們真正需要重點學習的是CPU在性能測試的時候,我們分析應該關注哪些指標。這個是性能分析的關鍵。如下圖所示:
CPU使用率是我們最直觀能看到的指標,所以會優先去關注。CPU利用率行業內標準是一般不要超過75%,如果超過了就需要分析原因,并找到問題和調優了。
CPU使用率=非空閑時間占總CPU時間的百分比, 越高說明CPU越繁忙,就可能需要進行性能問題分析和調優。
我們需要關注的是CPU非空閑部分,具體可以細分如下,加粗部分是重點:
%us:用戶 CPU,比如java程序,應用程序等:用戶態使用CPU的百分比(user)。用戶CPU使用率高,通常說明有應用程序比較繁忙。
%sy:系統CPU:表示CPU在內核態運行的時間百分比。系統CPU 使用率高,說明內核比較繁忙。
%iowait:等待I/O:表示等待I/O的時間百分比。iowait高,說明系統與硬件設備的I/O 交互時間比較長,比如跟鍵盤、網卡、顯示器等交互。
ni【軟/硬中斷】:分別表示內核調用軟中斷處理程序、硬中斷處理程序的時間百分比。它們的使用率高,通常說明系統發生了大量的中斷。
? 當CPU的時間分片正在處理某個任務還沒完成時鐘時間的時候,突然收到硬中斷或軟中斷指令,CPU被打斷需要去響應,才能繼續執行任務;
? 如果ni參數很高,說明中斷的數量很多,說明CPU不停的被打擾,需要分析是什么中斷。一般ni比較高的情況比較少,不過ni高也會導致sy【內核占比】比較高,是環環相扣的,要能分析。
%st/gu:steal/guest:在虛擬化環境中會用到的竊取CPU使用率(steal)和客戶CPU使用率(guest),分別表示被其他虛擬機占用的CPU時間百分比,和運行客戶虛擬機的CPU時間百分比。
? 這兩個一般比較低,不會成為cpu的瓶頸 不太需要關注
%id:空閑 CPU百分比,CPU使用率=(100-id)%
? 比較簡單的算法:100% - id%=CPU使用率
平均負載指系統的平均活躍進程數,一個時間段內平均有多少進程數在活躍,跟cpu核數做比較,算出繁忙情況;這是服務器性能的重點關注值,一般CPU的使用率高的話,平均負載也是高的。
主要包括三個數值,過去1、5、15鐘的平均負載。可以通過這三個值看到負載整體的趨勢。
逐步降低,是CPU后來越來越空閑;逐步增加,CPU越來越繁忙;或者持平,就是CPU穩定。
理想情況下,平均負載=邏輯 CPU個數,這表示每個CPU都恰好被充分利用;如果大于邏輯 CPU 個數,就表示負載較重;如果平均負載的值高于CPU的3- 5倍 ,那么很有可能CPU存在瓶頸,就需要分析和調優。
系統內核和應用存儲共用CPU的內核,就會需要不停的爭搶資源,就會出現上下文切換。
上下文切換多了不是好事兒,過多的上下文切換,會將原本運行進程的CPU時間,消耗在寄存器、內核棧以及虛擬內存等數據的保存和恢復上,很少有時間真正計算和處理數據,減少和縮短了進程真正運行的時間,通常會導致CPU內核【sy】消耗資源比較高,會成為性能瓶頸,需要優化。
了解CPU需要關注的性能指標,那么在性能測試執行的時候,如何去監控這些指標呢?我們就需要通過一些常用的監控命令了。
上圖就是top命令的結果顯示,我們來一一分析:
當前系統時間,啟動運行了多長時間。
2 users, 有多少個終端用戶連接, 不代表多少個賬戶 【同一個賬戶 多個終端也算】
load average:服務器性能的重點關注值,系統過去1分鐘的平均負載、 過去5分鐘的平均負載、 過去15分鐘的平均負載
? 前面我們講到過,如果平均負載大于CPU數量,甚至達到3- 5倍cpu數量,說明系統負載非常大了。這個時候才會需要去觀察下面的詳細數據分析原因。
總進程數,正在運行的進程數,休眠的進程數 。
按下H, 切換為 Threads 當前總線程數 。
%CPU(s):是CPU使用率的平均值,合并cpu的統計數據,是所有數量cpu的總情況。
us, CPU的用戶態使用時間占比 【應用程度和代碼邏輯在用戶態計算】,如果這個高,很可能代碼邏輯復雜
sy, cpu的系統態使用時間占比 【系統內核】
ni, 中斷占用cpu的情況,如果發生中斷,優先級更高的中斷了當前的事情
id, idle 空閑【 不會超過100】
wa, IOwait等待IO操作的操作狀態的時間占比 ,當我們io繁忙時,這個數值一般會非常明顯。
hi, hard interrupt 硬中斷 ,保存和打開數據占用cpu時間
si, soft interrupt 軟中斷,保存和打開數據占用cpu時間
? hi + si=ni的值
st:steal,其他的虛擬機占用CPU的時間 ,這個基本不用關注。
總結:這行數據會優先看id數據,如果id很大,不用分析;id小,再去看us 和sy:
? 如果us 很高,一般要分析代碼邏輯
? 如果sy很高,要看看ni的值,ni很高的話,就要進一步分析hi si的值 看哪個中斷高。
總的內存,空閑內存,使用的內存,buff和cache內存
? buff 【緩沖區:磁盤虛擬出來 加快磁盤讀取數據速度】
? cache 【緩存:虛擬的 加快內存數據交換速度的】
? swap:交換區
? avali:可用于下一次的物理內存總量
pid 進程id
USER 進程的歸屬者, 這個進程啟動用戶
PR 進程優先級,數字越大優先級高的話可以優先使用資源 ----性能不太關注 影響不大
NI 進程優先級切換,跟PR共同決定了進程的優先級 ---性能不太關注 影響不大
VIRT:這個進程分配的虛擬內存
RES:實際物理內存
SHR :共享內存會詳細講
S: status,進程的狀態,可以是R S 等
%CPU 這個進程占用了多少的cpu使用率 -----這個數值,在CPU為多核時候,是可以超過100
? 進程列表中,默認排序規則,是根據 %CPU 數值從高到低的排序
? 如果某個進程占用CPU高于75% 需要單獨拎出來分析
%MEM 這個進程占用內存率,后面講解。
TIME+:這個進程占用CPU的總的時間,如果這個進程經常需要CPU進行計算和處理,這個時間就會很大。
COMAND: 這個進程通過哪個命令啟動的。
這個命令Linux系統不自帶,需要安裝,安裝命令 :yum install -y sysstat
1)mpstat 1 10 :1s刷新一次數據,實時監控工具,主要報告與cpu相關統計信息,這個CPU是所有CPU的平均整合情況;總共打印10次。
結果里顯示的信息跟top命令里基本一樣,就不詳細贅述介紹了。
同樣不是系統自帶的命令,需要額外安裝:yum install sysstat -y
監控全部或指定進程的cpu、內存、線程、設備io等資源占用情況和上下文切換信息,用來實時查看進程的CPU、內存、I/O以及上下文切換等指標信息
一般會加一些參數來使用pidstat命令:pidstat -u -w -p pid ,過濾指定的進程的信息顯示。
-u: CPU的信息,-w【switch】,-p 【指定進程id】
這個命令里我們會重點看上下文切換信息,上下文切換包括資源上下文切換和非資源切換:
? cswch/s :自愿上下文切換 :,資源不夠資源切換
? nvcswch/s:非自愿上下文切換 ,時鐘周期+中斷等被迫切換
如果這個上下文切換高,那么CPU的sy一般會比較高, 就需要去定位原因了。
vmstat 1 5 : 間隔1秒鐘刷新一次,總共收集5次 就結束,顯示結果如下:
procs: r 顯示多少進程在等待,b 顯示多少進程在不可中斷的休眠
memory: swpd 顯示多少塊被換出磁盤,free顯示剩下的空閑塊,buff正在被用作緩沖區的塊,cache正在被用作操作系統的緩存
swap: 現在交換活動, si 每秒有多少塊正在被換入內存 so正在被換出到磁盤
io: 顯示了多少塊從塊設備讀取(bi)和寫出(bo),通常反映了硬盤I/O的繁忙程度
system: 顯示每秒中斷(in)和上下文切換(cs)的數量
cpu:顯示所有的cpu時間花費在各類操作的百分比,包括執行用戶代碼(非內核),執行系統代碼(內核),空閑以及等待IO
重點的參數:
-c 顯示CPU使用率報告
-d 顯示設備【磁盤】使用率報告
-k 以每秒千字節顯示統計報告
-m 以每秒兆字節顯示統計報告
-x 顯示擴展統計信息
結果顯示:
Device: 磁盤信息
rrqm/s :讀磁盤隊列數量
wrqm/s 寫磁盤隊列數量
r/s w/s 每秒的讀\寫的請求次數
rMB/s wMB/s 每秒讀\寫磁盤的大小
avgrq-sz 平均請求磁盤扇區數
avgqu-sz 等待隊列的大小
await r_await w_await 等待
svctm 請求用的時間
%util 至少有一個活躍的 讀寫操作的時間占比
安裝:yum install dstat -y
參數:
-c:cpu監控
-m: 內存
-d:disk 磁盤
-n:net 網絡
-l:load 系統負載
-y:system ,系統
-r: io
-t: 加上時間顯示
-B 分頁狀況
-b I/O 和傳輸速率信息
-d 塊設備狀況
-I 中斷信息狀況
-n 網絡統計信息
-q 系統負載壓力統計
-r 內存利用率信息
-u CPU利用率信息
酷睿13代發售一年后,Intel為玩家們帶來了酷睿14代臺式機處理器,在上代的基礎上提升了頻率和核心數量,并同時推出了包括Wi-Fi 7、Thunderbolt 5、新版應用優化器和XTU等一系列功能的升級。那么作為原有命名法則下的“最后”一代酷睿,它能否給我們帶來新的驚喜呢?本次首發測試將給你答案 。
↓↓↓點擊視頻了解性能實測↓↓↓
<script src="https://lf3-cdn-tos.bytescm.com/obj/cdn-static-resource/tt_player/tt.player.js?v=20160723"></script>
不止是頻率與核心升級,酷睿14代帶來了更多進化
Intel酷睿14代臺式機處理器依舊沿用了第13代的Raptor Cove微架構,但在核心頻率、核心數量、緩存以及平臺支持上進行了一些更新,同時加入一些應用程序的優化。平臺方面,它可以繼續兼容600及700系主板,玩家只需要更新BIOS即可,有效降低了升級成本。
不過,隨著酷睿14代的發布,Intel也為玩家帶來了Wi-Fi 7和Thunderbolt 5。Wi-Fi 7具有更好的無線連接性能、更高的帶寬和更低的延遲,并在安全性方面得到了極大改善。新的Thunderbolt 5在原有40Gbps帶寬(Thunderbolt 4)的基礎上提供了80Gbps甚至是3通道120 Gbps的下行帶寬,供電能力也提升到了最高240W。玩家將在新版700系主板上享受到這些功能。
此外,Intel還更新了新的Intel應用優化器,它基于Intel動態調頻技術框架,結合Intel硬件線程調度器,實現針對特定應用場景以及應用的調度策略,帶來顯著的性能提升。
酷睿14代K系列的超頻能力也得到了提升,內存也可以輕松支持到DDR5 8000的規格。Intel XTU超頻工具目前也開放了SDK,方便開發者打造自己的超頻工具。另外,針對入門級和普通玩家則提供了基于AI的超頻助手,它會根據用戶硬件環境,配合人工智能和大量的內部學習訓練,為玩家的主機找到值得推薦的超頻參數配置,實現更方便快捷的超頻。
首批上市的酷睿14代臺式機處理器包括了6款K系列產品。包括i9-14900K/KF、i7-14700K/KF、i5-14600K/KF,而我們的測試則使用了其中帶有核芯顯卡的i9-14900K、i7-14700K和i5-14600K。
i9-14900K/KF具備8P+16E的核心規格,P核TVB頻率高達6.0 GHz,比上代i9-13900K/KF的5.8GHz要高出200MHz,是真正意義上的開箱即用6GHz處理器。
i7-14700K/KF是本代中變化最大的產品,相較于i7-13700K/KF,它增加了4個能效核,這將帶來顯著的多線程性能提升。同時,i7-14700K/KF的最高睿頻頻率可以達到5.6 GHz,比上代i7-13700K/KF要高出200MHz。能效核的最高睿頻也從上代的4.2GHz提升到了4.3GHz。
i5-14600K/KF具備6P+8E核心,和上代保持一致。P核最高睿頻從5.1GHz提升到了5.3GHz,提升了200MHz,E核睿頻則可達4.0 GHz。i5-14600K雖然規模并沒有什么變化,但頻率的提升讓它的單核心性能更接近上代i9-13900K,對于中端玩家來說是一個好消息。
當然,為了讓酷睿14代更好地發揮性能,作為Intel重要合作伙伴的技嘉早就準備好了全新的700系主板,其中的Z790 AORUS PRO X冰雕更是其中的甜品旗艦代表作。
技嘉Z790 AORUS PRO X賞析
技嘉Z790 AORUS PRO X(以下簡稱Z790冰雕X)隸屬于全新增加的冰雕系列,在外觀方面和之前的小雕PRO相比走了銀白配色的風格。
↓↓↓點擊視頻賞析Z790冰雕X↓↓↓
<script src="https://lf3-cdn-tos.bytescm.com/obj/cdn-static-resource/tt_player/tt.player.js?v=20160723"></script>
Z790冰雕X配備了18+1+2相數字供電,其中18相處理器供電配備90A電源級芯片,充分滿足i9-14900K滿血釋放性能的供電需求。
同時主板還給VRM電路搭載了新一代一體成型散熱裝甲,采用復合式剖溝設計并配備了高品質導熱墊、內置8mm熱管,因此可以提供相當出色的散熱效率,確保VRM持續高負載供電也不會過熱。
內存方面,Z790冰雕X通過配備8層2盎司銅服務器級PCB板、抗干擾遮罩、背鉆孔技術、SMD技術與隔離內存布線,提供了非常優秀的電氣性能,從而可以輕松支持DDR5 8266+的高頻內存。同時,得益于技嘉獨有的D5黑科技,還可以支持“內存高帶寬”和“內存低延遲”功能,進一步免費提升內存性能。
擴展槽方面,Z790冰雕X板載了新一代的超耐久顯卡插槽X,采用無縫式一體設計,固定在專用背板上,因此擁有普通顯卡插槽10倍的承載能力。此外,超耐久顯卡插槽X配備了橡膠內襯條,保護顯卡PCB不被劃傷。超耐久顯卡插槽X還配備了鋅合金屏蔽罩,有效降低來自外界的信號干擾。
Z790冰雕X提供了5個M.2插槽,并配備了一體式抗干擾金屬遮罩、全覆蓋散熱裝甲XL和散熱背板。5個M.2插槽中,兩個由處理器直出,分別支持PCIe 5.0×4和PCIe 4.0×4,另外3個由主板芯片提供,都支持PCIe 4.0×4。值得一提的是,支持PCIe 5.0的M.2插槽最高可安裝25110尺寸規格的SSD,同時在使用此插槽時,第一條顯卡插槽將運行在X8模式下。
周邊功能方面,Z790冰雕X配備了5千兆有線網卡和Wi-Fi 7無線網卡,其中Wi-Fi 7無線網卡更是支持MLO多鏈路技術,可以將流媒體、游戲應用分別分配給不同的頻段,配合主板附帶的高增益磁吸天線實現流暢不卡頓的網絡體驗。
對于設計師用戶,Z790冰雕X還有一個貼心的設計,它提供的VisionLINK技術可以實現USB Type-C一線通,同時實現數據傳輸、60W充電與最高4096×2304@60Hz的視頻信號輸出,方便設計師用戶連接手繪屏進行創作。
個性化和易用性方面,Z790冰雕X也帶來了獨特的創新。首先是全新的UC BIOS,擁有重新設計的用戶界面,Easy模式下支持快速訪問,更可通過PerfDrive黑科技根據散熱配置來優化性能。主板還支持EZ-Latch快易拆功能,一鍵裝拆顯卡與M.2 SSD。
特別值得點贊的是,Z790冰雕X為喜歡機箱副屏的DIY玩家特別板載了視頻接口,免去了復雜走線的麻煩。當然,Z790冰雕X也支持RGB Fusion燈效系統,方便玩家打造燈效MOD主機。
總的來說,這次Z790冰雕X的升級是非常全面的,除了用料和散熱方面的提升,還在穩定性和易用性方面有了十分搶眼的創新,稱得上是酷睿14代的高性價比旗艦級座駕,特別適合追求高顏值與高性能的發燒級玩家與設計師用戶選擇。
接下來就讓我們來看看酷睿14代的實戰表現吧
實戰測試:6GHz大顯身手,酷睿14代再攀性能巔峰
測試平臺
處理器:i9-14900K/i9-13900K/i7-14700K/i7-13700K/i5-14600K/i5-13600K
主板:技嘉Z790 AORUS PRO X
散熱器:技嘉水雕PRO360
內存:阿斯加特 博拉琪DDR5 7200 16GB×2
顯卡:RTX 4090 FE
硬盤:WD_BLACK SN850X 2TB
電源:技嘉UD1000GM
操作系統:Windows 11專業版
測試之前我們在技嘉Z790 AORUS PRO X主板BIOS中解鎖了處理器功率墻、啟用內存XMP頻率,并打開了D5黑科技的“內存低延遲”和“內存高帶寬”功能,由此保證系統處于最佳的性能狀態。
基準性能測試
基準性能方面,i9-14900K得益于更高的頻率,相對i9-13900K帶來最高3%左右的性能提升。而i5-14600K相對i5-13600K的提升也比較符合這個規律。不過,i7-14700K由于增加了4個能效核,多線程提升幅度巨大,最高可達19%,單線程也有4%左右的提升。
生產力性能測試
在內容創作的生產力測試中,i9-14900K的表現與基準測試相仿,相對i9-13900K大約有3%左右的綜合性能提升,i5-14600K相對i5-13600K綜合提升幅度則要更高一些,最高可接近7%。i7-14700K由于增加了4個能效核,所以在吃多線程性能的專業應用中提升幅度巨大,最高可達20%,平均也能達到13%左右。
游戲性能測試
再來看看游戲玩家最關心的游戲測試。我們選擇了19款熱門游戲進行測試,綜合19款游戲的幀率表現來看,i9-14900K相對i9-13900K最高提升幅度可達4.59%,i7-14700K相對i7-13700K最高提升幅度可達4.32%,i5-14600K相對i5-13600K最高提升幅度可達4.41%。總的來說,選擇酷睿14代確實可以為玩家帶來更流暢的游戲體驗。
滿載功率測試
功率方面,我們使用Cinebench R23考機,解鎖功率墻的情況下,i9-14900K的持續滿載功率大約保持在360W左右,這對主板供電提出了較高的要求,不過這對于供電設計本身就非常強悍的Z790冰雕X主板來講就游刃有余了,至于i7-14700K和i5-14600K則更不在話下。
超頻方面,使用一體式水冷的情況下,i9-14900K通過Intel新版XTU進行超頻,經過簡單的嘗試,最終穩定在P核全核5.9 GHz,E核全核4.7 GHz,Cinebench R23多核分數來到了43774。如果只超P核,則可以超到P核全核6 GHz穩定使用,這也證明了i9-14900K確實稱得上是真正意義上開箱即用的6 GHz處理器。
總結:酷睿14代帶來更極致的體驗,平臺更有實用升級
最后總結一下,酷睿14代相對上代產品通過提升頻率、增加核心實現了進一步的性能升級,為玩家和用戶帶來了更加高效的選擇。尤其是其中的i7-14700K,由于增加了4個能效核心,因此多線程性能提升幅度十分明顯,在首發定價持平上代的情況下提供了相當出色的性價比。
此外,酷睿14代也帶來了平臺的功能升級,例如Wi-Fi 7、Thunderbolt 5、穩定支持DDR5 8000以及新一代的應用優化器、帶AI智能引導的XTU超頻工具等等,全面提升了平臺的使用體驗,增強了Intel平臺的易用性和人性化。
除了處理器本身,和酷睿14代一起登場的新版700系主板也很有看點,例如技嘉Z790X雪雕,提供支持PCIe 5.0的顯卡與M.2插槽、板載機箱副屏專用視頻接口、輕松支持DDR5 8266以上頻率且擁有獨家D5黑科技,當然也少不了全新的Wi-Fi 7無線網卡和5千兆有線網卡,用它來搭載i9-14900K這樣的酷睿14代旗艦打造頂級性能主機無疑是上佳的選擇。
天我們發布了一期視頻,聊了聊Intel部分臺式機處理器可能存在不穩定、故障率高的問題,不知道大家都看了嗎?
我們一直對這個事情保持跟蹤,現在有最新進展來同步給大家:
上圖轉自IT之家
昨天Intel發布了聲明,確認該問題由“微代碼算法造成”,并預計將于八月中旬“提供一個微代碼補丁來修復過高電壓導致的根本問題”。
對于筆記本處理器,Intel在聲明中表示“確定移動產品沒有暴露出相同的問題”。
那么作為筆記本消費者應該如何看待此次事件呢?
今天我們就以ROG 魔霸新銳為例來簡單聊聊我的態度:
ROG 魔霸新銳 2024的首發售價是10499元,如今京東穩定在9999元。
我們作為自媒體,針對這個事情得到的信息也沒有比大家多多少,更沒有「故意不告訴大家」。
我們會持續跟蹤并同步此次事件的進展,如果未來我們發現這個故障確實存在于某些筆記本機型上,那我們也會及時調整推薦列表,做到對觀眾負責。