欄目導(dǎo)航

新聞資訊

新聞資訊

前言

隨著NVIDIAGEFORCERTX4090FounderEdition正式性能解禁，GEFORCERTX4090從RTX3090Ti手上接下了性能王座的位置。當(dāng)然FE公版僅是有限發(fā)售了，真正貼近我們的永遠(yuǎn)都是AIC的非公版顯卡。之前我們就已經(jīng)對影馳GEFORCERTX4090金屬大師OC（下述簡稱“影馳RTX4090金屬大師OC”）進(jìn)行了開箱圖賞，那么今天我們就來看看此款顯卡的性能表現(xiàn)如何？

影馳GEFORCERTX4090金屬大師OC

作為首批推出的AIC非公版產(chǎn)品，影馳GEFORCERTX4090金屬大師OC是一款超頻版的非公版顯卡，有著比FE公版更高的Boost頻率；同時其外觀與散熱規(guī)格都比上一代的產(chǎn)品要更大更強(qiáng)。

整塊顯卡的外包裝設(shè)計延續(xù)了金屬大量系列的設(shè)計元素，只不過這次外包裝也隨著顯卡的大而做得“更大”。而細(xì)心的你肯定會發(fā)現(xiàn)，這一代的NVIDIA型號標(biāo)簽設(shè)計風(fēng)格變更了，真簡潔。

如果用一個詞來形容RTX30系列時代的金屬大師那肯定會是“圓潤”，那新一代的影馳RTX4090金屬大師OC肯定是“硬朗”。顯卡外觀采用了全新的設(shè)計，完全是起棱起角，設(shè)計思路是以宇宙魔方的方塊造型為藍(lán)本。

單是這個金屬外罩就很在份量，整個都是以金屬來打造，一體成型、修邊、打磨、噴涂，這個外罩看著就想到成本不低了。

顯卡背部是一整塊的金屬背板，中間做了拉絲處理，風(fēng)格與正面的區(qū)別開來；同時尾部為鏤空設(shè)計，加快熱量排出。

接口方面較為常規(guī)：3個DP1.4a與1個HDMI2.1的組合，最多可以實(shí)現(xiàn)3+1多顯示器組合的輸出。

細(xì)節(jié)做工真是很可以，外殼的噴涂細(xì)節(jié)方向比一般的客制化鋁垞都要好些。而且筆者認(rèn)為這種不規(guī)劃的條形設(shè)計，其實(shí)玩家們完全可以利用涂裝的形式打個性化的顯卡外觀。

中間風(fēng)扇環(huán)還采用了CNC削邊處理

頂部鏤空有一排的出風(fēng)口，橫跨整個顯卡的頂部，加快熱量的排出

至于輔助供電接口方面，RTX40系列顯卡基本都會采用最新12VHPWR接口，電源沒此接口的也不怕，只需要確保電源額定功率足夠850W以上，那么可以利用NVIDIA配送的4*8Pin轉(zhuǎn)12VHPWR配套使用。

2影馳RTX 4090金屬大師拆解

影馳GEFORCERTX4090金屬大師OC，拆解

從RTX30系列顯卡開始，PCB大小不再是顯卡性能衡量的標(biāo)準(zhǔn)。旗艦級的產(chǎn)品往往在設(shè)計與用料上更為精細(xì)化，集成度高，用料強(qiáng)，PCB相對散熱就顯得小。但中低端產(chǎn)品，走的是成本路線，PCB再大，成本同樣會被壓縮起來。

RTX4090金屬大師OC采用了無燈化的設(shè)計，整塊顯卡一個燈都沒有，PCB走線也變得更為簡潔。上圖為連接兩組風(fēng)扇的接口，一黑一白防呆設(shè)計。

隱藏式的PCB金屬加強(qiáng)件，直接安裝到顯卡散熱模塊上，讓PCB變得更穩(wěn)固，避免PCB變形。要知道PCB較細(xì)且集成度高，而散熱模塊的重量較高，加上PCB金屬加強(qiáng)件后，即使不使用顯卡支架也不會出現(xiàn)嚴(yán)重的掉頭現(xiàn)象。

顯存與供電部分全都配上高系數(shù)導(dǎo)熱墊輔助散熱，顯存位置更是直接在真空腔均熱板上，有著更高的散熱效能。

拆下PCB加強(qiáng)件后，可看到前后的供電輔助散熱部分全都原生自散熱器上，相比模塊化的散熱效能會更高一些。

這一代的影馳RTX4090金屬大師OC采用了全新一代寒光星δ（德爾塔）散熱系統(tǒng)，由三把10cm直徑風(fēng)扇、真空腔均熱板底座、4條8mm+4條6mm鍍鎳復(fù)合熱管，以及大面積的散熱鱗片構(gòu)成。

三把風(fēng)扇直接固定在散熱模塊上，每個風(fēng)扇擁有11片靜霜扇葉，支持PWM控制，可以實(shí)現(xiàn)更高的風(fēng)壓與風(fēng)量，并支持智能啟停功能。

兩段式的散熱模塊，其中4條8mm粗與2條6mm熱管直接貫穿整個散熱模塊；熱管與散熱鰭片之前采用了成熟的回流焊接工藝焊接在一起，配上散熱鰭片的扣FIN工藝，可以讓散熱模塊有著更高效的散熱表現(xiàn)。

成熟的扣Fin工藝

如果你不是明白什么叫大面積的散熱鰭片，這里筆者為大家量取了散熱鰭片的厚度：43mm，那你應(yīng)該相像到這個散熱模塊有多大了吧？

影馳RTX4090金屬大師OC高集成度的PCB，14層高規(guī)格PCB，18+4相供電設(shè)計，雖然同樣有一定的空焊位置，但仍比FE公版的供電配置要強(qiáng)些。

顯卡PCB背部則簡潔一些，主要是一些控制芯片，核心背部電容位置使用了四個POSCAP(導(dǎo)電聚合物鉭電容)代替四組MLCC（一組10個MLCC），電氣性能更強(qiáng)一些。

ADA架構(gòu)的AD102-300核心，性能強(qiáng)勁的保證

四周是12顆美光GDDR6X顯存，顆粒編號為D8BZC，共組成24GB384-bit的顯存規(guī)格。

供電位置同樣被設(shè)計在了PCB兩端，只是影馳RTX4090金屬大師OC顯卡有著更強(qiáng)勁的18+4相供電的設(shè)計。

每相供電均采用了安森美家提供的DrMos芯片，封裝編碼為：NCP30215，最大持續(xù)輸出電路為55A。

供電控制芯片采用了三顆，均在PCB背部，分別是：uP9512、uP9521,以及uS5650Q。其中uP9512與uP9521共同管理核心供電，可以做精細(xì)化的供電管理，而uS5650Q則是主要負(fù)責(zé)顯存供電部分。

12VHPWR接口

NVIDIA統(tǒng)一配發(fā)的4*8Pin轉(zhuǎn)12VHPWR轉(zhuǎn)換線

影馳為大家配備的金屬支架

3測試平臺介紹

測試平臺介紹：

由于測試對對象影馳RTX4090金屬大師OC為旗艦級性能的顯卡，所以我們在其它配件的先用上都挑選一些較為頂級的設(shè)備。三套件為：INTEL目前最強(qiáng)的處理器i9-12900K，微星MEGZ670ACE主板，以及金士頓的64GBDDR5-6000高規(guī)格內(nèi)存。

同時測試前我們得確認(rèn)主板BIOS里的ResizableBAR功能開啟，這樣才能發(fā)揮出RTX4090顯卡強(qiáng)勁的性能。

海韻PRIMEGX1300電源80PLUS金牌全模

電源方面使用了海韻PRIMEGX130080PLUS金牌全模電源，其是一款1300W額定功率的電源，可以滿足各玩家頂級平臺的供電需求。

同時還提供了一條雙8Pin轉(zhuǎn)12VHPWR模組線，可以提供600W供電需求，滿足RTX4090顯卡。

4理論&游戲性能測試

性能測試：

理論性能

從3DMARK理論性能來看，影馳RTX4090金屬大師OC有著比上代RTX3090Ti更為出色的性能表現(xiàn)，約為58.7%性能提升。這已經(jīng)是近幾年來NVIDIA旗艦顯卡提升最猛的一代之一，只能說這次AdaLovelace架構(gòu)與TSMC4N工藝的配合著實(shí)給我們帶來了更多的驚喜。

尤其是在光線追蹤以及DLSS項(xiàng)目上，影馳RTX4090金屬大師OC提升最為明顯，基本能達(dá)到上代顯卡的1.5倍以上。

AIDA64 GPGPU理論性能測試

而來到算力方面，AIDA64GPGPU部分大部可以參考參考，這一部分的算力提升甚至比理論性能更猛，達(dá)到了80.8%，AdaLovelace架構(gòu)下高規(guī)格帶來的算力提升超級恐怖的說。尤其是SHA-1HASH算力的提供甚至達(dá)到了10倍，這不好是國內(nèi)礦民環(huán)境不太好，不然這顯卡又會是空氣卡了。

游戲性能

游戲性能方面，我們選用大量的光線追蹤游戲，以及3A游戲大作。同時測試了2K、4K,以及DSR8K三個不同的分辨率，可看到除著分辨率的越高，影馳RTX4090金屬大師OC顯卡性能那提升是越來越明顯。

拿4K分辨率來說，絕大部分的游戲在影馳RTX4090金屬大師OC下都是以高流暢度運(yùn)行的。甚至在DLSS技術(shù)的加持下，能達(dá)到了120FPS以上，這樣我們配備上4K144顯示器，那是真的爽了。

5DLSS3性能測試

DLSS3性能測試

AdaLovelace架構(gòu)最大的亮點(diǎn)優(yōu)勢就是支持最新的DLSS3，這里我們也一并測試一多款DLSS測試程序與游戲。影馳RTX4090金屬大師OC在DLSS3上的性能表現(xiàn)也是比較理想的，可看到在4K分辨率后，DLSS3技術(shù)為我們帶來了更高的幀數(shù)，即使是8K分辨率下也能達(dá)到90FPS以上。

而我們再測試一下支持DLSS3技術(shù)的賽博朋克2077內(nèi)測版本，以DLSSOFF為基準(zhǔn)的情況下，影馳RTX4090金屬大師OC在開啟DLSS2游戲幀數(shù)已經(jīng)有著明顯的提升，可以達(dá)到77FPS；而當(dāng)開啟DLSS3+ReFlex功能后，游戲幀數(shù)再一次提升到了146FPS，而且游戲延遲也越來越低。

F122

同樣的F122游戲中，4K分辨率下僅TAA設(shè)置的游戲流暢度僅為75，這說明了RTX4090不開啟DLSS功能的游戲性能也很強(qiáng)。但是當(dāng)開始DLSS3后，無論是質(zhì)量檔還是性能檔，其游戲流暢度都高于120FPS，對于一款賽車游戲來說，這流暢度是真再爽不過了。

DLSS3-F122-DLSS-Balance

DLSS3-F122-DLSS-Perfoemance

DLSS3-F122-DLSS-Quality

DLSS3-F122-DLSS-SuperPerfoemance

DLSS3-F122-TAA

UnrealEngine5LyraDLSS3

Unreal-Engine-5-Lyra-DLSS3-OFF

Unreal-Engine-5-Lyra-DLSS3-ON

而最后我們還測試了利用UnrealEngine5引擎打造的LyraDEMO，此DEMO除了能夠支持最新的DLSS3技術(shù)外，還帶上了NVIDIAReflex。筆者這里上傳了兩個圖片給大家看看LyraDEMO里的DLSS3開啟與關(guān)閉的畫質(zhì)對比，游戲流暢度自然是DLSS3開啟后提升較為明顯的，達(dá)到192FPS，而PCL延遲也進(jìn)一步降低到了50ms的水平。

6創(chuàng)作者能力測試

創(chuàng)作者性能測試:

來到生產(chǎn)力方面，我們先來看看專業(yè)級別的生產(chǎn)力會是怎么樣的表現(xiàn)。Blender與OctanceBench測試中影馳RTX4090金屬大師OC性能表現(xiàn)同樣的給力，而且80%以上的提升幅度著實(shí)厲害。即使是在SPEX的專業(yè)領(lǐng)域測試中，影馳RTX4090金屬大師OC也沒讓人失望，比上代旗艦約54%的性能提升。尤其是此款顯卡才賣1W3左右，這價格對于專業(yè)領(lǐng)域用戶來說實(shí)在是太便宜了。

至于視頻制作方面，我們測試了PCMAK10整機(jī)性能、ULProcyon、以及PugetBench的測試，影馳RTX4090金屬大師OC在制作視頻方面的提升關(guān)不太明顯，可能是測試所使用的軟件與工程文件不夠足以發(fā)揮出RTX4090顯卡的性能。

所以我們再做了一個RTX40系列顯卡內(nèi)置的第8代NVENC雙編碼器的測試，測試片源來自NVIDIA提供的8K片源與工程文件，影馳RTX4090金屬大師OC在8K30AV1視頻輸出到H.265格式視頻時明顯有著更短的視頻，尤其是8K30規(guī)格的視頻用時更短一些。而且還支持AV1格式的輸出，這實(shí)在是再好不過了。

同時MAGICMASK工程文件的測試與ON1Resize的項(xiàng)目測試中也表明，影馳RTX4090金屬大師OC內(nèi)置的第8代NVENC雙編碼器很強(qiáng)大，而且利用RTX40核心里的黑技術(shù)，可以讓渲染的時候更短，大大的加快效率。

7超頻&功耗&總結(jié)

超頻

超頻方面，筆者手上這塊影馳RTX4090金屬大師OC顯卡BIOS里最大的功耗限定為480W，若是動手能力較差的網(wǎng)友可以使用影馳XTREMETUNER中的AIOC超頻選項(xiàng)，通過一系列的檢測，軟件給出了核心頻率+165MHz設(shè)定，這頻率更為安全可靠，性能提升還是可以的。

而對于筆者來說，那肯定是不滿足的，先來一個基本的盤，直接核心頻率+210MHz，顯存+200MHz，這樣顯卡核心頻率就Boost到了3015MHz，并且順利通過了Timespy壓力測試。

最后筆者直接把影馳RTX4090金屬大師OC顯卡超到了3090MHz的核心頻率，3DMARK測試中40秒檔的實(shí)際穩(wěn)定頻率為3075MHz，顯卡得分為37719，比默認(rèn)頻率的35781得分提升了5.4%。同時大家注意一下HWINFO64記錄下來的最高功率，只有455W，明顯是撞到功耗墻了，若是再解鎖功耗墻，相信頻率將會有更高的提升。

功耗與散熱

利用Furmark軟件進(jìn)行顯卡烤機(jī)測試，影馳RTX4090金屬大師OC顯卡占用率達(dá)到了99%，滿載功耗為448.1，基本就是限制在于450WTDP之下。顯卡的核心滿載溫度為66.3度，顯存滿載溫度為76.7度，溫度表現(xiàn)與噪音表現(xiàn)的確都比FE公版的要好一些。

新一代的RTX40系列顯卡對PCIe供電要求都較低，主要是來自12VHPWR的供電，滿載時就已經(jīng)達(dá)到了439W，所以筆者建議大家使用模組線，而非轉(zhuǎn)換線。筆者這個滿載的功耗有點(diǎn)高，對于線材和接口的要求更高了，所以NVIDIA轉(zhuǎn)換線上的30次插撥限制也并非隨便說說的。

總結(jié)：

首先從外觀設(shè)計來說，筆者認(rèn)為新一代的影馳RTX4090金屬大師OC顯卡才是真正的金屬大師，硬朗的設(shè)計風(fēng)格，更讓玩家們所接受。全金屬的設(shè)計，也真正的達(dá)到了金屬“大師”級別，配合上RTX4090的性能表現(xiàn)，那是真的絕了。

同時此款顯卡的性能表現(xiàn)的確給人不少的驚喜，60%以上的基礎(chǔ)性能提升，1.5倍的算力提升，以及2倍專業(yè)內(nèi)容性能的提升，這些都是相當(dāng)吸引人的，一塊顯卡就能達(dá)到了過去兩塊顯卡的地步，也怪不得這一代取消了NVLink的支持，因?yàn)榈拇_沒必要，雙卡適配也麻煩，現(xiàn)在就沒有一塊RTX4090不能干的事。

最后是價格方面，影馳RTX4090金屬大師零售報價為12999，與FE公版持平；影馳RTX4090金屬大師OC零售報價13499。總結(jié)：有能力購買的真香顯卡。

8ADA架構(gòu)講解

AdaLovelace架構(gòu)講解

Turing、Ampere上兩代架構(gòu)核心均以人物來命名，前者是計算機(jī)科學(xué)之父——艾倫·麥席森·圖靈；后者則是“電學(xué)中的牛頓”——安德烈·瑪麗·安培，電流的國際單位安培就是以其姓氏命名。那AdaLovelace定非凡人，度娘一下果然，這是人稱“數(shù)字女王”的阿達(dá)·洛芙萊斯，編寫了歷史上首款電腦程序，是被世界公認(rèn)的第一位計算機(jī)程序員，果真是一代比一代還要更牛。PS：她的父親是《唐璜》的作者，詩人拜倫喔。

從Turing架構(gòu)開始，NVIDIA首次在顯卡中加入了加速光線追蹤的RTCore單元，以及面向AI推理的TensorCore單元，這革命性的創(chuàng)新使實(shí)時光線追蹤成為可能。而Ampere架構(gòu)則是全面的架構(gòu)改進(jìn)，在加入新一代的二代RTCore和三代TensorCore基礎(chǔ)上，還有著更先進(jìn)的SM單元設(shè)計，這樣顯卡工作效率那是翻倍的提升。而來到AdaLovelace架構(gòu)，同時是以效率提升為大前提，自然是引入了最新的第三代RTCores與第四代TensorCores單元，同時加入眾多新穎的黑科技，從執(zhí)行效率來說AdaLovelace架構(gòu)是上代Ampere架構(gòu)的2倍以上，甚至光線追蹤能力更是達(dá)到了恐怖的4倍性能。

在講述核心架構(gòu)前，我們先了解幾個關(guān)鍵詞：GeForceRTX4090、AdaLovelace、TSMC4N、608mm2、760億個晶體管、2倍性能功耗比。

大家?guī)е鴰讉€關(guān)鍵字來看上面的【顯卡規(guī)格參數(shù)對比】表格，就可以更容易讀懂上述表格了。最新一代的桌面顯卡GeForceRTX40系列均采用全新的AdaLovelace架構(gòu)核心，GeForceRTX4090的核心是AD102，目前AdaLovelace架構(gòu)核心中最為強(qiáng)大的，具有760億個晶體管、16384個CUDA核心和24GB高速美光GDDR6X顯存。

而GeForceRTX408016GB核心代號為AD103-300，擁有9728個CUDA核心和16GB高速美光GDDR6X顯存，顯存位寬也縮減到了256Bit；GeForceRTX408012GB規(guī)格要低一些，核心代號為AD104-400，擁有7680個CUDA核心和12GB美光GDDR6X顯存，顯存位寬僅為192Bit。這里由于NDA原因這里我們不再多說GeForceRTX4080系列相關(guān)的信息。

得益于NVIDIA與臺積電深度合作的TSMC4N制程工藝，GeForceRTX4090核心面積僅是608mm2（上代RTX3090Ti628mm2），在更小的核心面積下卻能塞下多達(dá)760億個晶體管，比上一代的Ampere架構(gòu)多出了約70%晶體管數(shù)量。

值得注意的是，制程工藝的提升不單能擁有更多的晶體管，其核心頻率更是能跑得很高，GeForceRTX4090Boost頻率就已經(jīng)達(dá)到了2520MHz，這樣在核心頻率與高規(guī)格的雙向保證下實(shí)現(xiàn)了比上代顯卡高達(dá)2倍的性能功耗比。

從GTC2022秋季大會中，其實(shí)我們就已經(jīng)發(fā)現(xiàn)了，目前GeForceRTX4090顯卡中配備的AD102-300核心其實(shí)并非完整的AD102核心。完整的AD102核心應(yīng)該包括了12個GPC(圖形處理集群)、72個TPC(紋理處理集群)、144個SM(流式多處理器)和?個帶有12個32Bit顯存控制器的384Bit顯存位寬。

再來看上面的GeForceRTX4090架構(gòu)圖，和完整版本的AD102核心對比起來就很容易看出差別。首先，GeForceRTX4090核心代號為AD102-300，其擁有9個完整規(guī)格的GPC(圖形處理集群，每個內(nèi)建6個TPC)，與2個非完整的GPC(圖形處理集群，每個內(nèi)建5個TPC)，共組成了64個TPC，那么SM單元自然就是128個了。至于顯存位寬方向那是相當(dāng)?shù)耐暾?84Bit。

如果你還是不太懂，這里筆者就逐一為了AdaLovelace架構(gòu)顯卡的構(gòu)成。

剛才我們已經(jīng)說到，一個完整的AdaLovelace架構(gòu)AD102核心內(nèi)部擁有12個GPC，而每個完整的GPC中包含了一個專用的RasterEngine（光柵化引擎），兩組ROPs共16個ROP（光柵化處理單元），以及6個TPC與12個SM單元。

全新的SM流式多處理器

AdaLovelace架構(gòu)中最大的亮點(diǎn)之一：全新的SM流式多處理器，每個SM包含了128個CUDA核心、1個第三代的RTCores,4個第四代TensorCores（張量核心）、4個TextureUnits（紋理單元）、256KBRegisterFile（寄存器堆），以及128KBL1數(shù)據(jù)緩存/共享內(nèi)存子系統(tǒng)，于是這一個全新的SM單元有著超過上一代2倍之的性能表現(xiàn)。

過去的Turing架構(gòu)INT32計算單元與FP32數(shù)量是一致的，而兩者相加才組成了64個CUDA核心。但是Ampere架構(gòu)開始，左側(cè)的計算單元實(shí)現(xiàn)了FP32+INT32的計算單元并發(fā)執(zhí)行，也就是說CUDA核心數(shù)量翻倍到了128個。

再來看看AdaLovelace架構(gòu)的SM，F(xiàn)P32/INT32的計算單元組合，同樣實(shí)現(xiàn)了每個SM內(nèi)含128個CUDA的設(shè)計，看似提升不大，但是當(dāng)你了解到GeForceRTX4090擁有128個SM，16384個CUDA核心，那你也就應(yīng)該明白達(dá)82.6TFLOPS的著色器能力是如何實(shí)現(xiàn)的了，比上一代的RTX3090Ti顯卡的40TFLOPS，還真是提升了兩倍有多。

另外緩存方面AdaLovelace架構(gòu)也進(jìn)行了大規(guī)格的提升，首先每個SM單元中單獨(dú)配上了128KB的緩存，這樣RTX4090顯卡中就實(shí)現(xiàn)了163MBL1/共享內(nèi)存。其次核心的二級緩存進(jìn)行進(jìn)行了重新的設(shè)計，并且完整AD102核心是96MB二級緩存，而RTX4090顯卡擁有72MB二級緩存，也可能是因此AdaLovelace架構(gòu)核心對顯存位寬的依賴性并不高。

技術(shù)講解：第三代RTCores與第四代TensorCores

以為剛才的CUDA數(shù)量與超大L2緩存就已經(jīng)很猛了，實(shí)現(xiàn)上AdaLovelace架構(gòu)最大的提升還是在第三代RTCores與第四代TensorCores身上。

第三代RTCores

RTCores用于光線追蹤加速，第三代RTCores的有效光線追蹤計算能力達(dá)到191TFLOPS，是上一代產(chǎn)品2.8倍。

在Ampere架構(gòu)中，第二代RTCores支持邊界交叉測試（BoxIntersectiontesting）和三角形交叉測試（TriangleIntersectiontesting），用于加速BVH遍歷和執(zhí)行射線三角交叉測試計算，雖然光線追蹤處理能力已經(jīng)比初代的Turing架構(gòu)核心更高效，但是隨著環(huán)境和物體的幾何復(fù)雜性持續(xù)增加，傳統(tǒng)的處理方式很難再以更高效率、正確反應(yīng)出的現(xiàn)實(shí)世界中的光線，尤其是光的運(yùn)動準(zhǔn)確性。

所以在第三代RTCores增加了兩個重要硬件單元：OpacityMicromapEngine與DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine，主要是用于alpha通道的加速，可以將alpha測試幾何體的光線追蹤速度提高2倍。

在傳統(tǒng)光柵渲染中，開發(fā)人員使用一些Alpha通道的素材來實(shí)現(xiàn)更高效的畫面渲染，例如Alpha通道的葉子或火焰等復(fù)雜形狀的物體。但在光線追蹤時代，這傳統(tǒng)的做法會為光線追蹤帶為不少無效的計算，例如運(yùn)動性的光線多次通過一塊葉子，光線每擊中一次葉子，都會調(diào)用一次著色器來確定如何處理相交，這時就會做成嚴(yán)重的執(zhí)行成本與時間等待成本。

而OpacityMicromapEngine用于直接解析具有非不透明度光線交集的不透明度狀態(tài)

三角形。根據(jù)Alpha通道的不透明，透明與未知等三個不同的塊狀態(tài)進(jìn)行處理：透明則直接忽略繼續(xù)找下一個，不透明塊則記錄并告之命中，而未知的則交給著色器來確定如何處理，這樣GPU很大部分都不需要進(jìn)行著色器的調(diào)試處理，能夠?qū)崿F(xiàn)更為高效的性能。

DisplacedMicro-MeshesEngine

如果說OpacityMicromapEngine加速的是面處理，那么DisplacedMicro-MeshesEngine就是幾何曲面細(xì)節(jié)的加速器。如上圖所示，在AdaLovelace架構(gòu)中，通過1個基底三角形+位移地圖，就可以創(chuàng)建出一個高度詳細(xì)的幾何網(wǎng)格，所需要資源占用比二代RTCores更低，效率也更高。

通過NVIDIA給出的創(chuàng)建14:1珊瑚蟹例子來說事，這里我們需要需要1.7萬個微網(wǎng)格、160萬個微三角形，在AdaLovelace架構(gòu)中BVH創(chuàng)建速度可加快7.6倍，存儲空間縮小8.1倍。DisplacedMicro-MeshesEngine起到了關(guān)鍵性的作用，其將一個幾何物體根據(jù)不同細(xì)節(jié)分成密度不一的微網(wǎng)絡(luò)處理，紅色密度超高，細(xì)節(jié)處理越為復(fù)雜。相應(yīng)的低密度微網(wǎng)絡(luò)區(qū)域則可以釋放更多的資源與存儲空間，這樣DisplacedMicro-MeshesEngine就可以幫助BVH加速過程，減少構(gòu)建時間和存儲成本。

同時AdaLovelace架構(gòu)SM中新增了著色器執(zhí)行重排序（ShaderExecutionReordering，SER），這是由于光線追蹤不再只有強(qiáng)光或者陰影渲染處理，未來將會更多的是在光線的運(yùn)動性，這樣光線就會變得越來越復(fù)雜，想要第三代RTCores與第四代TensorCores有著更高的執(zhí)行效率，那就得為他們來安排一位管家。而著色器執(zhí)行重排序（SER）就是為了能夠即時重新安排著色器負(fù)載來提高執(zhí)行效率，為光線追蹤提供2倍的加速，也能更好地利用GPU資源。不過目前仍未有實(shí)例，想實(shí)現(xiàn)這個功能，還得游戲與開發(fā)工具的支持才行。

第四代TensorCores

TensorCores是專門為執(zhí)行張量/矩陣運(yùn)算而設(shè)計的專用執(zhí)行單元，這些運(yùn)算是深度學(xué)習(xí)中使用的核心計算功能。第四代TensorCores新增FP8引擎，具有高達(dá)1.32petaflops的張量處理性能，超過上一代的5倍。

9DLSS3技術(shù)講解

技術(shù)講解：DLSS3

或者說第四代TensorCores太硬核你不會知道是啥？提升意義在哪？但是TensorCores最經(jīng)典的應(yīng)用DLSS你肯定會知道，這一次AdaLovelace架構(gòu)支持NVIDIA最新的DLSS3技術(shù)。

之前我們也聊過DLSS技術(shù)，其設(shè)計之初是為了彌補(bǔ)光線追蹤技術(shù)后的性能損失，具體的表現(xiàn)為開啟光線追蹤技術(shù)后游戲幀數(shù)大幅度的下降，甚至很難保證游戲流暢的運(yùn)行。于是DLSS使用低分辨率內(nèi)容作為輸入并運(yùn)用AI技術(shù)輸出高分辨率幀，從而提升光線追蹤的性能。

在DLSS3中包含了三項(xiàng)技術(shù)：DLSS幀生成、DLSS超分辨率（也稱為DLSS2）和NVIDIAReflex。你可以理解為DLSS3是在DLSS2的基礎(chǔ)上，新增了DLSS幀生成技術(shù)；而后兩技術(shù)中，DLSS超分辨率只需要GeForceRTX顯卡都能使用上，NVIDIAReflex則是GeForce900系列以后的顯卡都用使用上。

想實(shí)現(xiàn)DLSS幀生成可不簡單，這需要配合上AdaLovelace架構(gòu)的GeForceRTX40系列顯卡才行。DLSS幀生成技術(shù)原理是：利用AI技術(shù)生成更多幀，以此提升性能。DLSS會借助GeForceRTX40系列GPU所搭載的全新光流加速器分析連續(xù)幀和運(yùn)動數(shù)據(jù)，進(jìn)而創(chuàng)建其他高質(zhì)量幀，同時不會影響圖像質(zhì)量和響應(yīng)速度。

從Ampere架構(gòu)開始，NVIDIA顯卡就已經(jīng)支持了光流加速器，而AdaLovelace架構(gòu)的光流加速器升級到了第二代，其提供了高達(dá)300TeraOPS(TOPS)，比安培架構(gòu)的初代光流加速器（OpticalFlowAcceleration，OFA）快2倍以上。為了實(shí)現(xiàn)DLSS幀生成，OFA扮演了重要的角色，其配合上新的運(yùn)行?量分析算法在DLSS3技術(shù)框架內(nèi)實(shí)現(xiàn)精確和高性能的幀生成能力。

另外，由于DLSS幀生成是在GPU上作為后處理執(zhí)行的，那么即使在游戲受到CPU性能限制的時候，我們同樣能夠從中獲得更好的游戲性能提升。尤其是那種物理計算密集型的游戲或大型場景游戲，DLSS2均可以讓GeForceRTX40系列顯卡以高達(dá)兩倍于CPU可計算的性能來渲染游戲。

最后由于DLSS3是建立在DLSS2基礎(chǔ)之上的，游戲開發(fā)者可以在已支持DLSS2或NVIDIAStreamline的現(xiàn)有游戲中快速集成該功能，所以DLSS3已在游戲生態(tài)得到廣泛應(yīng)用，目前已有超過35款游戲和應(yīng)用即將支持該技術(shù)。

閱讀小亮點(diǎn)：NVIDIAReflex

NVIDIAReflex也是DLSS3其中的一環(huán)，它可以使GPU和CPU同步，確保最佳響應(yīng)速度和低系統(tǒng)延遲。

想要實(shí)現(xiàn)端對端的最低延遲，你需要確保游戲、顯示器以及鼠標(biāo)三者都同時支持并開啟了Reflex技術(shù)。

當(dāng)GeForceRTX40系列顯卡和NVIDIAReflex搭配上后，直接達(dá)到1440p分辨率360FPS的體驗(yàn)，這著實(shí)是性能有點(diǎn)強(qiáng)勁了。

在GTC2022大會時已經(jīng)透露將會還有4款1440p分辨率的新型G-SYNC電競顯示器將要發(fā)布，包括采用mini-LED技術(shù)的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款顯示器刷新率均為300Hz，而最猛的是ASUSROGSwift360HzPG27AQN，刷新率直接來到了360Hz。

但唯一一個問題就在于，部分顯示器廠商認(rèn)為此類產(chǎn)品受眾人群較少，會降低此類顯示器的產(chǎn)能，甚至產(chǎn)品就已經(jīng)被內(nèi)部PASS掉，所以1440p360Hz是很美好，但現(xiàn)實(shí)也是相當(dāng)?shù)墓歉小?/p>

技術(shù)講解：雙NVIDIA編碼器（NVENC）

GeForceRTX40系列顯卡還有一個全新的升級，那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支持H.264與H.265，還支持開放式視頻編碼格式AV1。

而由于AV1是一種免版稅的視頻編碼格式，上游軟件廠商與下游戲的配套端都在大力推廣此編碼格式，我們也會看到越來越多的硬件與軟件支持AV1格式，包括剪映專業(yè)版、DaVinciResolve、以及AdobePremierePro較為流行的Voukoder插件均支持，且均可通過編碼預(yù)設(shè)使用雙編碼器，這樣我們等待視頻導(dǎo)出的時間縮短將近一半。

不單是視頻制作軟件，AV1格式也將會是主播、游戲直播UP主們的新寵兒，在保證畫面最高質(zhì)量的情況下，AV1編碼器可將效率提高40%，同時顯卡的占用也更低。包括OBSStudio一一代軟件中也會增加AV1格式的支持。另外我們還能通過GeForceExperience和OBSStudio錄制高達(dá)8K60的內(nèi)容，這樣我們做游戲錄制也會變得更為輕松。

包括我們之后測試時使用的游戲內(nèi)錄視頻都是支持AV1格式，同時雙編碼器NVENC在資源占用和適配上做得越來越好。

機(jī)單的名字起得越個性，熱度就越高，這不，一個叫做“風(fēng)情萬種”的配置單就登上了攢機(jī)單熱門，點(diǎn)進(jìn)來一看，這個5000元的配置是一個影馳為核心的全家桶，除了CPU和機(jī)械硬盤之外清一色的影馳。

其實(shí)全家桶配置單還是挺常見的，一開始我也沒想到影馳的產(chǎn)品線也有這么全，不過在攢機(jī)的時候別單純?yōu)榱似放贫雎粤祟A(yù)算和硬件分配的合理性，尤其是碰上板U不搭，那可就誰也救不了你了，下面我們就來看看這套配置。

首先還是板U套裝，5000元預(yù)算配到12490F是非常標(biāo)準(zhǔn)的配置，但是配了一個B360主板？這倆接口都不一樣的，買回來意味著得退貨，至少換一個影馳B760M-G D4能插上的主板才行啊，如果不會選，也可以直接買板U套裝，可以很大程度上避免這個問題。

顯卡這里屬實(shí)有點(diǎn)低，GTX 1050Ti屬于早就過時的顯卡了，如果預(yù)算只有3000元還可以考慮，但是預(yù)算都有5000元了，影馳同樣有RTX 4060顯卡，同樣能把整機(jī)控制在5000元，圖形和游戲性能直接飆升你難道不心動嗎？

存儲這里還是有點(diǎn)摳門，首先是8G內(nèi)存就不夠看的，現(xiàn)在內(nèi)存這么便宜，109元的金屬大師直接插兩條，300元可以拿下1TB的固態(tài)，PCIe 4.0 x4接口享受5000MB/s的速度，比機(jī)械硬盤好太多。

最后看一下機(jī)電，好家伙，直接買了1199元的影馳包豪斯機(jī)箱，我算是知道5000預(yù)算都去哪了。其實(shí)影馳同樣有時尚的機(jī)箱，沐光PLUS白色海景房機(jī)箱采用雙面?zhèn)韧冈O(shè)計，支持9把風(fēng)扇也有很好的散熱表現(xiàn)，關(guān)鍵是價格只要包豪斯的零頭，省下這些錢升級顯卡要劃算得多。電源這里影馳可選的不多，399元的電競大師GL650 金牌650W就可以滿足需求，而且高效能更省電。

最后再簡單總結(jié)一下，確定預(yù)算和要求（比如全家桶）之后還是要優(yōu)先搭配CPU和顯卡，因?yàn)檫@兩者直接決定了電腦性能的上限，然后就是合適的主板，內(nèi)存和硬盤要根據(jù)預(yù)算搭配，也盡量要富裕一些，機(jī)箱和電源的重要性偏后一些，雖然說不能挑最便宜的，但是也別擠占其他硬件的預(yù)算，最后你就能獲得適合自己的全家桶了。

(8328203)

近年底，相信也有不少小伙伴開始攢機(jī)、換機(jī)的準(zhǔn)備，那么又有哪些產(chǎn)品值得推薦呢？GeForce RTX 30 系列 GPU 強(qiáng)勁的性能令玩家和設(shè)計者青睞，其采用了第 2 代 NVIDIA RTX 架構(gòu) - NVIDIA Ampere 架構(gòu)，搭載全新的 RT Core、Tensor Core 及流式多處理器，可帶來逼真的光線追蹤效果和出色的 AI 性能。

無論是顯卡或者是搭載 GeForce RTX 30 系列筆記本電腦 GPU 的筆記本電腦產(chǎn)品在年末大促都有好價，即刻入手升級，年末大作暢享高幀高畫質(zhì)低延遲。

年末也是各種大作爆發(fā)的時期，如《漫威暗夜之子》等，支持 NVIDIA DLSS 2 和光線追蹤 GeForce RTX 游戲玩家可在與邪惡勢力戰(zhàn)斗時，暢享 NVIDIA DLSS 2 和高級光線追蹤效果加持的超燃畫面。光線追蹤反射和光線追蹤環(huán)境光遮蔽將使視覺保真度更上一層樓。DLSS 2 將提供在最高分辨率下實(shí)現(xiàn)這些效果所需的性能，讓玩家在 PC 上玩漫威暗夜之子時獲得出色體驗(yàn)。

下面筆者不妨推薦幾款 GeForce RTX 30 系列顯卡，近期想要攢機(jī)的朋友一定不要錯過了，另外也相信這些強(qiáng)悍的產(chǎn)品，會在今后的工作、游戲生活中祝你一臂之力。

華碩 TUF-RTX 3060 Ti-8GD6X-GAMING

據(jù)介紹，全新的 TUF GAMING 系列顯卡經(jīng)過精心設(shè)計，為玩家?guī)韽?qiáng)勁的性能和更效率的散熱能力。華碩 TUF GAMING 顯卡采用升級版的軸流風(fēng)扇，三個風(fēng)扇協(xié)同運(yùn)行，以滿足高發(fā)熱的散熱需求。雙滾珠風(fēng)扇軸承，運(yùn)行更加高效，并且壽命更長。

此外，華碩 TUF GAMING 顯卡還巧妙的反轉(zhuǎn)中央風(fēng)扇設(shè)計，以減少散熱模組內(nèi)的空氣亂流。同時風(fēng)扇具備智能停轉(zhuǎn)功能，當(dāng)顯卡溫度低于 55 度時，風(fēng)扇可停轉(zhuǎn)來保持安靜。其他方面還支持神光同步等功能。

規(guī)格方面，華碩 TUF 3060Ti 采用了 NVIDIA Ampere 架構(gòu)，CUDA 處理器數(shù)量 4864 個，核心頻率 1410MHz~1755MHz，顯存容量 8GB GDDR6，顯存帶寬 448GB / s，顯存頻率 14Gbps，采用了 8Pin 供電接口。

影馳 RTX 3060 金屬大師 OC

作為入門級別電競專業(yè)游戲顯卡，影馳 RTX 3060 沿用了 RTX 3060 12G 的散熱規(guī)格，散熱性能強(qiáng)大，可助力顯卡完全釋放其優(yōu)異的性能。

具體來看，影馳 RTX 3060 金屬大師 OC 配備了 3 個尺寸在 90mm 的散熱風(fēng)扇，均采用 11 葉靜霜扇葉，從而達(dá)到高效散熱以及靜音的效果。接口部分，提供了 3DP+HDMI 的接口組合，單 6pin 的顯卡輔助供電。

規(guī)格方面，整卡搭載了高能核心，NVIDIA Ampere 架構(gòu)加持，輔以新一代 8GB GDDR6 高速顯存，極速渲染，精彩視界，配合全新光線追蹤技術(shù)與 DLSS 技術(shù)，可以帶來身臨其境般的體驗(yàn)。

七彩虹 iGame GeForce RTX 3060 Ti Ultra W OC 8G LHR

iGame RTX 3060 Ti Ultra W 使用基于 NVIDIA Ampere 架構(gòu)的 GA104 核心，其晶體管數(shù)量高達(dá) 174 億個，支持全新的 RTX IO、NVIDIA Broadcast、NVIDIA Reflex 等特性。其最大頻率為 1770MHz，包含 4864 個流處理器，152 個第三代張量核，38 個第二代光追核，152 個紋理單元，80 個光柵處理單元。顯存方面采用了三星 8GB GDDR6 顯存，顯存頻率為 14000MHz，顯存位寬為 256bit，顯存帶寬為 448GB / s。

設(shè)計上，相比于千篇一律的黑色顯卡，七彩虹 iGame GeForce RTX 3060 Ti Ultra W OC 初晴限定版白色的設(shè)計無疑能讓其在眾多 RTX 3060 Ti 顯卡中脫穎而出。純白的外觀搭配蒸汽波粉藍(lán)亮片，非常個性時尚。

散熱方面，iGame RTX 3060 Ti Ultra W 采用了 2 個 90 毫米和 1 個 80 毫米捕風(fēng)手風(fēng)扇。iGame 全新的 13 翼扇葉，可以實(shí)現(xiàn)更大風(fēng)壓和更大的進(jìn)風(fēng)量，以達(dá)到更快散熱的效果。

供電方面，iGame RTX 3060 Ti Ultra W 采用雙 8 Pin 電源 8+2 相供電。

七彩虹 iGame GeForce RTX 3060 Ti Ultra W OC 8G LHR

供電方面，iGame RTX 3060 Ti Ultra W 采用雙 8 Pin 電源 8+2 相供電。

七彩虹 iGame GeForce RTX 3060 Ti Ultra W OC 8G LHR

供電方面，iGame RTX 3060 Ti Ultra W 采用雙 8 Pin 電源 8+2 相供電。

聯(lián)想拯救者 Y9000P

聯(lián)想拯救者 Y9000P 2022 是一臺各方面都比較水桶的機(jī)器，筆者比較推薦 140W RTX 3060 筆記本電腦 GPU+12 代酷睿 i7 的甜品配置。

它的外觀造型硬朗，正面會發(fā)光的大 Y 燈，92.3% 的高屏占比，全尺寸鍵盤 + 全尺寸方向鍵，接口數(shù)量豐富，配有 3A3C 口（包含一個雷電 4 接口和支持 135W 便攜快充的全功能 USB-C 口），HDMI2.1 接口，RJ45 千兆網(wǎng)口，3.5mm 音頻接口，還有攝像頭開關(guān)，規(guī)格和實(shí)用性很高。

聯(lián)想拯救者 Y9000P 的屏幕素質(zhì)很強(qiáng)，2.5K / 165Hz / 3ms / 500nit 的 IPS 電競屏，16:10 比例擁有更大的顯示面積，四面窄邊框但依舊保留頂部攝像頭，自帶 XRite 色彩管理和 DC 調(diào)光，HDR400 認(rèn)證，TUV 硬件級防藍(lán)光，和 G-Sync 畫面防撕裂技術(shù)一個不缺。

同樣，聯(lián)想拯救者 Y9000P 支持 DDG 智能三模顯示切換，3 種性能模式切換以及霜刃 Pro 散熱系統(tǒng) 4.0，以確保強(qiáng)大的性能釋放，在野獸模式下 CPU 最高功耗可達(dá) 105W。

宏碁非凡 X

最后推薦的是宏碁非凡 X，預(yù)算不多的小伙伴和僅是輕度游戲和創(chuàng)作的朋友，可選擇這款產(chǎn)品。

核心配置上，宏碁 14 英寸款非凡 X 搭載 RTX 3050 筆記本電腦 GPU 和 12 核的 i5-1240P 處理器，，配備大尺寸風(fēng)扇 + 雙銅管散熱，50W 雙烤性能釋放。其他方面，這款筆記本配備了 16GB LPDDR5 內(nèi)存和 512GB PCIe 4.0 SSD。

屏幕方面，這款筆記本配備了一塊 14 英寸的 2.2K 全面屏，16:10 比例，92% 屏占比，100% sRGB 色域，支持 DC 調(diào)光。

設(shè)計方面，這款筆記本采用了鋁合金機(jī)身，紅綠雙色可選，輕至 1.4kg，薄至 17.9mm，配備兩個雷電 4 接口、一個 HDMI 接口以及雙高速 USB-A 接口。

寫在最后：

推薦完上面 RTX 30 級顯卡、筆記本，相信你已經(jīng)有了自己的選擇。心動的小伙伴，不能錯過這次機(jī)會了，抓住年末大促的機(jī)會即刻升級，暢玩年末的各種大作吧。

操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

華碩 TUF-RTX 3060 Ti-8GD6X-GAMING

影馳 RTX 3060 金屬大師 OC

七彩虹 iGame GeForce RTX 3060 Ti Ultra W OC 8G LHR

七彩虹 iGame GeForce RTX 3060 Ti Ultra W OC 8G LHR

七彩虹 iGame GeForce RTX 3060 Ti Ultra W OC 8G LHR

聯(lián)想 拯救者 Y9000P

宏碁 非凡 X

聯(lián)想拯救者 Y9000P

宏碁非凡 X