前言
隨著NVIDIAGEFORCERTX4090FounderEdition正式性能解禁,GEFORCERTX4090從RTX3090Ti手上接下了性能王座的位置。當(dāng)然FE公版僅是有限發(fā)售了,真正貼近我們的永遠(yuǎn)都是AIC的非公版顯卡。之前我們就已經(jīng)對影馳GEFORCERTX4090金屬大師OC(下述簡稱“影馳RTX4090金屬大師OC”)進(jìn)行了開箱圖賞,那么今天我們就來看看此款顯卡的性能表現(xiàn)如何?
影馳GEFORCERTX4090金屬大師OC
作為首批推出的AIC非公版產(chǎn)品,影馳GEFORCERTX4090金屬大師OC是一款超頻版的非公版顯卡,有著比FE公版更高的Boost頻率;同時其外觀與散熱規(guī)格都比上一代的產(chǎn)品要更大更強(qiáng)。
整塊顯卡的外包裝設(shè)計延續(xù)了金屬大量系列的設(shè)計元素,只不過這次外包裝也隨著顯卡的大而做得“更大”。而細(xì)心的你肯定會發(fā)現(xiàn),這一代的NVIDIA型號標(biāo)簽設(shè)計風(fēng)格變更了,真簡潔。
如果用一個詞來形容RTX30系列時代的金屬大師那肯定會是“圓潤”,那新一代的影馳RTX4090金屬大師OC肯定是“硬朗”。顯卡外觀采用了全新的設(shè)計,完全是起棱起角,設(shè)計思路是以宇宙魔方的方塊造型為藍(lán)本。
單是這個金屬外罩就很在份量,整個都是以金屬來打造,一體成型、修邊、打磨、噴涂,這個外罩看著就想到成本不低了。
顯卡背部是一整塊的金屬背板,中間做了拉絲處理,風(fēng)格與正面的區(qū)別開來;同時尾部為鏤空設(shè)計,加快熱量排出。
接口方面較為常規(guī):3個DP1.4a與1個HDMI2.1的組合,最多可以實(shí)現(xiàn)3+1多顯示器組合的輸出。
細(xì)節(jié)做工真是很可以,外殼的噴涂細(xì)節(jié)方向比一般的客制化鋁垞都要好些。而且筆者認(rèn)為這種不規(guī)劃的條形設(shè)計,其實(shí)玩家們完全可以利用涂裝的形式打個性化的顯卡外觀。
中間風(fēng)扇環(huán)還采用了CNC削邊處理
頂部鏤空有一排的出風(fēng)口,橫跨整個顯卡的頂部,加快熱量的排出
至于輔助供電接口方面,RTX40系列顯卡基本都會采用最新12VHPWR接口,電源沒此接口的也不怕,只需要確保電源額定功率足夠850W以上,那么可以利用NVIDIA配送的4*8Pin轉(zhuǎn)12VHPWR配套使用。
2影馳RTX 4090金屬大師拆解
影馳GEFORCERTX4090金屬大師OC,拆解
從RTX30系列顯卡開始,PCB大小不再是顯卡性能衡量的標(biāo)準(zhǔn)。旗艦級的產(chǎn)品往往在設(shè)計與用料上更為精細(xì)化,集成度高,用料強(qiáng),PCB相對散熱就顯得小。但中低端產(chǎn)品,走的是成本路線,PCB再大,成本同樣會被壓縮起來。
RTX4090金屬大師OC采用了無燈化的設(shè)計,整塊顯卡一個燈都沒有,PCB走線也變得更為簡潔。上圖為連接兩組風(fēng)扇的接口,一黑一白防呆設(shè)計。
隱藏式的PCB金屬加強(qiáng)件,直接安裝到顯卡散熱模塊上,讓PCB變得更穩(wěn)固,避免PCB變形。要知道PCB較細(xì)且集成度高,而散熱模塊的重量較高,加上PCB金屬加強(qiáng)件后,即使不使用顯卡支架也不會出現(xiàn)嚴(yán)重的掉頭現(xiàn)象。
顯存與供電部分全都配上高系數(shù)導(dǎo)熱墊輔助散熱,顯存位置更是直接在真空腔均熱板上,有著更高的散熱效能。
拆下PCB加強(qiáng)件后,可看到前后的供電輔助散熱部分全都原生自散熱器上,相比模塊化的散熱效能會更高一些。
這一代的影馳RTX4090金屬大師OC采用了全新一代寒光星δ(德爾塔)散熱系統(tǒng),由三把10cm直徑風(fēng)扇、真空腔均熱板底座、4條8mm+4條6mm鍍鎳復(fù)合熱管,以及大面積的散熱鱗片構(gòu)成。
三把風(fēng)扇直接固定在散熱模塊上,每個風(fēng)扇擁有11片靜霜扇葉,支持PWM控制,可以實(shí)現(xiàn)更高的風(fēng)壓與風(fēng)量,并支持智能啟停功能。
兩段式的散熱模塊,其中4條8mm粗與2條6mm熱管直接貫穿整個散熱模塊;熱管與散熱鰭片之前采用了成熟的回流焊接工藝焊接在一起,配上散熱鰭片的扣FIN工藝,可以讓散熱模塊有著更高效的散熱表現(xiàn)。
成熟的扣Fin工藝
如果你不是明白什么叫大面積的散熱鰭片,這里筆者為大家量取了散熱鰭片的厚度:43mm,那你應(yīng)該相像到這個散熱模塊有多大了吧?
影馳RTX4090金屬大師OC高集成度的PCB,14層高規(guī)格PCB,18+4相供電設(shè)計,雖然同樣有一定的空焊位置,但仍比FE公版的供電配置要強(qiáng)些。
顯卡PCB背部則簡潔一些,主要是一些控制芯片,核心背部電容位置使用了四個POSCAP(導(dǎo)電聚合物鉭電容)代替四組MLCC(一組10個MLCC),電氣性能更強(qiáng)一些。
ADA架構(gòu)的AD102-300核心,性能強(qiáng)勁的保證
四周是12顆美光GDDR6X顯存,顆粒編號為D8BZC,共組成24GB384-bit的顯存規(guī)格。
供電位置同樣被設(shè)計在了PCB兩端,只是影馳RTX4090金屬大師OC顯卡有著更強(qiáng)勁的18+4相供電的設(shè)計。
每相供電均采用了安森美家提供的DrMos芯片,封裝編碼為:NCP30215,最大持續(xù)輸出電路為55A。
供電控制芯片采用了三顆,均在PCB背部,分別是:uP9512、uP9521,以及uS5650Q。其中uP9512與uP9521共同管理核心供電,可以做精細(xì)化的供電管理,而uS5650Q則是主要負(fù)責(zé)顯存供電部分。
12VHPWR接口
NVIDIA統(tǒng)一配發(fā)的4*8Pin轉(zhuǎn)12VHPWR轉(zhuǎn)換線
影馳為大家配備的金屬支架
3測試平臺介紹
測試平臺介紹:
由于測試對對象影馳RTX4090金屬大師OC為旗艦級性能的顯卡,所以我們在其它配件的先用上都挑選一些較為頂級的設(shè)備。三套件為:INTEL目前最強(qiáng)的處理器i9-12900K,微星MEGZ670ACE主板,以及金士頓的64GBDDR5-6000高規(guī)格內(nèi)存。
同時測試前我們得確認(rèn)主板BIOS里的ResizableBAR功能開啟,這樣才能發(fā)揮出RTX4090顯卡強(qiáng)勁的性能。
海韻PRIMEGX1300電源80PLUS金牌全模
電源方面使用了海韻PRIMEGX130080PLUS金牌全模電源,其是一款1300W額定功率的電源,可以滿足各玩家頂級平臺的供電需求。
同時還提供了一條雙8Pin轉(zhuǎn)12VHPWR模組線,可以提供600W供電需求,滿足RTX4090顯卡。
4理論&游戲性能測試
性能測試:
理論性能
從3DMARK理論性能來看,影馳RTX4090金屬大師OC有著比上代RTX3090Ti更為出色的性能表現(xiàn),約為58.7%性能提升。這已經(jīng)是近幾年來NVIDIA旗艦顯卡提升最猛的一代之一,只能說這次AdaLovelace架構(gòu)與TSMC4N工藝的配合著實(shí)給我們帶來了更多的驚喜。
尤其是在光線追蹤以及DLSS項(xiàng)目上,影馳RTX4090金屬大師OC提升最為明顯,基本能達(dá)到上代顯卡的1.5倍以上。
AIDA64 GPGPU理論性能測試
而來到算力方面,AIDA64GPGPU部分大部可以參考參考,這一部分的算力提升甚至比理論性能更猛,達(dá)到了80.8%,AdaLovelace架構(gòu)下高規(guī)格帶來的算力提升超級恐怖的說。尤其是SHA-1HASH算力的提供甚至達(dá)到了10倍,這不好是國內(nèi)礦民環(huán)境不太好,不然這顯卡又會是空氣卡了。
游戲性能
游戲性能方面,我們選用大量的光線追蹤游戲,以及3A游戲大作。同時測試了2K、4K,以及DSR8K三個不同的分辨率,可看到除著分辨率的越高,影馳RTX4090金屬大師OC顯卡性能那提升是越來越明顯。
拿4K分辨率來說,絕大部分的游戲在影馳RTX4090金屬大師OC下都是以高流暢度運(yùn)行的。甚至在DLSS技術(shù)的加持下,能達(dá)到了120FPS以上,這樣我們配備上4K144顯示器,那是真的爽了。
5DLSS3性能測試
DLSS3性能測試
AdaLovelace架構(gòu)最大的亮點(diǎn)優(yōu)勢就是支持最新的DLSS3,這里我們也一并測試一多款DLSS測試程序與游戲。影馳RTX4090金屬大師OC在DLSS3上的性能表現(xiàn)也是比較理想的,可看到在4K分辨率后,DLSS3技術(shù)為我們帶來了更高的幀數(shù),即使是8K分辨率下也能達(dá)到90FPS以上。
而我們再測試一下支持DLSS3技術(shù)的賽博朋克2077內(nèi)測版本,以DLSSOFF為基準(zhǔn)的情況下,影馳RTX4090金屬大師OC在開啟DLSS2游戲幀數(shù)已經(jīng)有著明顯的提升,可以達(dá)到77FPS;而當(dāng)開啟DLSS3+ReFlex功能后,游戲幀數(shù)再一次提升到了146FPS,而且游戲延遲也越來越低。
F122
同樣的F122游戲中,4K分辨率下僅TAA設(shè)置的游戲流暢度僅為75,這說明了RTX4090不開啟DLSS功能的游戲性能也很強(qiáng)。但是當(dāng)開始DLSS3后,無論是質(zhì)量檔還是性能檔,其游戲流暢度都高于120FPS,對于一款賽車游戲來說,這流暢度是真再爽不過了。
DLSS3-F122-DLSS-Balance
DLSS3-F122-DLSS-Perfoemance
DLSS3-F122-DLSS-Quality
DLSS3-F122-DLSS-SuperPerfoemance
DLSS3-F122-TAA
UnrealEngine5LyraDLSS3
Unreal-Engine-5-Lyra-DLSS3-OFF
Unreal-Engine-5-Lyra-DLSS3-ON
而最后我們還測試了利用UnrealEngine5引擎打造的LyraDEMO,此DEMO除了能夠支持最新的DLSS3技術(shù)外,還帶上了NVIDIAReflex。筆者這里上傳了兩個圖片給大家看看LyraDEMO里的DLSS3開啟與關(guān)閉的畫質(zhì)對比,游戲流暢度自然是DLSS3開啟后提升較為明顯的,達(dá)到192FPS,而PCL延遲也進(jìn)一步降低到了50ms的水平。
6創(chuàng)作者能力測試
創(chuàng)作者性能測試:
來到生產(chǎn)力方面,我們先來看看專業(yè)級別的生產(chǎn)力會是怎么樣的表現(xiàn)。Blender與OctanceBench測試中影馳RTX4090金屬大師OC性能表現(xiàn)同樣的給力,而且80%以上的提升幅度著實(shí)厲害。即使是在SPEX的專業(yè)領(lǐng)域測試中,影馳RTX4090金屬大師OC也沒讓人失望,比上代旗艦約54%的性能提升。尤其是此款顯卡才賣1W3左右,這價格對于專業(yè)領(lǐng)域用戶來說實(shí)在是太便宜了。
至于視頻制作方面,我們測試了PCMAK10整機(jī)性能、ULProcyon、以及PugetBench的測試,影馳RTX4090金屬大師OC在制作視頻方面的提升關(guān)不太明顯,可能是測試所使用的軟件與工程文件不夠足以發(fā)揮出RTX4090顯卡的性能。
所以我們再做了一個RTX40系列顯卡內(nèi)置的第8代NVENC雙編碼器的測試,測試片源來自NVIDIA提供的8K片源與工程文件,影馳RTX4090金屬大師OC在8K30AV1視頻輸出到H.265格式視頻時明顯有著更短的視頻,尤其是8K30規(guī)格的視頻用時更短一些。而且還支持AV1格式的輸出,這實(shí)在是再好不過了。
同時MAGICMASK工程文件的測試與ON1Resize的項(xiàng)目測試中也表明,影馳RTX4090金屬大師OC內(nèi)置的第8代NVENC雙編碼器很強(qiáng)大,而且利用RTX40核心里的黑技術(shù),可以讓渲染的時候更短,大大的加快效率。
7超頻&功耗&總結(jié)
超頻
超頻方面,筆者手上這塊影馳RTX4090金屬大師OC顯卡BIOS里最大的功耗限定為480W,若是動手能力較差的網(wǎng)友可以使用影馳XTREMETUNER中的AIOC超頻選項(xiàng),通過一系列的檢測,軟件給出了核心頻率+165MHz設(shè)定,這頻率更為安全可靠,性能提升還是可以的。
而對于筆者來說,那肯定是不滿足的,先來一個基本的盤,直接核心頻率+210MHz,顯存+200MHz,這樣顯卡核心頻率就Boost到了3015MHz,并且順利通過了Timespy壓力測試。
最后筆者直接把影馳RTX4090金屬大師OC顯卡超到了3090MHz的核心頻率,3DMARK測試中40秒檔的實(shí)際穩(wěn)定頻率為3075MHz,顯卡得分為37719,比默認(rèn)頻率的35781得分提升了5.4%。同時大家注意一下HWINFO64記錄下來的最高功率,只有455W,明顯是撞到功耗墻了,若是再解鎖功耗墻,相信頻率將會有更高的提升。
功耗與散熱
利用Furmark軟件進(jìn)行顯卡烤機(jī)測試,影馳RTX4090金屬大師OC顯卡占用率達(dá)到了99%,滿載功耗為448.1,基本就是限制在于450WTDP之下。顯卡的核心滿載溫度為66.3度,顯存滿載溫度為76.7度,溫度表現(xiàn)與噪音表現(xiàn)的確都比FE公版的要好一些。
新一代的RTX40系列顯卡對PCIe供電要求都較低,主要是來自12VHPWR的供電,滿載時就已經(jīng)達(dá)到了439W,所以筆者建議大家使用模組線,而非轉(zhuǎn)換線。筆者這個滿載的功耗有點(diǎn)高,對于線材和接口的要求更高了,所以NVIDIA轉(zhuǎn)換線上的30次插撥限制也并非隨便說說的。
總結(jié):
首先從外觀設(shè)計來說,筆者認(rèn)為新一代的影馳RTX4090金屬大師OC顯卡才是真正的金屬大師,硬朗的設(shè)計風(fēng)格,更讓玩家們所接受。全金屬的設(shè)計,也真正的達(dá)到了金屬“大師”級別,配合上RTX4090的性能表現(xiàn),那是真的絕了。
同時此款顯卡的性能表現(xiàn)的確給人不少的驚喜,60%以上的基礎(chǔ)性能提升,1.5倍的算力提升,以及2倍專業(yè)內(nèi)容性能的提升,這些都是相當(dāng)吸引人的,一塊顯卡就能達(dá)到了過去兩塊顯卡的地步,也怪不得這一代取消了NVLink的支持,因?yàn)榈拇_沒必要,雙卡適配也麻煩,現(xiàn)在就沒有一塊RTX4090不能干的事。
最后是價格方面,影馳RTX4090金屬大師零售報價為12999,與FE公版持平;影馳RTX4090金屬大師OC零售報價13499。總結(jié):有能力購買的真香顯卡。
8ADA架構(gòu)講解
AdaLovelace架構(gòu)講解
Turing、Ampere上兩代架構(gòu)核心均以人物來命名,前者是計算機(jī)科學(xué)之父——艾倫·麥席森·圖靈;后者則是“電學(xué)中的牛頓”——安德烈·瑪麗·安培,電流的國際單位安培就是以其姓氏命名。那AdaLovelace定非凡人,度娘一下果然,這是 人稱“數(shù)字女王”的阿達(dá)·洛芙萊斯,編寫了歷史上首款電腦程序,是被世界公認(rèn)的第一位計算機(jī)程序員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫喔。
從Turing架構(gòu)開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RTCore單元,以及面向AI推理的TensorCore單元,這革命性的創(chuàng)新使實(shí)時光線追蹤成為可能。而Ampere架構(gòu)則是全面的架構(gòu)改進(jìn),在加入新一代的二代RTCore和三代TensorCore基礎(chǔ)上,還有著更先進(jìn)的SM單元設(shè)計,這樣顯卡工作效率那是翻倍的提升。而來到AdaLovelace架構(gòu),同時是以效率提升為大前提,自然是引入了最新的第三代RTCores與第四代TensorCores單元,同時加入眾多新穎的黑科技,從執(zhí)行效率來說AdaLovelace架構(gòu)是上代Ampere架構(gòu)的2倍以上,甚至光線追蹤能力更是達(dá)到了恐怖的4倍性能。
在講述核心架構(gòu)前,我們先了解幾個關(guān)鍵詞:GeForceRTX4090、AdaLovelace、TSMC4N、608mm2、760億個晶體管、2倍性能功耗比。
大家?guī)е鴰讉€關(guān)鍵字來看上面的【顯卡規(guī)格參數(shù)對比】表格,就可以更容易讀懂上述表格了。最新一代的桌面顯卡GeForceRTX40系列均采用全新的AdaLovelace架構(gòu)核心,GeForceRTX4090的核心是AD102,目前AdaLovelace架構(gòu)核心中最為強(qiáng)大的,具有760億個晶體管、16384個CUDA核心和24GB高速美光GDDR6X顯存。
而GeForceRTX408016GB核心代號為AD103-300,擁有9728個CUDA核心和16GB高速美光GDDR6X顯存,顯存位寬也縮減到了256Bit;GeForceRTX408012GB規(guī)格要低一些,核心代號為AD104-400,擁有7680個CUDA核心和12GB美光GDDR6X顯存,顯存位寬僅為192Bit。這里由于NDA原因這里我們不再多說GeForceRTX4080系列相關(guān)的信息。
得益于NVIDIA與臺積電深度合作的TSMC4N制程工藝,GeForceRTX4090核心面積僅是608mm2(上代RTX3090Ti628mm2),在更小的核心面積下卻能塞下多達(dá)760億個晶體管,比上一代的Ampere架構(gòu)多出了約70%晶體管數(shù)量。
值得注意的是,制程工藝的提升不單能擁有更多的晶體管,其核心頻率更是能跑得很高,GeForceRTX4090Boost頻率就已經(jīng)達(dá)到了2520MHz,這樣在核心頻率與高規(guī)格的雙向保證下實(shí)現(xiàn)了比上代顯卡高達(dá)2倍的性能功耗比。
從GTC2022秋季大會中,其實(shí)我們就已經(jīng)發(fā)現(xiàn)了,目前GeForceRTX4090顯卡中配備的AD102-300核心其實(shí)并非完整的AD102核心。完整的AD102核心應(yīng)該包括了12個GPC(圖形處理集群)、72個TPC(紋理處理集群)、144個SM(流式多處理器)和?個帶有12個32Bit顯存控制器的384Bit顯存位寬。
再來看上面的GeForceRTX4090架構(gòu)圖,和完整版本的AD102核心對比起來就很容易看出差別。首先,GeForceRTX4090核心代號為AD102-300,其擁有9個完整規(guī)格的GPC(圖形處理集群,每個內(nèi)建6個TPC),與2個非完整的GPC(圖形處理集群,每個內(nèi)建5個TPC),共組成了64個TPC,那么SM單元自然就是128個了。至于顯存位寬方向那是相當(dāng)?shù)耐暾?84Bit。
如果你還是不太懂,這里筆者就逐一為了AdaLovelace架構(gòu)顯卡的構(gòu)成。
剛才我們已經(jīng)說到,一個完整的AdaLovelace架構(gòu)AD102核心內(nèi)部擁有12個GPC,而每個完整的GPC中包含了一個專用的RasterEngine(光柵化引擎),兩組ROPs共16個ROP(光柵化處理單元),以及6個TPC與12個SM單元。
全新的SM流式多處理器
AdaLovelace架構(gòu)中最大的亮點(diǎn)之一:全新的SM流式多處理器,每個SM包含了128個CUDA核心、1個第三代的RTCores,4個第四代TensorCores(張量核心)、4個TextureUnits(紋理單元)、256KBRegisterFile(寄存器堆),以及128KBL1數(shù)據(jù)緩存/共享內(nèi)存子系統(tǒng),于是這一個全新的SM單元有著超過上一代2倍之的性能表現(xiàn)。
過去的Turing架構(gòu)INT32計算單元與FP32數(shù)量是一致的,而兩者相加才組成了64個CUDA核心。但是Ampere架構(gòu)開始,左側(cè)的計算單元實(shí)現(xiàn)了FP32+INT32的計算單元并發(fā)執(zhí)行,也就是說CUDA核心數(shù)量翻倍到了128個。
再來看看AdaLovelace架構(gòu)的SM,F(xiàn)P32/INT32的計算單元組合,同樣實(shí)現(xiàn)了每個SM內(nèi)含128個CUDA的設(shè)計,看似提升不大,但是當(dāng)你了解到GeForceRTX4090擁有128個SM,16384個CUDA核心,那你也就應(yīng)該明白達(dá)82.6TFLOPS的著色器能力是如何實(shí)現(xiàn)的了,比上一代的RTX3090Ti顯卡的40TFLOPS,還真是提升了兩倍有多。
另外緩存方面AdaLovelace架構(gòu)也進(jìn)行了大規(guī)格的提升,首先每個SM單元中單獨(dú)配上了128KB的緩存,這樣RTX4090顯卡中就實(shí)現(xiàn)了163MBL1/共享內(nèi)存。其次核心的二級緩存進(jìn)行進(jìn)行了重新的設(shè)計,并且完整AD102核心是96MB二級緩存,而RTX4090顯卡擁有72MB二級緩存,也可能是因此AdaLovelace架構(gòu)核心對顯存位寬的依賴性并不高。
技術(shù)講解:第三代RTCores與第四代TensorCores
以為剛才的CUDA數(shù)量與超大L2緩存就已經(jīng)很猛了,實(shí)現(xiàn)上AdaLovelace架構(gòu)最大的提升還是在第三代RTCores與第四代TensorCores身上。
第三代RTCores
RTCores用于光線追蹤加速,第三代RTCores的有效光線追蹤計算能力達(dá)到191TFLOPS,是上一代產(chǎn)品2.8倍。
在Ampere架構(gòu)中,第二代RTCores支持邊界交叉測試(BoxIntersectiontesting)和三角形交叉測試(TriangleIntersectiontesting),用于加速BVH遍歷和執(zhí)行射線三角交叉測試計算,雖然光線追蹤處理能力已經(jīng)比初代的Turing架構(gòu)核心更高效,但是隨著環(huán)境和物體的幾何復(fù)雜性持續(xù)增加,傳統(tǒng)的處理方式很難再以更高效率、正確反應(yīng)出的現(xiàn)實(shí)世界中的光線,尤其是光的運(yùn)動準(zhǔn)確性。
所以在第三代RTCores增加了兩個重要硬件單元:OpacityMicromapEngine與DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine,主要是用于alpha通道的加速,可以將alpha測試幾何體的光線追蹤速度提高2倍。
在傳統(tǒng)光柵渲染中,開發(fā)人員使用一些Alpha通道的素材來實(shí)現(xiàn)更高效的畫面渲染,例如Alpha通道的葉子或火焰等復(fù)雜形狀的物體。但在光線追蹤時代,這傳統(tǒng)的做法會為光線追蹤帶為不少無效的計算,例如運(yùn)動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調(diào)用一次著色器來確定如何處理相交,這時就會做成嚴(yán)重的執(zhí)行成本與時間等待成本。
而OpacityMicromapEngine用于直接解析具有非不透明度光線交集的不透明度狀態(tài)
三角形。根據(jù)Alpha通道的不透明,透明與未知等三個不同的塊狀態(tài)進(jìn)行處理:透明則直接忽略繼續(xù)找下一個,不透明塊則記錄并告之命中,而未知的則交給著色器來確定如何處理,這樣GPU很大部分都不需要進(jìn)行著色器的調(diào)試處理,能夠?qū)崿F(xiàn)更為高效的性能。
DisplacedMicro-MeshesEngine
如果說OpacityMicromapEngine加速的是面處理,那么DisplacedMicro-MeshesEngine就是幾何曲面細(xì)節(jié)的加速器。如上圖所示,在AdaLovelace架構(gòu)中,通過1個基底三角形+位移地圖,就可以創(chuàng)建出一個高度詳細(xì)的幾何網(wǎng)格,所需要資源占用比二代RTCores更低,效率也更高。
通過NVIDIA給出的創(chuàng)建14:1珊瑚蟹例子來說事,這里我們需要需要1.7萬個微網(wǎng)格、160萬個微三角形,在AdaLovelace架構(gòu)中BVH創(chuàng)建速度可加快7.6倍,存儲空間縮小8.1倍。DisplacedMicro-MeshesEngine起到了關(guān)鍵性的作用,其將一個幾何物體根據(jù)不同細(xì)節(jié)分成密度不一的微網(wǎng)絡(luò)處理,紅色密度超高,細(xì)節(jié)處理越為復(fù)雜。相應(yīng)的低密度微網(wǎng)絡(luò)區(qū)域則可以釋放更多的資源與存儲空間,這樣DisplacedMicro-MeshesEngine就可以幫助BVH加速過程,減少構(gòu)建時間和存儲成本。
同時AdaLovelace架構(gòu)SM中新增了著色器執(zhí)行重排序(ShaderExecutionReordering,SER),這是由于光線追蹤不再只有強(qiáng)光或者陰影渲染處理,未來將會更多的是在光線的運(yùn)動性,這樣光線就會變得越來越復(fù)雜,想要第三代RTCores與第四代TensorCores有著更高的執(zhí)行效率,那就得為他們來安排一位管家。而著色器執(zhí)行重排序(SER)就是為了能夠即時重新安排著色器負(fù)載來提高執(zhí)行效率,為光線追蹤提供2倍的加速,也能更好地利用GPU資源。不過目前仍未有實(shí)例,想實(shí)現(xiàn)這個功能,還得游戲與開發(fā)工具的支持才行。
第四代TensorCores
TensorCores是專門為執(zhí)行張量/矩陣運(yùn)算而設(shè)計的專用執(zhí)行單元,這些運(yùn)算是深度學(xué)習(xí)中使用的核心計算功能。第四代TensorCores新增FP8引擎,具有高達(dá)1.32petaflops的張量處理性能,超過上一代的5倍。
9DLSS3技術(shù)講解
技術(shù)講解:DLSS3
或者說第四代TensorCores太硬核你不會知道是啥?提升意義在哪?但是TensorCores最經(jīng)典的應(yīng)用DLSS你肯定會知道,這一次AdaLovelace架構(gòu)支持NVIDIA最新的DLSS3技術(shù)。
之前我們也聊過DLSS技術(shù),其設(shè)計之初是為了彌補(bǔ)光線追蹤技術(shù)后的性能損失,具體的表現(xiàn)為開啟光線追蹤技術(shù)后游戲幀數(shù)大幅度的下降,甚至很難保證游戲流暢的運(yùn)行。于是DLSS使用低分辨率內(nèi)容作為輸入并運(yùn)用AI技術(shù)輸出高分辨率幀,從而提升光線追蹤的性能。
在DLSS3中包含了三項(xiàng)技術(shù):DLSS幀生成、DLSS超分辨率(也稱為DLSS2)和NVIDIAReflex。你可以理解為DLSS3是在DLSS2的基礎(chǔ)上,新增了DLSS幀生成技術(shù);而后兩技術(shù)中,DLSS超分辨率只需要GeForceRTX顯卡都能使用上,NVIDIAReflex則是GeForce900系列以后的顯卡都用使用上。
想實(shí)現(xiàn)DLSS幀生成可不簡單,這需要配合上AdaLovelace架構(gòu)的GeForceRTX40系列顯卡才行。DLSS幀生成技術(shù)原理是:利用AI技術(shù)生成更多幀,以此提升性能。DLSS會借助GeForceRTX40系列GPU所搭載的全新光流加速器分析連續(xù)幀和運(yùn)動數(shù)據(jù),進(jìn)而創(chuàng)建其他高質(zhì)量幀,同時不會影響圖像質(zhì)量和響應(yīng)速度。
從Ampere架構(gòu)開始,NVIDIA顯卡就已經(jīng)支持了光流加速器,而AdaLovelace架構(gòu)的光流加速器升級到了第二代,其提供了高達(dá)300TeraOPS(TOPS),比安培架構(gòu)的初代光流加速器(OpticalFlowAcceleration,OFA)快2倍以上。為了實(shí)現(xiàn)DLSS幀生成,OFA扮演了重要的角色,其配合上新的運(yùn)行?量分析算法在DLSS3技術(shù)框架內(nèi)實(shí)現(xiàn)精確和高性能的幀生成能力。
另外,由于DLSS幀生成是在GPU上作為后處理執(zhí)行的,那么即使在游戲受到CPU性能限制的時候,我們同樣能夠從中獲得更好的游戲性能提升。尤其是那種物理計算密集型的游戲或大型場景游戲,DLSS2均可以讓GeForceRTX40系列顯卡以高達(dá)兩倍于CPU可計算的性能來渲染游戲。
最后由于DLSS3是建立在DLSS2基礎(chǔ)之上的,游戲開發(fā)者可以在已支持DLSS2或NVIDIAStreamline的現(xiàn)有游戲中快速集成該功能,所以DLSS3已在游戲生態(tài)得到廣泛應(yīng)用,目前已有超過35款游戲和應(yīng)用即將支持該技術(shù)。
閱讀小亮點(diǎn):NVIDIAReflex
NVIDIAReflex也是DLSS3其中的一環(huán),它可以使GPU和CPU同步,確保最佳響應(yīng)速度和低系統(tǒng)延遲。
想要實(shí)現(xiàn)端對端的最低延遲,你需要確保游戲、顯示器以及鼠標(biāo)三者都同時支持并開啟了Reflex技術(shù)。
當(dāng)GeForceRTX40系列顯卡和NVIDIAReflex搭配上后,直接達(dá)到1440p分辨率360FPS的體驗(yàn),這著實(shí)是性能有點(diǎn)強(qiáng)勁了。
在GTC2022大會時已經(jīng)透露將會還有4款1440p分辨率的新型G-SYNC電競顯示器將要發(fā)布,包括采用mini-LED技術(shù)的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款顯示器刷新率均為300Hz,而最猛的是ASUSROGSwift360HzPG27AQN,刷新率直接來到了360Hz。
但唯一一個問題就在于,部分顯示器廠商認(rèn)為此類產(chǎn)品受眾人群較少,會降低此類顯示器的產(chǎn)能,甚至產(chǎn)品就已經(jīng)被內(nèi)部PASS掉,所以1440p360Hz是很美好,但現(xiàn)實(shí)也是相當(dāng)?shù)墓歉小?/p>
技術(shù)講解:雙NVIDIA編碼器(NVENC)
GeForceRTX40系列顯卡還有一個全新的升級,那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式AV1。
而由于AV1是一種免版稅的視頻編碼格式,上游軟件廠商與下游戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬件與軟件支持AV1格式,包括剪映專業(yè)版、DaVinciResolve、以及AdobePremierePro較為流行的Voukoder插件均支持,且均可通過編碼預(yù)設(shè)使用雙編碼器,這樣我們等待視頻導(dǎo)出的時間縮短將近一半。
不單是視頻制作軟件,AV1格式也將會是主播、游戲直播UP主們的新寵兒,在保證畫面最高質(zhì)量的情況下,AV1編碼器可將效率提高40%,同時顯卡的占用也更低。包括OBSStudio一一代軟件中也會增加AV1格式的支持。另外我們還能通過GeForceExperience和OBSStudio錄制高達(dá)8K60的內(nèi)容,這樣我們做游戲錄制也會變得更為輕松。
包括我們之后測試時使用的游戲內(nèi)錄視頻都是支持AV1格式,同時雙編碼器NVENC在資源占用和適配上做得越來越好。
機(jī)單的名字起得越個性,熱度就越高,這不,一個叫做“風(fēng)情萬種”的配置單就登上了攢機(jī)單熱門,點(diǎn)進(jìn)來一看,這個5000元的配置是一個影馳為核心的全家桶,除了CPU和機(jī)械硬盤之外清一色的影馳。
其實(shí)全家桶配置單還是挺常見的,一開始我也沒想到影馳的產(chǎn)品線也有這么全,不過在攢機(jī)的時候別單純?yōu)榱似放贫雎粤祟A(yù)算和硬件分配的合理性,尤其是碰上板U不搭,那可就誰也救不了你了,下面我們就來看看這套配置。
首先還是板U套裝,5000元預(yù)算配到12490F是非常標(biāo)準(zhǔn)的配置,但是配了一個B360主板?這倆接口都不一樣的,買回來意味著得退貨,至少換一個影馳B760M-G D4能插上的主板才行啊,如果不會選,也可以直接買板U套裝,可以很大程度上避免這個問題。
顯卡這里屬實(shí)有點(diǎn)低,GTX 1050Ti屬于早就過時的顯卡了,如果預(yù)算只有3000元還可以考慮,但是預(yù)算都有5000元了,影馳同樣有RTX 4060顯卡,同樣能把整機(jī)控制在5000元,圖形和游戲性能直接飆升你難道不心動嗎?
存儲這里還是有點(diǎn)摳門,首先是8G內(nèi)存就不夠看的,現(xiàn)在內(nèi)存這么便宜,109元的金屬大師直接插兩條,300元可以拿下1TB的固態(tài),PCIe 4.0 x4接口享受5000MB/s的速度,比機(jī)械硬盤好太多。
最后看一下機(jī)電,好家伙,直接買了1199元的影馳包豪斯機(jī)箱,我算是知道5000預(yù)算都去哪了。其實(shí)影馳同樣有時尚的機(jī)箱,沐光PLUS白色海景房機(jī)箱采用雙面?zhèn)韧冈O(shè)計,支持9把風(fēng)扇也有很好的散熱表現(xiàn),關(guān)鍵是價格只要包豪斯的零頭,省下這些錢升級顯卡要劃算得多。電源這里影馳可選的不多,399元的電競大師GL650 金牌650W就可以滿足需求,而且高效能更省電。
最后再簡單總結(jié)一下,確定預(yù)算和要求(比如全家桶)之后還是要優(yōu)先搭配CPU和顯卡,因?yàn)檫@兩者直接決定了電腦性能的上限,然后就是合適的主板,內(nèi)存和硬盤要根據(jù)預(yù)算搭配,也盡量要富裕一些,機(jī)箱和電源的重要性偏后一些,雖然說不能挑最便宜的,但是也別擠占其他硬件的預(yù)算,最后你就能獲得適合自己的全家桶了。
(8328203)
近年底,相信也有不少小伙伴開始攢機(jī)、換機(jī)的準(zhǔn)備,那么又有哪些產(chǎn)品值得推薦呢?GeForce RTX 30 系列 GPU 強(qiáng)勁的性能令玩家和設(shè)計者青睞,其采用了第 2 代 NVIDIA RTX 架構(gòu) - NVIDIA Ampere 架構(gòu),搭載全新的 RT Core、Tensor Core 及流式多處理器,可帶來逼真的光線追蹤效果和出色的 AI 性能。
無論是顯卡或者是搭載 GeForce RTX 30 系列筆記本電腦 GPU 的筆記本電腦產(chǎn)品在年末大促都有好價,即刻入手升級,年末大作暢享高幀高畫質(zhì)低延遲。
年末也是各種大作爆發(fā)的時期,如《漫威暗夜之子》等,支持 NVIDIA DLSS 2 和光線追蹤 GeForce RTX 游戲玩家可在與邪惡勢力戰(zhàn)斗時,暢享 NVIDIA DLSS 2 和高級光線追蹤效果加持的超燃畫面。光線追蹤反射和光線追蹤環(huán)境光遮蔽將使視覺保真度更上一層樓。DLSS 2 將提供在最高分辨率下實(shí)現(xiàn)這些效果所需的性能,讓玩家在 PC 上玩漫威暗夜之子時獲得出色體驗(yàn)。
下面筆者不妨推薦幾款 GeForce RTX 30 系列顯卡,近期想要攢機(jī)的朋友一定不要錯過了,另外也相信這些強(qiáng)悍的產(chǎn)品,會在今后的工作、游戲生活中祝你一臂之力。
據(jù)介紹,全新的 TUF GAMING 系列顯卡經(jīng)過精心設(shè)計,為玩家?guī)韽?qiáng)勁的性能和更效率的散熱能力。華碩 TUF GAMING 顯卡采用升級版的軸流風(fēng)扇,三個風(fēng)扇協(xié)同運(yùn)行,以滿足高發(fā)熱的散熱需求。雙滾珠風(fēng)扇軸承,運(yùn)行更加高效,并且壽命更長。
此外,華碩 TUF GAMING 顯卡還巧妙的反轉(zhuǎn)中央風(fēng)扇設(shè)計,以減少散熱模組內(nèi)的空氣亂流。同時風(fēng)扇具備智能停轉(zhuǎn)功能,當(dāng)顯卡溫度低于 55 度時,風(fēng)扇可停轉(zhuǎn)來保持安靜。其他方面還支持神光同步等功能。
規(guī)格方面,華碩 TUF 3060Ti 采用了 NVIDIA Ampere 架構(gòu),CUDA 處理器數(shù)量 4864 個,核心頻率 1410MHz~1755MHz,顯存容量 8GB GDDR6,顯存帶寬 448GB / s,顯存頻率 14Gbps,采用了 8Pin 供電接口。
作為入門級別電競專業(yè)游戲顯卡,影馳 RTX 3060 沿用了 RTX 3060 12G 的散熱規(guī)格,散熱性能強(qiáng)大,可助力顯卡完全釋放其優(yōu)異的性能。
具體來看,影馳 RTX 3060 金屬大師 OC 配備了 3 個尺寸在 90mm 的散熱風(fēng)扇,均采用 11 葉靜霜扇葉,從而達(dá)到高效散熱以及靜音的效果。接口部分,提供了 3DP+HDMI 的接口組合,單 6pin 的顯卡輔助供電。
規(guī)格方面,整卡搭載了高能核心,NVIDIA Ampere 架構(gòu)加持,輔以新一代 8GB GDDR6 高速顯存,極速渲染,精彩視界,配合全新光線追蹤技術(shù)與 DLSS 技術(shù),可以帶來身臨其境般的體驗(yàn)。
iGame RTX 3060 Ti Ultra W 使用基于 NVIDIA Ampere 架構(gòu)的 GA104 核心,其晶體管數(shù)量高達(dá) 174 億個,支持全新的 RTX IO、NVIDIA Broadcast、NVIDIA Reflex 等特性。其最大頻率為 1770MHz,包含 4864 個流處理器,152 個第三代張量核,38 個第二代光追核,152 個紋理單元,80 個光柵處理單元。顯存方面采用了三星 8GB GDDR6 顯存,顯存頻率為 14000MHz,顯存位寬為 256bit,顯存帶寬為 448GB / s。
設(shè)計上,相比于千篇一律的黑色顯卡,七彩虹 iGame GeForce RTX 3060 Ti Ultra W OC 初晴限定版白色的設(shè)計無疑能讓其在眾多 RTX 3060 Ti 顯卡中脫穎而出。純白的外觀搭配蒸汽波粉藍(lán)亮片,非常個性時尚。
散熱方面,iGame RTX 3060 Ti Ultra W 采用了 2 個 90 毫米和 1 個 80 毫米捕風(fēng)手風(fēng)扇。iGame 全新的 13 翼扇葉,可以實(shí)現(xiàn)更大風(fēng)壓和更大的進(jìn)風(fēng)量,以達(dá)到更快散熱的效果。
供電方面,iGame RTX 3060 Ti Ultra W 采用雙 8 Pin 電源 8+2 相供電。
iGame RTX 3060 Ti Ultra W 使用基于 NVIDIA Ampere 架構(gòu)的 GA104 核心,其晶體管數(shù)量高達(dá) 174 億個,支持全新的 RTX IO、NVIDIA Broadcast、NVIDIA Reflex 等特性。其最大頻率為 1770MHz,包含 4864 個流處理器,152 個第三代張量核,38 個第二代光追核,152 個紋理單元,80 個光柵處理單元。顯存方面采用了三星 8GB GDDR6 顯存,顯存頻率為 14000MHz,顯存位寬為 256bit,顯存帶寬為 448GB / s。
設(shè)計上,相比于千篇一律的黑色顯卡,七彩虹 iGame GeForce RTX 3060 Ti Ultra W OC 初晴限定版白色的設(shè)計無疑能讓其在眾多 RTX 3060 Ti 顯卡中脫穎而出。純白的外觀搭配蒸汽波粉藍(lán)亮片,非常個性時尚。
散熱方面,iGame RTX 3060 Ti Ultra W 采用了 2 個 90 毫米和 1 個 80 毫米捕風(fēng)手風(fēng)扇。iGame 全新的 13 翼扇葉,可以實(shí)現(xiàn)更大風(fēng)壓和更大的進(jìn)風(fēng)量,以達(dá)到更快散熱的效果。
供電方面,iGame RTX 3060 Ti Ultra W 采用雙 8 Pin 電源 8+2 相供電。
iGame RTX 3060 Ti Ultra W 使用基于 NVIDIA Ampere 架構(gòu)的 GA104 核心,其晶體管數(shù)量高達(dá) 174 億個,支持全新的 RTX IO、NVIDIA Broadcast、NVIDIA Reflex 等特性。其最大頻率為 1770MHz,包含 4864 個流處理器,152 個第三代張量核,38 個第二代光追核,152 個紋理單元,80 個光柵處理單元。顯存方面采用了三星 8GB GDDR6 顯存,顯存頻率為 14000MHz,顯存位寬為 256bit,顯存帶寬為 448GB / s。
設(shè)計上,相比于千篇一律的黑色顯卡,七彩虹 iGame GeForce RTX 3060 Ti Ultra W OC 初晴限定版白色的設(shè)計無疑能讓其在眾多 RTX 3060 Ti 顯卡中脫穎而出。純白的外觀搭配蒸汽波粉藍(lán)亮片,非常個性時尚。
散熱方面,iGame RTX 3060 Ti Ultra W 采用了 2 個 90 毫米和 1 個 80 毫米捕風(fēng)手風(fēng)扇。iGame 全新的 13 翼扇葉,可以實(shí)現(xiàn)更大風(fēng)壓和更大的進(jìn)風(fēng)量,以達(dá)到更快散熱的效果。
供電方面,iGame RTX 3060 Ti Ultra W 采用雙 8 Pin 電源 8+2 相供電。
聯(lián)想拯救者 Y9000P 2022 是一臺各方面都比較水桶的機(jī)器,筆者比較推薦 140W RTX 3060 筆記本電腦 GPU+12 代酷睿 i7 的甜品配置。
它的外觀造型硬朗,正面會發(fā)光的大 Y 燈,92.3% 的高屏占比,全尺寸鍵盤 + 全尺寸方向鍵,接口數(shù)量豐富,配有 3A3C 口(包含一個雷電 4 接口和支持 135W 便攜快充的全功能 USB-C 口),HDMI2.1 接口,RJ45 千兆網(wǎng)口,3.5mm 音頻接口,還有攝像頭開關(guān),規(guī)格和實(shí)用性很高。
聯(lián)想拯救者 Y9000P 的屏幕素質(zhì)很強(qiáng),2.5K / 165Hz / 3ms / 500nit 的 IPS 電競屏,16:10 比例擁有更大的顯示面積,四面窄邊框但依舊保留頂部攝像頭,自帶 XRite 色彩管理和 DC 調(diào)光,HDR400 認(rèn)證,TUV 硬件級防藍(lán)光,和 G-Sync 畫面防撕裂技術(shù)一個不缺。
同樣,聯(lián)想拯救者 Y9000P 支持 DDG 智能三模顯示切換,3 種性能模式切換以及霜刃 Pro 散熱系統(tǒng) 4.0,以確保強(qiáng)大的性能釋放,在野獸模式下 CPU 最高功耗可達(dá) 105W。
最后推薦的是宏碁非凡 X,預(yù)算不多的小伙伴和僅是輕度游戲和創(chuàng)作的朋友,可選擇這款產(chǎn)品。
核心配置上,宏碁 14 英寸款非凡 X 搭載 RTX 3050 筆記本電腦 GPU 和 12 核的 i5-1240P 處理器,,配備大尺寸風(fēng)扇 + 雙銅管散熱,50W 雙烤性能釋放。其他方面,這款筆記本配備了 16GB LPDDR5 內(nèi)存和 512GB PCIe 4.0 SSD。
屏幕方面,這款筆記本配備了一塊 14 英寸的 2.2K 全面屏,16:10 比例,92% 屏占比,100% sRGB 色域,支持 DC 調(diào)光。
設(shè)計方面,這款筆記本采用了鋁合金機(jī)身,紅綠雙色可選,輕至 1.4kg,薄至 17.9mm,配備兩個雷電 4 接口、一個 HDMI 接口以及雙高速 USB-A 接口。
寫在最后:
推薦完上面 RTX 30 級顯卡、筆記本,相信你已經(jīng)有了自己的選擇。心動的小伙伴,不能錯過這次機(jī)會了,抓住年末大促的機(jī)會即刻升級,暢玩年末的各種大作吧。