欄目導航

新聞資訊

新聞資訊

時重傳和RTT的關系

RTT是報文在網絡路徑上的往返時間RTT（Round-Trip Time）。和超時重傳有緊密的關系。

正確估算RTT，是設置超時重傳RTO（Retransmit TimeOut）的基礎。

比如，RTT是5秒，那么超過30秒不做ack，基本可以估算報文出現丟包了，需要重傳。如果RTT是20秒，那么30秒還沒收到ack是不能判斷已經丟包，沒必要重傳。

測量RTT

網絡路徑和流量變化，會導致RTT變化。Tcp要跟蹤RTT變化，以便正確的重傳。

TCP的RTT實際測量方法：

統計“發送數據”和“對應數據ack”的時間差。

我們來看現網中的一個數據

如圖，這是一個tcp連接的RTT單向統計，192.168.1.104:63214——> 112.80.252.49:443

上圖最左邊，第一個點，這個RTT統計對應的報文是5713和5714

報文5713發送序列號1:518，報文5714對518作ack響應

報文5713的時間是31.874163

報文5714的時間是31.880790

31.880790-31.874163=0.006627（秒），如圖6.6ms

不可能所有數據都有ack，所以tcp通過測量ack獲取RTT只是采樣數據，還要采用算法，根據采樣來預估當前RTT。

線性算法估算RTT

下面這種方法，老RTT和當前測量RTT共同計算新的RTT，其中，測量RTT占用10%比例，老RTT占用90%比例

RTT=a * RTT + (1-a) * M

RTO=RTT * B

M：當前測試值。

a : 加權系數，一般為0.9

其中B為2。

RTT由當前測量值和估算值共同決定，老RTT占90%，當前測量RTT占10%。

這種算法是有缺陷的。如果當前測量值發生很大的變化，由于它的加權只有0.1，那么，這個新估算的RTT很明顯不能真實反映路徑的實際情況。

比如RTT突然增大（數量級的增大），那么新估算的RTT還是不會增加很多（因為新測量只占10%）。那么實際網絡沒有丟包，tcp協議棧會觸發不必要的重傳。

而RTT增大，一般是網絡進入飽和狀態，或者出現擁塞了，這個時候再不必要的重傳，那么無疑會對網絡增加更大的負擔。

基于均值的方差估算

Err=M – A

A=A + g * Err

D=D + h (|Err| -D)

RTO=A + 4D

M ：當前測量值

A : （被平滑的）RTT

D : （被平滑的）均值偏差

Err ：（當前測量值和當前RTT估算值之間的）變化量，即RTT變化幅度。

g ：平均作用，取0.125

h : 偏差增益，取0.25

當RTT變化大時，較大的偏差增益會使RTO快速增加

到芯片短缺以及礦潮影響，近一年的DIY市場尤其混亂，其中又以顯卡最為畸形，原本5499元首發的GeForce RTX 3080已經被炒到了15000左右，價格翻了3倍。而不久前NVIDIA在官方博客中再次宣布，后續推出的RTX 30系顯卡，除了RTX 3090外將全部從芯片層面限制挖礦，包括之前已經推出的RTX 3060/3060 Ti/3070/3080，以及后續將要推出的顯卡，今天大家期待已久的GeForce RTX 3080 Ti終于來了。

根據NVIDIA此前的官方博客說明，這批顯卡已經限制了以太坊的算力，不過對比特幣等其他幣種沒有任何限制。另外GeForce RTX 3080 Ti這一批的非公版顯卡，在外包裝上不會有任何標注，“Lite Hash Rate”或者“LHR”的說明只針對已經發售的顯卡，后續為了方便區分才會在包裝上進行標注。

GeForce RTX 3080 Ti

GeForce RTX 3080 Ti細節特寫

關于此次發布的GeForce RTX 3080 Ti顯卡，想必大家主要關心的有這幾點，首先是價格和性能，其次是供貨量，能不能買到。由于此次的顯卡全部限制了哈希率，也就是以太坊挖礦，所以會減少礦工的涌入。在6月1日臺北電腦展發布會上，已經公布了售價為8999元，但國內目前買不到，所以只能期待一波非公版的顯卡了，不同廠商會根據公版定價酌情加價，但首發價格一定是比較低的，大家不妨去搶一波。

01GA102核心的第三張卡

下面我們先來看看在架構上有哪些改動，官方白皮書上對比的對象為GeForce RTX 2080 Ti，相較于上一代的NVIDIA Turing架構，NVIDIA Ampere架構下的GeForce RTX 3080 Ti每個時鐘執行2次著色器運算，而Turing為1次，RTX 3080 Ti的著色器性能達到34 TFLOPS單精度性能，而Turing為14 TFLOPS。

第一代NVIDIA RTX架構 Turing下的RTX 2080 Ti

第二代NVIDIA RTX架構 Ampere下的RTX 3080 Ti

NVIDIAAmpere架構翻倍了光線與三角形的相交吞吐量，RT Core達到67 RTTFLOPS，而Turing為43 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升，還增加了對游戲中運動模糊部分場景的光線追蹤計算加速。

第三代Tensor Core可自動識別并消除不太重要的DNN權重，處理稀疏網絡的速率是Turing的兩倍，算力高達273 TensorTFLOPS，而Turing為114 TensorTFLOPS。

GeForce RTX 3080 Ti仍然采用了GA102核心，與GeForce RTX 3080/3090相同，下面我們來看一看RTX 3080 Ti在GA102中做了哪些改動。

完整的GA102核心

完整的GA102 GPU包含7個GPC（圖形處理集群）42個TPC（紋理處理集群）以及84個SM（流處理器）組成，而RTX 3080 Ti的CUDA數量是10240個，所以可以推斷RTX 3080 Ti屏蔽了兩組TPC，所以只有80個SM單元，而完整GA102核心的CUDA數量應該是10752個。

為了查詢方便，筆者將這幾款顯卡的核心參數列出，可以看到RTX 3080 Ti與RTX 3090的核心參數非常接近。相差的兩個SM單元，也就是1組TPC，256個CUDA，其實在實際應用中來講差距并不是很大，最重要的是RTX 3090相比RTX 3080 Ti多了12GB的顯存；而相比RTX 3080來說提升就非常大了。

可能有用戶會問，既然和RTX 3090的差距如此小，那這張卡的定位是什么？筆者個人感覺RTX 3080 Ti更多的還是為游戲玩家而準備，24GB的顯存其實大部分游戲是用不到的，當然8K除外。

渲染8K素材占用了17GB顯存（點擊查看大圖）

但在專業渲染軟件中，渲染8K或4K素材的顯存占用率非常高，能達到17GB甚至更高，這對于只有12GB顯存的RTX 3080 Ti就完全不夠了，爆顯存的危害想必大家也知道，可以導致游戲或軟件崩潰，從而進程丟失。

02NVIDIA Ampere架構GA102解析

GeForce RTX 3080 Ti采用了GA102核心，擁有280億（28000 million）個晶體管，628平方毫米的面積，基于三星的8nm NVIDIA定制工藝，來自Micron的GDDR6X顯存。

本次NVIDIAAmpere的SM在Turing基礎上增加了一倍的FP32運算單元，這使得每個SM的FP32運算單元數量提高了一倍，同時吞吐量也就變為了一倍。

而通常我們計算顯卡的CUDA數量，并不是把SM中的所有單元加起來計數，而是只統計FP32單元的數量，所以這樣一來，SM中的【FP32 : INT32】從 1:1 變為 2:1。

GeForce RTX 3080 Ti共有10240個CUDA，其實它有5120個INT32單元，但由于內部的FP32數量翻了一倍，所以最終實現了10240的CUDA數量。

而這樣粗暴的提升CUDA數量對于游戲其實有著非常大的幫助，通常在游戲中浮點運算相比整數計算要常用的多，圖形、算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數指令，而FP32的加速也有助于光線追蹤降噪著色器。

在去年與GeForce RTX 30系顯卡一同發布的還有一項新技術——RTX IO。目前很多游戲動輒幾十G甚至百G的安裝空間，對于存儲空間的負擔暫且不提，但存放在硬盤中的數據，如果顯卡想要讀取到，需要先由CPU從硬盤中讀取壓縮過的數據，經過解壓縮再發送到顯存中。

雖然隨著NVMe SSD的推出，讀取速度相較機械硬盤能夠快20倍，但受制于傳統I/O限制，NVMe高達7GB/秒的高速讀寫對于CPU是極大的負擔。

傳統的數據交換

在這個過程中，會占用多個CPU核心，壓力急劇增大，占用較多的內存，而此時其實GPU是處于閑置狀態的。RTX IO的作用就是越過CPU解壓再傳輸數據這一步，直接從PCIE總線讀取硬盤上經過壓縮的數據，并且完成無損GPU解壓，降低CPU占用，變向提升了性能。

RTX IO可以極大解放CPU負擔

當然這項技術作為系統底層的運行方式改變，還需要借助微軟發布的DirectStorage來實現，對于目前容量的游戲來說，RTX IO的改善效果有限，但假以時日等游戲容量上百G成為常態的時候，這項技術將會發揮巨大的功效。

同時搭配新增的HDMI 2.1接口，可以支持單線8K的視頻輸出，而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出，如果想要連接8K電視，則需要更多的線纜支持。

03GeForce RTX 3080 Ti外觀

首先還是來看一下外觀，在外包裝上相比之前的公版沒有變化，不過GeForce RTX 3080 Ti這款顯卡本身相比GeForce RTX 3080在細節上還是有不少變化的。

GeForce RTX 3080 Ti

GeForce RTX 3080 Ti配件盒展示

外包裝依舊是禮盒形式的，收藏感滿滿，在拿出顯卡后下方是轉接線和說明書的配件盒，因為此次公版仍采用單12pin的供電插槽，所以需要轉換成雙8pin的接口才能使用。

GeForce RTX 3080 Ti 正面

拿出顯卡后我們先來看一下正面（由于公版軸流式設計，兩側均有風扇，我們以插入機箱后的方向來區分反正面），相比GeForce RTX 3080的設計整體基本無改動，不過邊框部分的內角從啞光改為了鏡面，這種略帶跳躍的視覺效果相比之前的設計更好看。

GeForce RTX 3080 Ti 內角的金屬光澤

GeForce RTX 3080 Ti上機后燈光效果

另外在這次GeForce RTX 3080 Ti中出了顯卡側面的GeForce RTX的logo燈，在正面還增加了一個“X”的燈光效果，不過由于是顯卡自內而外發出的燈效，所以并不明顯，需要在較暗的環境下才能看出。

GeForce RTX 3080 Ti背面

GeForce RTX 3080 Ti邊框部位NVIDIA logo

顯卡背面部分（雖然這看起來更像正面），基本沒有改動，邊框配色為淡淡的玫瑰金，包括極細微的NVIDIA logo。

GeForce RTX 3080 Ti 單12pin供電接口

在GeForce RTX 3080 Ti顯卡的側面，可以看到單12pin的供電接口，從整體來看它比較靠近中間部位，但我們都知道公版卡采用了高度緊湊的PCB板，長度也小于一般尺寸，所以其實供電接口已經位于板子的尾部，沒有往右挪的空間了。根據NVIDIA官方說明，GeForce RTX 3080 Ti的單卡功耗為350W，下面我們也會詳細測試。

GeForce RTX 3080 Ti視頻接口

GeForce RTX 3080 Ti的擋板部位顏色也和GeForce RTX 3080不同，后者采用了與散熱鰭片相同的黑色，而在新版的GeForce RTX 3080 Ti中也改為了正常的金屬色，未作特殊處理。接口方面的配置依舊為DP 1.4*3+HDMI 2.1*1的4接口設計，另外由于新的HDMI 2.1協議，最高已可支持單線8K的視頻輸出。

散熱系統示意

另外如果是第一次了解公版顯卡的朋友們，這里再給大家說一下擋板部位這個奇怪的“柵欄”的用處，由于公版卡采用了雙軸流式設計，正面及背面均有散熱風扇，正面風扇為主動吸入冷空氣為GPU降溫，擋板部位則是排出熱空氣的“出風口”，而背面的風扇則是向上排出顯卡內熱空氣的作用。

043DMARK 理論性能測試

首先介紹一下測試平臺，為了保證此次評測能夠發揮GeForce RTX 3080 Ti顯卡的最佳性能，主板和CPU采用了目前桌面旗艦級配置，具體如下。

在測試成績上，基準測試采用3DMARK，游戲性能測試使用游戲自帶Benchmark，同時為了減小誤差，每項測試成績均測試3遍取平均值。

GPU-Z參數

首先看一下GPU-Z的參數，GeForce RTX 3080 Ti采用GA102核心，三星8nm工藝，芯片面積628平方毫米，擁有10240個CUDA，1665MHz頻率。采用12GB GDDR6X顯存，位寬為384bit，顯存帶寬達到了912.4 GB/s，光柵單元和紋理單元為112和320。

下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝：FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能，取顯卡分數實際測試結果如下：

3D MARK FS套裝測試

在針對顯卡DX11性能的3DMARK FS套裝測試中，我們選擇了上代和本代的4張顯卡進行分值對比，以便能更好的反應GeForce RTX 3080 Ti的性能水平。

可以看到GeForce RTX 3080 Ti的性能基本與GeForce RTX 3090相同，差距微乎其微。另外對比GeForce RTX 3080則提高了不少，整體差距在11%左右。而對比上一代旗艦GeForce RTX 2080 Ti整體提升約為40%。

3D MARK TS套裝測試

而在針對DX12環境下的Time Spy和Time Spy Extreme測試中，GeForce RTX 3080 Ti的分數與GeForce RTX 3090的分數差距則要大一些，達到4%左右。而對比GeForce RTX 3080的分數要高出7%左右；對比上一代GeForce RTX 2080 Ti的分數要高出43%左右。

3D MARK 光追測試

PortRoyal是3DMARK中專門針對光追性能的測試項，在這組測試中GeForce RTX 3080 Ti的表現依舊緊咬GeForce RTX 3090，分數差距不超過1%；對比GeForce RTX 3080的分數提升約為11%；對比上一代GeForce RTX 2080 Ti的分數提升則非常大，約為60%。

05游戲性能測試

在游戲性能測試中，我們選擇了《德軍總部新血脈》、《孤島驚魂5》、《刺客信條：英靈殿》、《無主之地》，國產游戲《邊境》、《光明記憶：無限》的benchmark跑分軟件。

另外在游戲測試中，由于顯卡驅動的版本更新和游戲更新非常影響游戲幀數，所有benchmark跑分成績均以本次成績為準。

《刺客信條：英靈殿》游戲測試

在游戲實測中我們更印證了前面的說法，GeForce RTX 3080 Ti和GeForce RTX 3090的大部分分數相同，僅有1-2幀的差距。而GeForce RTX 3080的分數差距在1080P和2K分辨率下也并不大，主要是4K分辨率會有10%左右的差距。

《德軍總部新血脈》游戲測試

《德軍總部新血脈》并且由于自帶兩個benchmark，所以我們的數據取跑分均值，另外這款游戲幾乎每更新一次驅動或者游戲版本升級都會導致分數的巨大差異，在本次重新測試中，GeForce RTX 3080 Ti與GeForce RTX 3090的差距依舊微乎其微，而相比GeForce RTX 3080的提升約為4%左右。

《孤島驚魂5》游戲測試

《孤島驚魂5》同樣算是優化比較到位的3A大作，GeForce RTX 3080 Ti均能達到100幀以上的流暢運行標準，其中4K分辨率下的成績要領先GeForce RTX 3080 15%左右。

《無主之地3》游戲測試

《無主之地3》是一款采用了卡通渲染風格的游戲，它對于性能要求的下限很低而上限又很高，在1080P分辨率下GeForce RTX 3080 Ti能夠跑到147幀，而在4K分辨率下打了對折僅有70幀。

《光明記憶：無限》游戲測試

《光明記憶：無限》是由飛燕群島工作室開發的《光明記憶》新系列，目前還沒有游戲提供試玩，不過benchmark的跑分軟件官方已經提供，玩家可以在steam上自行下載。另外我們在測試的時候由于無法關閉光追選項，故所有測試成績均為“RTX 最高/DLSS 質量”模式下進行。在這款游戲的benchmark中出現了驚人的分數一致情況，雖然多測試幾遍肯定會有所不同，但在整體趨同的情況下意義不大。

《邊境》游戲測試

在另外一款國產游戲《邊境》的跑分軟件中，情況基本與《光明記憶：無限》相同，測試條件均在“RTX最高/DLSS質量”下進行。

06功耗及溫度測試

功耗測試中，我們選擇FurMark軟件進行拷機測試，并采用GPU-Z檢測溫度，功耗僅計算顯卡自身。

功耗測試（點擊查看大圖）

GeForce RTX 3080 Ti經過我們的實測在滿載狀態下單卡功耗為350W左右，作為目前整體性能與GeForce RTX 3090相仿的情況下，建議搭配750W電源。

溫度方面，本次的GeForce RTX 3080 Ti經過10分鐘左右的拷機，溫度穩定為75℃左右，與GeForce RTX 3080基本相同，并且頻率穩定無降頻情況。

07部分游戲光追及DLSS效果展示

上面我們測試了部分游戲的光追和DLSS性能表現，這些效果具體在游戲中是什么表現，下邊筆者選擇了兩款游戲給大家展示一下。

《賽博朋克2077》RTX ON（點擊查看大圖）

《賽博朋克2077》RTX OFF（點擊查看大圖）

在《賽博朋克2077》中，光追效果隨處可見，而在游戲中也運用到了不同的光追效果，包括最常見的光追反射、陰影，還有環境光遮蔽、漫反射照明以及全局光照等比較高級的效果。

RTX ON（點擊圖片查看大圖）

RTX OFF（點擊圖片查看大圖）

在網游《逆水寒》中，由于光追效果正處于試驗階段，并沒有如宣傳片一樣的水面反射。但畫面整體的陰影更加真實，如頭頂樹木的陰影，以及水面上荷葉的效果。而且由于光追效果較少，在打開該功能后幀數并沒有明顯下降。

《堡壘之夜》RTX ON（點擊查看大圖）

《堡壘之夜》RTX OFF（點擊查看大圖）

堡壘之夜的光追效果還是比較明顯的，其中加入了反射、全局照明和路徑追蹤等效果。卡車車身上的反射較為明顯，角色身上的環境光在打開光追后更為寫實，另外仔細看的話遠處建筑物的玻璃同樣有光線的反射，整體畫質改善非常明顯。

《魔獸世界9.0》RTX ON（點擊查看大圖）

《魔獸世界9.0》RTX OFF（點擊查看大圖）

《魔獸世界9.0》同樣作為一款卡通渲染的網游來說，魔獸的年代更加久遠，此次加入光追效果在整體視覺上沒有堡壘之夜明顯。不過如遠處的樹木陰影，以及近處石臺下方的陰影都比較明顯。

《控制》RTX ON（點擊查看大圖）

《控制》RTX OFF（點擊查看大圖）

《控制》這款游戲所采用的引擎物理效果非常出色，同時光追開關的對比也是肉眼可見的明顯。包括玻璃上的人物反光，遠處地面的植物反光都比較清晰，同時打開光追后屋頂處的明暗對比也更加明顯。

《賽博朋克2077》DLSS模式對比

DLSS的對比測試我們選擇《賽博朋克2077》這款游戲，2K/RTX ON/DLSS關閉原生畫質下作為標準，在打開DLSS質量模式后可以看到整體畫面幾乎沒有任何變化，廣告牌的字樣邊緣依然很清晰。在DLSS平衡和DLSS性能模式中依然有著不錯的狀態，整體相較原生畫質并無二致。

《逆水寒》DLSS模式對比

畫質說明

在《逆水寒》的DLSS測試中，我們將畫面設置為4K分辨率，畫質為預設最高。通過關閉、快速、超級性能，3種不同模式來進行幀數以及畫面的對比。

首先在關閉DLSS中，游戲幀數為26幀原生畫質，打開DLSS快速模式后為41幀，而打開DLSS超級性能模式后為57幀。通過放大圖片不難發現原生畫質和DLSS快速模式的區別很小，而DLSS超級性能模式中角色背后的裝飾會變模糊，以及木條箱的紋理邊界會有較明顯變化。但幀數提升卻非常明顯。

08軟硬兼施鑄就Ampere

好的硬件沒有軟件的加持，相當于空有長柄沒有槍頭，想要發揮十成威力則必須軟硬搭配，反之亦然。此次隨著發布會共同推出的還有以下幾項非常值得大家關注。

NVIDIA Reflex

以往我們關注延遲大多從顯示器上了解到幾毫秒極速響應，但那只是作為最終端的顯示輸出效果，你是否想過從系統內部到實際看到的畫面有多大延遲？

NVIDIA Reflex

在20系顯卡中NVIDIA反復提及的“幀能贏”，在30系顯卡中也做了更進一步的突破，除了NVIDIA將推出自己的電競顯示器NVIDIA 360Hz G-SYNC ESPORTS，還有NVIDIA Reflex技術。

以往如果想測量系統延遲需要高速相機以及定制的LED鼠標電路。而使用帶有NVIDIA Reflex技術的顯示器將內置精確的延遲分析工具，可在CPU和GPU中優化渲染管道，極大減少延遲時間，將系統延遲整體降低至30ms以下。不過就像圖中所示，為此你需要一個支持反射延遲分析的鼠標。

NVIDIA Broadcast

NVIDIA Broadcast是一款易用且專業的直播軟件，它的強大之處就在于主播不再需要任何的背景布置，只需要一個普通的攝像頭和一張GeForce RTX系列的顯卡即可。

寵物派對直播

這款軟件可以讓你雜亂無章的房間立即變成直播間，其內置了音頻降噪、背景虛化、虛擬背景、頭部追蹤等功能。NVIDIA Broadcast的工作原理是利用AI算法通過DGX超級計算機深度學習而來。

NVENC編碼

同時RTX 30系顯卡擁有目前最好的硬件解碼器，大部分用戶的電腦在直播時打開OBS推流后CPU占用會直接飆升到50%左右，而基于GPU的NVENC解碼可以極大地減輕CPU負擔。

NVIDIA Studio

對于內容創作者來說，提到軟件可能大部分只會想到內容創作的相關軟件，但NVIDIA專為內容創作者推出的NVIDIA Studio驅動則是承擔著連接創作軟件和顯卡功能的關鍵。

NVIDIA Studio

NVIDIA Studio驅動經過更新與優化，對于最新版本的Adobe系列軟件支持更為穩定，同時附帶更出彩的創作功能。利用NVIDIA CUDA技術，GPU加速特效可實現更快的實時視頻編輯并加速渲染輸出，并讓原本只能進行軟件編碼輸出的視頻輕松得到硬件的支持。另外在AI計算方面的優勢，包括自動標記片段、特效追蹤和人臉識別等功能，都有顯著的速度提升。

以GPU渲染為14.98秒而CPU渲染為11分鐘

當然NVIDIA Studio的加速創作絕不止Adobe一家，DaVinci、Keyshot、Blender、D5等專業軟件中都有非常亮眼的表現。不僅能提供強大且穩定的運行環境，更能以GPU加速，有效提升創作效率。

09GeForce RTX 3090的替代品？

通篇看下來相信大家都會覺得，GeForce RTX 3080 Ti和GeForce RTX 3090太像了，簡直是一個模子刻出來的，兩者最大的差距則是12GB的顯存，不禁讓人猜測NVIDIA推出這張卡的目的到底是什么？難道是老黃失手，刀法不再精湛了？

GeForce RTX 3080 Ti

這里我們還是先來看一下外觀，本次的GeForce RTX 3080 Ti公版整體與GeForce RTX 3080相同，但在細節之處有所改進，如正面“X”形的燈光、邊框的材質和顏色，有了3080首發的經驗，這張卡整體來看更加精致。

在性能參數上，RTX 3080 Ti的Boost頻率為1665MHz，是RTX 30系顯卡首發中最低的，要知道RTX 3090的Boost頻率都達到了1695MHz，不知道這是否是NVIDIA官方有意為之，通過我們的測試來看，大部分成績只要頻率再提升一點，極有可能超越RTX 3090，我們在后續的非公版顯卡測試中也會留意這一點。

GeForce RTX 3080 Ti

在游戲方面，玩家更是無需擔心，比RTX 3080更強的堆砌必然在游戲體驗上更好，另外增加的2GB顯存，在4K分辨率線下得到了徹底的發揮。

最后就是關于這張卡的定位，筆者認為NVIDIA推出兩張如此相似的卡，還是有其原因的。其實最早有過關于RTX 3080 20G版本的傳聞，但這張RTX 3080 Ti的發布無疑擊破了流言。而從跑分表現來看，RTX 3080 Ti直逼RTX 3090，這是在以往任何一代產品都不曾出現的。

GeForce RTX 3080 Ti

兩者最大的差距就是12GB的顯存，對于游戲用戶來講24GB確實有些浪費了，而對于生產力工具來說，在4K/8K素材渲染時，往往能占用12GB甚至更多，爆顯存對于軟件渲染來說是非常致命的，輕則報錯無法渲染，重則軟件崩潰進程丟失。所以這兩款顯卡在細分領域來說還是有所區別，RTX 3080 Ti更注重游戲。

GeForce RTX 3080 Ti

最后，至于價格，由于我們評測發布時還未上架開售，但根據性能參數來看，肯定要比RTX 3080貴很多，接近RTX 3090，預估在1W-1.2W之間吧。雖然看起來很貴，但首發價格也應該是最低了，如果大家能搶到還是有必要試一試的。

最后我們再來看看本次發布的GeForce RTX 3080 Ti其他非公版顯卡：

iGame GeForce RTX 3080 Ti Vulcan OC

影馳GeForce RTX 3080 Ti星曜OC

銘瑄GeForce RTX 3080 Ti iCraft OC

索泰RTX 3080Ti-12G6X PGF OC

映眾GeForce RTX 3080 Ti冰龍超級版

(7692155)

RTX 4070 SUPER之后，本周我們又迎來了RTX 40 SUPER系列的第二款產品——RTX 4070 Ti SUPER。各AIC廠商在第一時間就推出了多款RTX 4070 Ti SUPER，要說用料扎實、性能出色，那肯定非這款ROG Strix GeForce RTX 4070 Ti SUPER OC Edition（下面簡稱ROG Strix RTX 4070 Ti SUPER）顯卡莫屬。

↓↓點擊視頻賞析ROG Strix RTX 4070 Ti SUPER↓↓

核心升級，性能起飛

盡管RTX 4070 Ti SUPER被歸類于RTX 4070系列，但其實際上采用了與RTX 4080相同的AD103核心。這意味著，RTX 4070 Ti SUPER血統更接近“80”系列，相對于RTX 4070 Ti，實現了跨級別的性能提升。

當然為了明確市場定位，盡管兩者核心相同，RTX 4070 Ti SUPER在規格上仍然與RTX 4080有所不同。具體來說，它減少了1個GPC、5個TPC和10個流處理單元，導致CUDA核心和紋理單元數量減少了約13%，二級緩存也縮減了25%。

與RTX 4070 Ti相比，RTX 4070 Ti SUPER的升級是顯著的。其GPU規模增加了大約10%，并且顯存位寬從192bit提升至256bit，容量也增加到了16GB，這種提升使得它在需要大量顯存帶寬和容量的游戲中表現更為出色。在功耗方面，RTX 4070 Ti SUPER的平均游戲功耗約為226W，整板功耗為285W，與RTX 4070 Ti保持一致。這表明，盡管性能有所提升，但其能效比也得到了優化。

從價格角度看，RTX 4070 Ti SUPER的首發價格與RTX 4070 Ti完全相同，這意味著消費者可以以相同的價格獲得更高的性能，性價比得到了顯著提升。對于仍在使用RTX 3070 Ti的老用戶來說，升級到RTX 4070 Ti SUPER將帶來飛躍式的性能提升。

ROG Strix RTX 4070 Ti SUPER賞析

看到外觀我們并不會感到陌生，ROG Strix RTX 4070 Ti SUPER沿用了ROG STRIX RTX 40系列家族式設計。顯卡導流殼的外觀設計獨具匠心，特別采用了紅藍漸變的配色方案，這種色彩組合既富有視覺沖擊力，又彰顯出別樣的個性魅力。在顯卡的左上角，經過精心鏡面處理的ROG信仰Logo熠熠生輝，不僅展示了品牌的獨特身份，更凸顯了電競信仰的堅定力量。

與此同時，散熱風扇上的三只“玩家之眼”圖標自帶霓虹效果，與Logo形成完美呼應，既增加了整體的科技感，又使得電競氛圍與賽博朋克風格得以巧妙融合。這種設計不僅極具辨識度，更讓顯卡在眾多硬件中脫穎而出，成為展現玩家獨特品味和犀利氣質的絕佳選擇。

在PCB的制造過程中，ROG Strix RTX 4070 Ti SUPER完全采用華碩領先的全自動制程技術，從而徹底消除了人工操作中可能出現的不穩定因素，確保了產品具有出色的穩定性和更長的使用壽命。

ROG Strix RTX 4070 Ti SUPER采用的是16+3相的數字供電設計，搭配50A高電流供電模組和15K電容，這對于226W的RTX 4070 Ti SUPER核心來說毫無壓力。可以確保其在2700MHz的高頻率下也能持續穩定運行。搭配GPU Tweak III軟件提供直觀的性能調校、散熱控制與系統監控。

散熱部分，ROG Strix RTX 4070 Ti SUPER配備的3.15槽散熱器擁有更大尺寸的散熱鰭片，搭配金屬背板的散熱口，能讓風量更充分地吹透散熱鰭片，有助于提升散熱效率。

顯卡采用了3個升級的雙滾珠軸流風扇，尺寸可以提供多出31%的風量，并且兩側風扇的旋轉方向和中央的風扇相反，減少了散熱模組內部的空氣亂流，帶來更強的散熱性能。同時顯卡風扇具備智能停轉模式，當GPU溫度低于50℃時，三個風扇將停止運轉，在不需要高性能時也有安靜的使用體驗。

顯卡的護罩、背板裝甲以及框架均由壓鑄金屬材料制成，這不僅顯著增強了顯卡的結構剛度，還有效地防止了PCB板在受到外部壓力時發生形變。這一設計也為內部的零件和線路提供了堅實的保護。

ROG Strix RTX 4070 Ti SUPER提供了3個DP 1.4接口和2個HDMI 2.1接口，充分滿足玩家連接各種顯示設備的需求。

高規格下性能表現搶眼

測試平臺

顯卡：ROG Strix GeForce RTX 4070 Ti SUPER OC Edition

GeForce RTX 4070 Ti OC版

GeForce RTX 4080 Founders Edition

處理器：Core i9 14900K

內存：芝奇DDR5 6000 16GB×2

主板：華碩ROG MAXIMUS Z790 HERO

硬盤：WD_BLACK SN850X 2TB

電源：華碩ROG雷神1000W

操作系統：Windows 11專業版23H2

為了清晰地了解ROG Strix RTX 4070 Ti SUPER的性能表現，我們還引入了RTX 4070 Ti和RTX 4080作為對比。

基準性能測試

基準性能測試部分，ROG Strix RTX 4070 Ti SUPER相對RTX 4070 Ti的提升非常明顯。在代表DX11性能的FireStike測試中，ROG Strix RTX 4070 Ti SUPER性能提升的幅度在6%~8%之間。在DX12的TimeSpy中，ROG Strix RTX 4070 Ti SUPER在TimeSpy和TimeSpy Extreme兩個項目中，分別獲取得了6%和8%的提升。由此可以看出，GPU規格提升也帶來了ROG Strix RTX 4070 Ti SUPER跑分成績的暴漲。

DXR光追部分，ROG Strix RTX 4070 Ti SUPER依然占據著優勢。SpeedWay項目中，ROG Strix RTX 4070 Ti SUPER的優勢最為明顯，達到了15%。而DXR和Port Royal兩個項目的表現則分別領先了6%和9%。畢竟66個第三代光追單元對上60個第三代光追單元，優勢不言而喻。

DLSS 2K分辨率測試中，ROG Strix RTX 4070 Ti SUPER相比RTX 4070Ti高了12%。DLSS 3測試中，ROG Strix RTX 4070 Ti SUPER在開啟DLSS 3后幀率大約達到原生4K的3.45倍，幀率達到114.69fps，而用來對比的RTX 4070Ti在4K下的DLSS 3測試成績僅為108.10fps，領先幅度達到6%。

光柵化游戲性能

接下來我們進入實際的游戲測試，NVIDIA官方給RTX 4070 Ti SUPER的定位依然是2K高幀游戲體驗。在2K分辨率下，ROG Strix RTX 4070 Ti SUPER確實展現出了相當強悍的實力。即便是幀率最低的《星空》和《心靈殺手2》，依然有89fps的平均幀率。在《極限競速：地平線5》《荒野大鏢客：救贖2》《使命召喚：現代戰爭3 2023》等游戲中，平均幀率更是在100fps以上，畫面流暢性相當不錯。與RTX 4070 Ti相比，ROG Strix RTX 4070 Ti SUPER的成績全面領先，其中在《瘟疫傳說：安魂曲》中的領先幅度最大，達到了10%。

如果我們將游戲的分辨率提升到4K，除了《賽博朋克2077》《心靈殺手2》《星空》《微軟模擬飛行2022》等四款游戲之外，其余游戲的畫面平均幀速都在60fps以上。可以說ROG Strix RTX 4070 Ti SUPER在4K分辨率下面對大多數均有一戰之力，至于部分對性能要求特別高的游戲，只要適當調低畫質，相信這款顯卡也能應付得過來。

光追與DLSS游戲性能

4K光追游戲部分，我們還加入了DLSS的測試，RTX 4070 Ti SUPER擁有更多的第四代Tensor Cores，正好可以一展身手。

即便開啟了光追，但是有了DLSS的加持，在2K分辨率下，測試游戲的畫面平均幀率最低的都達到了81fps，其他游戲至少都是將近100fps，游戲畫面的流暢性得到了保障。將畫面分辨率提升到4K之后，ROG Strix RTX 4070 Ti SUPER應對多數光追游戲都變得游刃有余。像《賽博朋克2077》《心靈殺手2》這樣的游戲，可以通過適當調低畫面設置或者是修改DLSS2檔位來實現畫面幀率的提升。

RTX 40系列還新增了光流加速器，配合同時發布的DLSS3技術可以通過AI計算生成完整的畫面幀，從而大幅提升幀率和降低幀延遲。從測試結果可以看到，有了開啟了DLSS3幀生成之后，《瘟疫傳說：安魂曲》的畫面平均幀率提升了133%、《賽博朋克2077》的畫面平均幀率提升了127%、《心靈殺手2》的畫面平均幀率提升了150%，就算是提升幅度比較小的《極限競速：地平線5》，也有32%的畫面幀率提升，由此可見DLSS3確實是提升游戲畫面幀率的黑科技。

當然DLSS不是只能在游戲中才能發揮其實力，在3D設計等生產力軟件中也能大幅提升效率和畫面質量。比如D5渲染器就提供了對DLSS 3.5的支持，包括了光線重建、超分辨率縮放和幀生成功能。從測試成績來看，在使用D5渲染器時只要開啟DLSS 3.5，ROG Strix RTX 4070 Ti SUPER的渲染效率就會大幅提升，并且渲染出來的畫面噪點明顯降低。

▲開啟DLSS 3.5之后可以看到橫梁上已經幾乎沒有噪點

ROG Strix RTX 4070 Ti SUPER通過引入DLSS 3（包括Reflex技術），實現了游戲性能的顯著躍升。該技術不僅大幅提升了游戲的幀率，還成功降低了幀延遲和操作延遲，為玩家帶來了更為迅捷的操控反饋。從FrameView的監測數據來看，當RTX 4070 Ti SUPER啟用DLSS 3后，眾多游戲的延遲均顯著降低，游戲的流暢性得到了顯著提升，為玩家帶來了極佳的游戲體驗。

在綜合游戲測試中，ROG Strix RTX 4070 Ti SUPER展現出了強勁的實力。相較于RTX 4070 Ti，其性能提升了約10%，同時能夠達到RTX 4080約87%~90%的性能水平，市場定位非常精準。在2K極限畫質下，ROG Strix RTX 4070 Ti SUPER能夠確保主流光線追蹤游戲大作維持高幀率運行，而開啟DLSS后，游戲的流暢度更是達到了極致。因此，稱其為2K光追游戲的高幀率旗艦實至名歸。

即便是在4K分辨率下，ROG Strix RTX 4070 Ti SUPER同樣表現出色。它能夠讓絕大多數游戲保持平均60fps以上的幀率。此外，借助DLSS 3/3.5（包含光線重建）技術的加持，游戲的幀率和畫質得到了進一步的優化和提升，為玩家帶來了無可挑剔的游戲體驗。

視頻/圖片編輯與3D渲染

ROG Strix RTX 4070 Ti SUPER相較于RTX 4070 Ti，在GPU規格上有了顯著的提升，同時顯存位寬也增加至256bit，容量更是擴充至16GB，這使其在生產力性能上展現出更為高效的表現。實際測試結果顯示，在Blender中，RTX 4070 Ti SUPER的性能可高出RTX 4070 Ti約12%；在V-Ray中，其領先幅度更是達到了約13%；而在Octanebench中，其優勢可擴大至約16%。總體來看，在3D渲染方面，RTX 4070 Ti SUPER相較于RTX 4070 Ti的性能提升幅度甚至超過了在游戲方面的領先幅度。此外，在SPECView測試中，RTX 4070 Ti SUPER相較于RTX 4070 Ti的性能提升最高可達10%，這一數據與理論預期相符。

相較于RTX 3070 Ti，ROG Strix RTX 4070 Ti SUPER在生產力上的優勢可謂相當明顯。在3D渲染輸出性能方面，ROG Strix RTX 4070 Ti SUPER的最高性能可超越RTX 3070 Ti約88%，平均領先幅度更是高達77%。值得一提的是，這一顯著優勢還是在未啟用DLSS 3/3.5技術的情況下實現的。如果渲染器支持DLSS 3/3.5，那么RTX 4070 Ti SUPER的領先幅度將有望成倍增長，為用戶帶來更加出色的渲染性能（這一點在前文的D5渲染器測試中得到了充分印證）。

在視頻轉碼方面，ROG Strix RTX 4070 Ti SUPER相較于RTX 3070 Ti展現了顯著的升級：不僅提升了轉碼效率，還增加了編解碼器的數量，并引入了對AV1硬件編碼的支持。根據達芬奇編碼測試的結果，RTX 4070 Ti SUPER在H.265編碼速度上相對RTX 3070 Ti提升了驚人的136%~157%。更為值得一提的是，AV1硬件編碼是RTX 3070 Ti所無法匹敵的新功能。因此，對于經常需要進行視頻剪輯的用戶來說，將手中的RTX 3070 Ti升級到ROG Strix RTX 4070 Ti SUPER無疑將會給你帶來更高的工作效率。

AIGC性能測試

▲在Stable Diffusion中使用NVIDIA TensorRT優化的Unet以大幅提升RTX 40 GPU的出圖效率

NVIDIA GPU對于Stable Diffusion的支持歷來都相當出色，不僅在兼容性方面表現出眾，更在計算性能上保持著顯著的領先優勢。為了進一步提升NVIDIA GPU在運行已訓練神經網絡時的效率，NVIDIA推出了TensorRT這一優化工具。根據NVIDIA官方提供的數據，借助TensorRT的優化，RTX 40系列GPU在Stable Diffusion的出圖效率上可以獲得近兩倍的大幅提升。

ROG Strix RTX 4070 Ti SUPER通過升級到16GB的顯存容量，為完成Stable Diffusion本地出圖任務提供了更加充足的資源。在本次測試中，我們選用了Stable Diffusion Automatic1111 WebUI來評估ROG Strix RTX 4070 Ti SUPER的出圖性能，并特別關注在使用NVIDIA TensorRT優化后，其出圖效率能夠獲得多大的提升。通過這一系列的測試，我們期待能夠全面展示ROG Strix RTX 4070 Ti SUPER在Stable Diffusion應用中的表現。

在進行Stable Diffusion的基準測試時，我們嚴格遵循了NVIDIA官方推薦的標準配置：采樣方法采用Euler a，采樣步數設定為50，CFG Scale參數為7.5，每批次處理2張圖像，共進行10個批次的測試。最終，我們以每分鐘出圖數量作為評價指標。

測試結果顯示，ROG Strix RTX 4070 Ti SUPER的每分鐘出圖數量達到了12.41張，這一成績顯著超過了RTX 4070 Ti的10.71張，相比RTX 3070 Ti更是提升了約78%。值得注意的是，與Core i9 13900K相比，ROG Strix RTX 4070 Ti SUPER的出圖效率高達其159倍，充分展現了其在圖像處理領域的高效表現。

為了探究NVIDIA TensorRT對Stable Diffusion模型優化前后的性能變化，我們選擇了Stable Diffusion XL和Stable Diffusion V1.5兩種模型進行測試，并特別關注ROG Strix RTX 4070 Ti SUPER在優化后的出圖效率。

在Stable Diffusion V1.5模型的測試中，我們分別采用了512×512和768×768兩種出圖分辨率。而在Stable Diffusion XL模型的測試中，則選用了更高的1024×1024分辨率，以確保與訓練模型時的圖片分辨率保持一致。除了分辨率的不同，我們保持其他參數的一致性：采樣方式為Euler a，采樣步數為50，CFG Scale設置為7，每批次出圖數為1，共進行10個批次的測試。

測試結果顯示，經過NVIDIA TensorRT的優化后，ROG Strix RTX 4070 Ti SUPER在Stable Diffusion V1.5的512×512出圖測試中性能提升了超過101%，在768×768出圖測試中性能提升更是達到了147%。在Stable Diffusion XL出圖測試中，性能提升也達到了106%。這些顯著的提升數據充分證明了NVIDIA TensorRT在優化神經網絡模型方面的強大效果，為ROG Strix RTX 4070 Ti SUPER帶來了更為出色的出圖效率。

功率和發熱實測

ROG Strix RTX 4070 Ti SUPER在滿載考機時的最高頻率也能達到2655MHz，此時顯卡的整板功率達到了282W，GPU最高功率達到了257W，可見性能釋放得非常充分。在此狀態下，憑借著性能強悍的散熱器，ROG Strix RTX 4070 Ti SUPER的GPU最高溫度只有58.5℃，熱點溫度也不過69.6℃，風扇轉速不過39%，幾乎聽不見明顯的噪音，散熱表現堪稱優秀。

我們還嘗試對ROG Strix RTX 4070 Ti SUPER進行了超頻，其游戲最高頻率達到了3060MHz，TimeSpy的跑分成績也所有提升，性能表現更加出色。

總結：性能加信仰，打造高端游戲主機必備

與RTX 4070 Ti相比，RTX 4070 Ti SUPER從GPU規格到顯存都有了顯著的升級，帶來的不僅僅是游戲性能的明顯提升，而且是專業應用性能到AI算力方面的全面進化。所以不管你是游戲玩家還是內容創作者，RTX 4070 Ti SUPER足以滿足你各方面的需求。

作為非公版RTX 4070 Ti SUPER中的頂級型號，ROG Strix RTX 4070 Ti SUPER有著由紅藍漸變配色和炫酷潮文字，彰顯出了品牌獨特的信仰。同時ROG Strix RTX 4070 Ti SUPER還少了不了先進自動制程工藝、奢華的用料以及配置豪華的散熱器，能讓顯卡釋放出最佳性能，帶來最佳的應用體驗。

對于那些想要打造出一臺性能強悍又有不凡外觀和信仰值電腦的用戶來說，ROG Strix RTX 4070 Ti SUPER是值得重點關注的選擇。

操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

時重傳和RTT的關系

測量RTT

線性算法估算RTT

基于均值的方差估算

核心升級，性能起飛

ROG Strix RTX 4070 Ti SUPER賞析

高規格下性能表現搶眼

總結：性能加信仰，打造高端游戲主機必備