玩網百萬稿費活動投稿,編譯 涂之錄,未經授權請勿轉載
數據總能讓你直觀地去判斷一個游戲的好壞。銷量,售價,評分,這些數字總能引起我們的購買欲望。但是還有一組特殊數據,要是它達不到要求,估計你會連玩游戲的欲望也沒有了。我們都知道《最后生還者》是一款把PS3機能發揮到極致的游戲,其精美的畫面總是讓我們流連忘返,但你一定不希望它卡成精美的PPT吧?所以在談論眾多游戲數據時,我們永遠繞不開一個老生常談的話題——那就是游戲的幀率。
你不會想玩只有10幀的《最后生還者》吧?
首先我必須澄清一點,就是在我們口頭討論游戲流暢度的時候,總是把“幀數”(Frame)和“幀率”(Frame rate)混為一談。其實在評測游戲流暢度的時候,幀率才是那個重要的指標,而不是幀數。關于這一點我會在下文中展開講。
那么為什么幀率那么重要呢?所有的老玩家應該都知道幀率是游戲體驗的基石,它的高低與穩定與否直接決定了游戲的流暢性與可玩度。是的,幀率幾乎是游戲流暢的全部。那我們就自然而然地引出下一個問題:幀率是不是越高越好呢?其實不然,具體原因《游戲幀數:并非越高越好,穩定更重要》這篇文章已經說的很清楚了。但這里我想補充的是:除了幀率,幀生成時間與單幀畫面(不撕裂)對游戲體驗來說也很重要。
說到這里,有些玩家可能已經有點暈了。所以在正片開始之前呢,我提議以小時候經常玩的翻頁動畫為切入點,讓我們先對幾個關于幀的重要概念做一個大致的回顧。
小時候常玩的翻頁動畫
幀(Frame):一幅字畫叫一幀,這是字典上對幀的解釋。其實在游戲中大致也是如此,幀就是影像動畫中最小單位的單幅影像畫面。簡單地來說,一幀就是一副靜止的畫面,連續的幀就形成了流暢的動畫。拿翻頁動畫舉例的話,其中的一頁就代表著一幀。其實游戲也是這么動起來的,只不過在這里“翻”的這個過程是由計算機來完成的。
幀數(Frames)/幀率(Frame Rate):普通玩家平時很容易混淆這兩個概念。幀數指一般指單位時間內幀的生成數量,而幀率指的則是單位時間內顯示的幀數(一般以FPS為單位)。先舉個簡單的例子:就像翻頁動畫,幀數代表著你翻到的那一頁的頁數,而幀率則代表你翻頁的速度。
再舉一個不算復雜的例子:如果一個動畫在一秒鐘內的幀數為60幀,兩秒鐘內的幀數為120幀,那么它的幀率則為60FPS。如果平均幀率越高,那么畫面越流暢。值得一提的是:在主機上,30FPS一般是游戲流暢運行的最低標準,而60FPS則被認為是比較完美的。
幀生成時間(Frame Time):顧名思義,幀生成時間指的就是渲染單獨一幀所需的時間。也就是在翻頁動畫中翻一頁所需的時間,所以生成幀的時間一般非常短,通常以毫秒為單位。那這和游戲流暢度又有什么關系呢?讓我們先來做一點小小的計算:如某秒的幀數為30幀,那么已知每秒30幀是流暢游戲的最低標準,1s又等于1000ms,所以平均每幀的生成時間為1000/30=33ms。也就是說只要每幀的生成時間小于33ms,那么我們是難以察覺到游戲中的卡頓的。如果幀生成時間忽上忽下,就算平均下來的FPS為30以上,整個游戲流程下來也不會太流暢。如果你不是很理解這個概念,下面這個幀生成時間圖能更好地幫助你更好地來理解這個概念(綠色代表流暢,紅色代表不流暢)。
33ms以下游戲就基本流暢了
說完了這么多,我想我們已經對幀率分析的基本概念有了一個了解。在PC平臺上,我們可以輕松地借助第三方軟件(Fraps),或游戲自帶的跑分程序來對游戲里的幀率表現有一個了解;而在主機平臺上,我們沒有現成的工具去衡量,靠肉眼去判斷又不準確客觀,但游戲里的掉幀我們又是有目共睹的。那應該怎么辦呢。外媒Digital Foundry告訴我們主機的幀率分析一般分三步走:采集——分析——對比。下面就讓我們一步一步地進行解析吧:
準備工作
就像我之前講的,PC上有很多現成的工具(如Fraps)來測試游戲的幀率,但由于主機系統相對封閉,我們并不能在游戲主機上直接測試游戲的幀率表現。在這里,我們選擇“曲線救國”的方式:即先把主機的畫面搬到PC上,然后再對畫面里的幀率進行分析。在整個過程中,“搬”這個至關重要的步驟就由采集卡負責。我們都知道,一塊采集卡能把來自主機的信號轉換為電腦視頻文件,而這些可打開的視頻便為游戲日后的分析埋下了基礎。不過在這里,我想強調的是:這塊采集卡必須足夠貴,足夠高端(1080P 60FPS起步),也只有這樣,搬運自主機的視頻文件才能做到足夠“無損”。如果搬運來的視頻與游戲實機畫面有出入,那么測試結果準確也無從談起。
這塊采集卡就要6000多RMB了
拿到這些無損視頻文件以后,我們以游戲《命運》為例,把它導入到DF自家的分析軟件FPS GUI中。
在這張圖的左邊中,從上到下我們可以依次清楚地看到當前幀率,幀生成時間表,和幀率變化表。
而在右邊的這些設置看似復雜,實際上與幀率測試沒有什么太大關系。這些設置一般決定了圖表的顯示位置,顯示范圍,以及內部的顏色,字體等等。
FPS GUI軟件概覽
由于是初次導入,我們可以看到目前這些圖表的設置并不合理(顯示當前幀率的地方遮住了游戲的HUD),在經過一些快速修正后,我們來看看成果。
修正后的畫面
然后我們再來看看喜聞樂見的跨平臺對比,我們分別導入兩個平臺的重復片段視頻,并設置成分屏顯示,在圖中我們可以清楚地看到左邊為PS4的幀率情況,右邊為XBOX的幀率情況,而圖表中不同顏色的線則代表不同平臺。
跨平臺對比
數據分析
我們已經大致了解了這款軟件的工作方法,那就讓我們再次深入,一探幀率測評的究竟。這次我們從Composite(合成)選項卡轉到Video(視頻)選項卡。現在,我們可以從右邊的information(信息)欄中一目了然地看到關于幀的詳細信息,下面我就對此欄做一個簡單的漢化。
右邊有各項詳細信息
視頻信息 幀信息
總幀數:3224 幀數:第2840幀
總撕裂幀數:3(0.09%) 是否屬于重復幀:否
總重復幀數:1613(50.03%) 是否屬于撕裂幀:否
平均幀率:29.98 撕裂幀位置:無
最低幀率:29FPS 當前幀率:30FPS
最高幀率:31.03FPS 渲染幀時間:33.33ms
最高正常幀數:1到2621幀共2620幀
最高撕裂幀數:2621幀到2623幀共2幀
有了上表,我們就大致上了解游戲的運行狀況,比如畫面撕裂是否常見,幀數是否穩定,以及當前幀生成時間(渲染幀時間)。那么這些信息是否一定準確呢?有了這些信息是否就夠了呢?讓我們帶著這些疑問,進入下一個環節。
畫面對比
要說游戲幀率評測的基本原則是什么,其實很簡單,就是找到兩幀之間的不同。計算機直接導出的結果可能有誤,但逐幀對比一定沒問題,不過有時候它們之間的差別又很難用肉眼直接對比出來。這時候,這款軟件的熱點圖功能(heat map)就派上了用場。
用于逐幀對比的熱點圖
如圖所示,這就是該幀的熱點圖。熱點功能把對比定位在了像素級層面上:如果圖中的顏色越亮,代表著與前一幀的區別越大,黑色則代表沒有任何區別。
而當我們把畫面移到下一幀時,我們發現整個圖像是暗的,這代表著這一幀與上一幀的畫面沒有任何區別。重復試驗,我們發現幾乎整個游戲流程都是這樣的排布。
全黑代表沒有區別
其實在60幀格式下錄制的視頻中,像命運這樣鎖30幀的游戲就應該有著一幀是重復幀,一幀是全新幀這樣的排布。而上述現象則剛好驗證了命運幀率為30幀的事實。
我們再看另一組對比,這次我們依次導入PS版與XO版的《蝙蝠俠阿卡姆騎士》,與《命運》不同,《阿卡姆騎士》對主機的機能要求更高,所以我們在兩個平臺上都找到了掉幀與畫面撕裂。
因為掉幀很容易在幀率變化表中找到,而畫面撕裂則不然。所以找到畫面撕裂的時空位置又是游戲幀率評測的一大重點。現在先讓我們切換到一幀有撕裂的地方。如圖所示,在PS4畫面的上部我們可以看到一個非常明顯的撕裂。這處撕裂實際上是由程序的算法計算而來,并由短橫紅線標在畫面上,而圖片的下方紅豎線則表示撕裂的持續時間與撕裂的大致位置。
左邊的畫面撕裂非常明顯
前面這組圖片展示的可能不太清楚,那么讓我們換張對比圖再做仔細講解
這里畫面撕裂非常頻繁
如圖所示,首先我們要明白藍色代表XOS,綠色代表XO,在下方的幀率表當中,以橫中線為界(上為XOS的情況,下為XO的情況),表中豎中線代表當前幀。紅色所占該線區域則為撕裂位置(所以我們看到XO的畫面上并沒有撕裂),而紅色區域則代表撕裂時間(兩個平臺不分伯仲)。
盡管這種紅線算法省時省力,不過算法總歸算法,也會有出錯的時候。當我們覺得這幀撕裂的狀況不確定時,我們可以再次利用熱點圖進行像素級別上的對比。
用熱點圖找撕裂位置
就像我之前所說,如果圖中的顏色越亮,則代表著與前一幀的區別越大,純黑色則代表與前一幀沒有任何區別。從圖上我們可以看出上一幀的部分畫面在這一幀的上部出現了滯留(黑色部分)。因此我們看到了畫面撕裂。如果我們想讓這些區別顯得更加明顯一些,我們可以切換為黑白模式,在這種模式下,只有相同(黑)與不同(白)兩種表示方式,因此我們可以更加直觀地找出區別。注:上圖與下圖不為同一幀。
用黑白模式找撕裂更明顯
既然說到手動檢查,那么我們不得不再提一下左下角的幀生成時間表。這里的幀產生時間表不僅可視化了游戲過程的流暢程度,而且我們還可以通過這個圖表來判斷幀率的測量是否準確。通過開頭的計算我們已經知道30fps對應的幀生成時間為33ms,如果在視頻的某個區間內出現了大量的掉幀情況,而幀生成時間還是維持在33ms左右,那么測量數據里一定有一個不準確,所以這里的幀生成時間就給整個測試上了一層保險。
十分有用的幀生成時間表
寫在最后
最后其實我想說,對于玩家而言,測試主機幀率的實際意義與可行性并不大(光采集卡可能就已經比主機貴了),但是從側面來說,這也給了我們一個了解主機游戲測評的機會,滿足了我們的好奇心。
其實對大眾來說,做這種測試的最大意義還在于其輸出結果。通過幀率測試的數據,我們可以很直觀地看出一款游戲的優化是否良心,或者該在哪個平臺上購買該游戲,這給玩家和廠商都是一個巨大的參考。
來源:Digital Foundry
編譯:涂之錄
今的3A游戲大作在畫面上已經有了長足的進步,讓玩家能夠體驗到真實而生動的游戲世界,但越來越精美的游戲畫面也對主機性能提出了更高的要求。除了硬件上的“軍備競賽”,還誕生了DLSS這種幫助游戲提升幀率、畫質的“黑科技”。今年的科隆游戲展上,NVIDIA正式推出了DLSS 3.5,擁有全新的光線重建技術,大家可能會好奇DLSS 3.5的體驗到底怎么樣,下面讓我們一探究竟。
↓↓↓點擊視頻了解DLSS 3.5實測↓↓↓
<script src="https://lf3-cdn-tos.bytescm.com/obj/cdn-static-resource/tt_player/tt.player.js?v=20160723"></script>
光線重建技術帶來了什么?
DLSS 3技術的原理和效果相信很多小伙伴都有一定了解了,DLSS 3的最大特性就是通過NVIDIA Ada Lovelace架構的第4代Tensor Core和光流加速器實現的光學多幀生成功能。簡單來說就是利用專用硬件和AI技術對游戲畫面進行補幀,從而大幅提升游戲幀率。DLSS 3.5新增的光線重建技術,顧名思義就是可以進一步提升游戲中光線追蹤的畫質效果。
那么,它是如果工作的呢?在傳統的光追游戲和渲染器里,游戲場景中的所有物體,如街道路面、汽車、高樓,在光線照射到自身時,都可以根據材質有不同反應,比如光滑表面的鏡面反射,粗糙表面的漫反射,物體遮擋部分的陰影等等。但是由于硬件資源有限,游戲不可能像現實里那樣做到無限多的光線數量和交互計算。所以通常的做法是使用光線采樣——向場景中的各個點發射少量光線作為代表性樣本,來確定光追場景的具體展現方式。
通過光線采樣的方法渲染出來的初級游戲圖像自然也不是完整的,同時會包含很多噪點。這時就還需要利用降噪器對畫面進行降噪處理,但人工編寫的傳統降噪器局限性很大,會導致光線追蹤畫面細節丟失,產生運動偽影等。到了最終的分辨率縮放輸出時,這些漏掉的細節或畫面瑕疵也會被同比放大,影響畫質。而且多個降噪器同時工作,會損失部分性能,從而降低光追游戲的幀率。
而DLSS 3.5新增的光線重建技術 (Ray Reconstruction)基于NVIDIA增強型人工智能神經網絡渲染,通過用超級計算機訓練的人工智能神經網絡,取代光線追蹤照明管線中需要人工調整的降噪器,在采樣的光線計算中生成更高質量的光線追蹤圖像,使得游戲更加逼真,光線更加自然。
值得一提的是,DLSS 3.5使用了比之前更多的數據進行訓練,這使得DLSS 3.5能夠識別不同光線追蹤效果,可以在采樣的時間與空間維度的光線數據上做出更“聰明”的選擇,并保留可識別的高使用率細節信息,實現更高質量的圖像升級。
此外,DLSS 3.5不僅支持RTX 40系顯卡,RTX 20系和RTX 30系顯卡都可以開啟,不過支持的只是光線重建功能這個特性。想要完整的體驗DLSS 3.5,就需要一塊RTX 40系顯卡,比如這款華碩TUF-RTX4070TI-O12G-GAMING顯卡。
華碩TUF-RTX4070TI-O12G-GAMING顯卡采用NVIDIA Ada Lovelace全新架構,擁有第三代RT Cores與第四代Tensor Cores,采用了NVIDIA定制的臺積電4N工藝,能效大幅提升。散熱方面,顯卡搭載了3個Axial-tech軸流風扇和3.25槽散熱器設計,能提供較大的散熱空間和更多的散熱鰭片,配合中央風扇與兩側輔助風扇的正逆轉工作設計,可以減少空氣亂流,提高散熱氣流利用率。
在做工用料方面,華碩TUF-RTX4070TI-O12G-GAMING采用了標志性的全自動化工藝制造,消除了人工在操作過程中的不確定性,讓顯卡的品質更出色。供電方面延續了超合金供電系統,為顯卡在長時間高頻狀態運行,提供充足而穩定的動力。
作為一款超公版RTX 4070 Ti,華碩TUF-RTX4070TI-O12G-GAMING,在默認模式下可以達到2730MHz的加速頻率,在OC模式下能達到2760MHz的加速頻率,擁有非常不錯的性能表現,用來體驗DLSS 3.5再合適不過了。
游戲實測:光追升級性能不減
測試平臺
顯卡:華碩TUF-RTX4070TI-O12G-GAMING
處理器:Intel酷睿i7 14700K
主板:ROG MAXIMUS Z790 DARK HERO
內存:金士頓DDR5 7200 16GB×2
硬盤:WD_BLACK SN850X 2TB
電源:ROG THOR雷神1200W Platinum II
操作系統:Windows 11專業版
游戲方面,我們選擇了《賽博朋克2077:往日之影》。由于在《賽博朋克2077:往日之影》中,光線重建技術和游戲中的路徑追蹤是綁定的,所以需要選擇“光線追蹤:超速”快速預設方案中之后,才會出現“DLSS光線重構”選項。當然,你也可以在其他預設方案中手動打開路徑追蹤功能再開啟光線重建。這里我們將畫質切換到“光線追蹤:超速”預設,DLSS質量模式,打開幀生成,并且關閉動態模糊,然后對比開啟光線重建(DLSS 3.5)與關閉光線重建(DLSS 3.0)的畫面效果。
首先來看看畫面表現吧,從游戲場景截圖可以明顯地看出,開啟DLSS 3.5之后,游戲的整體畫面表現都得到了十分明顯的提升。即使不看細節部分,開啟光線重建后的畫面在觀感上也要優秀許多,建筑和物品的輪廓清晰,沒有錯位和重影的現象,各種霓虹燈光發出的光線對周邊物體的交互效果更真實,亮度和顏色飽和度都更高,和DLSS 3.0比起來整體畫面感覺非常通透。
DLSS 3.5
DLSS 3.0
DLSS 3.5
DLSS 3.0
而在游戲中的光追反射場景下,DLSS 3.5的畫質優勢體現得最為明顯。街道上的積水和光滑地面的反射效果,開啟DLSS 3.5時可以通過積水反射清晰地看到廣告牌上的文字和建筑細節,同時地面上的光線過渡自然,而DLSS 3.0的倒影就會顯得很模糊,沒有什么細節,運動時的偽影也比較明顯,顯得不夠真實。
DLSS 3.5
DLSS 3.0
DLSS 3.5
DLSS 3.0
DLSS 3.5的光線重建還能改善燈光的顯示錯位問題。在關閉DLSS 3.5時,可以看到車輛在高速行駛時,車燈的照射范圍偏后且沒有方向感。而開啟DLSS 3.5后,就能準確還原車燈照向前方的光照效果,道路四周的反射都能夠做到真實還原,更符合真實世界和直覺,在游戲過程當中能夠感受到代入感極佳的視覺效果及游玩體驗。
DLSS 3.5
DLSS 3.0
除了帶來更加出色的光追畫面之外,DLSS 3.5對游戲性能提升也有一定的積極作用。因為游戲從多個人工降噪器減少到光線重建技術的1個AI降噪器,有利于提升運行效率。
從我們的測試來看,使用華碩TUF-RTX4070TI-O12G-GAMING顯卡,使用“光線追蹤:超速”預設方案,在原生2K分辨率下,平均幀率只有不到25fps。打開DLSS 3.0(關閉光線重建)的幀率能夠達到81fps,而打開DLSS 3.5(開啟光線重建)后,游戲平均幀率甚至還要比DLSS 3.0高,達到了90fps,是原生分辨率的3.6倍,而在實際的游戲場景中,DLSS 3.5的幀率同樣是最高的,表現非常優秀。
總結:DLSS 3.5加持,盡情暢游光追世界
經過體驗下來,我們認為新的DLSS 3.5對于玩家來說意義還是非常大的,其新增的光線重建技術讓光追游戲畫質的大幅提升,并且在我們測試中沒有發現任何的負面效果,甚至還有一定的性能優勢,配合DLSS 3.0的幀生成技術,實現了畫質和游戲幀率的雙“豐收”。希望未來會有越來越多的光追游戲支持DLSS 3.5,并且不再限定于某幾種畫質預設,這有助于擴展DLSS 3.5的使用范圍,為玩家帶來更好的游戲體驗。
另一方面,RTX 20/30系顯卡雖然也能夠開啟單獨光線重建技術,但它的作用更多是“錦上添花”,不會像DLSS 3.5那樣帶來巨幅的幀率飛躍。要想完全發揮DLSS 3.5的實力,就需要一款RTX 40系顯卡,比如本次測試使用的華碩TUF-RTX4070TI-O12G-GAMING顯卡,就能在2K分辨率最高畫質下盡情暢游《賽博朋克2077:往日之影》的光追世界。
幾天應該不少人要都鳥槍換炮升級電腦了吧?你有沒有遇到過明明升級了裝備,結果運行游戲時幀率提升不理想的情況?又或者新電腦幀率忽高忽低的不穩定,這些“毛病”可不單純是“賴”硬件,可能是組合的選擇出現了失誤,也有可能是設置出現了問題。硬控5分鐘了解一下以下幾種情況,如果你恰巧遇到就知如何對癥下藥了。
同樣的畫質設置,2K分辨率、1080P分辨率下游戲運行幀率幾乎沒有區別,影響微乎其微,這種情況其實就是遇到了CPU瓶頸——別把懷疑的目光投向顯卡,這個鍋顯卡真不能背。
簡單直觀的解釋一下:顯卡每生成一幀游戲畫面都要和CPU進行溝通“大哥,我渲染了一幀畫面”,CPU會說“好的我來接手,完事兒給你發回來你再輸出”。如果搭配得當,這個溝通過程會非常有序。但是如果CPU的性能不夠,這個溝通就會變得這樣:“大哥,我渲染了一幀畫面;大哥,我雙渲染了一幀畫面;大哥,我叒渲染了一幀畫面;大哥,我叕渲染了一幀畫面……大哥你怎么了大哥?”,這時候的CPU因為性能不足,可能剛剛開始處理第一幀渲染的畫面,顯卡這時候喊破喉嚨都沒用。
無論是1080P還是在2K分辨率下,CPU能干的活就是這么多,幀率自然也就上不去——4K分辨率下,CPU則會因為過于“拖沓”,別的電腦幀率波動可能只掉10幀,同樣的情況你的電腦就會掉30幀甚至更多,原因就是“忙不過來”。
CPU的單核IPC性能、睿頻頻率,甚至是三級緩存,都是影響游戲性能的直接因素,所以當你發現切換分辨率后游戲幀率幾乎沒有變化的情況,就要考慮是不是CPU的問題了。
CPU、顯卡配置都不差,但是游戲過程中會遇到幀率波動的情況,尤其是明明可以高幀率運行,但是總會遇到卡頓的問題,一般在線競技類游戲容易出現這種問題,一般來說這有兩類可能。
第一種情況是系統出現了性能瓶頸,這個瓶頸并非顯卡本身造成的,真正的原因有三個可能:CPU緩存瓶頸、內存帶寬瓶頸、硬盤傳輸瓶頸。如CPU的緩存、尤其是三級緩存容量較小,亦或者內存頻率較低都容易造成幀率波動大的情況。當然,最后一種可能性比較小、尤其是如今已經邁入高速固態硬盤的時代;
第二種情況是過熱降頻,主要是CPU降頻——顯卡也有降頻的情況,但它會是持續性的拉低幀率,不是忽高忽低這種表現。CPU如果過熱的話會限制睿頻頻率,游戲對頻率變化通常都是比較敏感的,但是當CPU的溫度恢復到閾值以下時頻率又能正常拉高,這就會造成游戲幀率波動的情況。
遇到第一種情況的,需要確定是CPU還是內存部分的問題,然后看是否有必要進行升級、更換;遇到第二種情況的,就要認真看一下自己電腦的散熱是否到位了。
無論是CPU還是顯卡,甚至是固態硬盤、內存都是一水的高配,但是游戲運行效率總是難盡人意,比如會遇到1% Low幀問題、或者是某個游戲幀率明顯偏低,再或者是高特效不能拉滿。遇到這些,可能要從軟件設置入手而不是硬件本身。
針對1% Low幀,是否正確開啟了“Re-Size BAR Support”和“Above 4G”是一個解決思路,新電腦的BIOS設置都具備這兩個選項,開啟后可以一定程度上改善1% Low幀問題,我們在《次時代顯卡的小秘密 這個選項你打開了嗎?》中有詳細說明,這里就不多著墨了。
針對特定戲幀率明顯偏低,大概率是顯卡驅動的問題,尤其是新游戲剛發布時顯卡廠商會推送相關的驅動程序更新,新版本驅動會針對特定游戲項目進行優化,并且未來幾個版本都可能會涉及到這個新游戲的性能/BUG優化、修復,所以遇到新游戲幀率明顯偏低的情況,就要看看顯卡廠商是不是提供了新版本驅動程序了。
最后就是游戲高特效幀率不高的問題,不要以為高配電腦就一定可以暢玩,除了NVIDIA GeForce RTX 4090、AMD Radeon 7900XTX之外(算半個),大部分顯卡是無法以4K+滿特效+高幀率運行的。另外就是是使用高刷顯示器的玩家,經常希望游戲能以最高分辨率+滿特效+高幀率匹配高刷新率,講真,部分3A大作下這種要求NVIDIA GeForce RTX 4090都不一定能滿足……