這是一個讓人絲毫不敢怠慢、擁有悠久歷史的標題,故事還要從2011年年底開始說起。在40納米制程之后,AMD率先進入28納米制程時代,并在南方群島系列顯卡上使用煥然一新的GCN(Graphic Core Next)架構,代表出征的Radeon HD 7970顯卡不僅擁有壓倒性的完整規格,微架構上也有充分的可圈可點之處,放在今天依然是一張很有收藏意義的顯卡。而老對手NVIDIA緊接著在2012年祭出同樣是28納米的開普勒架構,放棄大而全的戰略之后在能效比上一直領先到今天,回想2012年,爭論HD 7970(GE)和GTX 680誰更勝一籌的口水現在還聞得到臭味。
但是隨后的歷史發展可以說跌出人們的想象,NVIDIA在一年后的2013年竟然偷偷拿出一塊GK110的大核心,其化身GTX Titan和GTX 780更是打亂AMD的布局,自此NVIDIA的Maxwell、Pascal架構一代接著一代演變,每一次都在微架構上有充分的變革,不僅SM單元相繼演變成SMX、SMM,每組SM單元的流處理器也從192 CUDA向128 CUDA核心過渡,甚至在GP100核心中達到64 CUDA核心,同時能效比也越來越高。反觀AMD則將GCN架構一條路走到黑。其實本身GCN架構確實是一個被證明可堪大用的微處理器架構,但是從GCN 1.0的Tahiti、GCN 2.0的Hawaii、GCN 3.0的Fiji,再到GCN 4.0的Polaris架構,根本上一直沒有大的改進,每組CU單元也一直容納64個ALU單元,這些都是能耗比越來越落后NVIDIA的一個旁證,反倒是更多玩家在乎的性能反而沒有太大差距。
開普勒架構中的GK104架構,每組SMX收納192 CUDA
麥克斯韋架構中的GM107架構,每組SMM單元收納128 CUDA
但這些都是微架構級別的演變,一般玩家是不會太在意這些的,那為什么從這兩年開始“負優化”一詞開始叫的越來越響?一種有代表性的聲音是:每當NVIDIA的新架構上市時,舊架構的顯卡在性能上后受到微妙的封印,導致游戲表現逐漸被時代拋離,因此“負優化”也可以說是一種廠商勸你更換設備的“溫柔”的提示,但是由于AMD的GCN架構在四代同堂面前擁有不可撼動的共生性,個個顯卡都是根紅苗正、血統純正的GCN架構,因此每當AMD爬上一個性能的高地并用驅動帶領大家的時候,整個家族都可以享受接送專車的待遇。
Tahati架構
Hawaii架構
GCN 3.0架構的Fiji
GCN 4.0架構的Polaris
這種言論確實有一定的道理和邏輯,不少用戶也信以為真,尤其是面對一些軟件優化不佳、完成度不夠高、對于性能要求苛刻的游戲時,新顯卡支持新特性自然一帆風順,而特性不夠豐富的舊架構顯卡成績往往會吃癟,因此這種聲音在這些成績面前更是仿佛真相昭昭,那么,世間真的存在負優化嗎?
測試詳情:橫跨1400天的19款驅動
如果“負優化”真的存在的話,找出癥狀最佳的方法就是通過游戲測試,準確的說是利用老款顯卡和老款游戲,在時間的縱向表現上通過成績的波動來反應顯卡的變化,而AMD、NVIDIA兩家身邊自然不會缺少游戲的陪伴,Gaming Evolved和GameWorks已經是玩家眼中的熟客。
這次我們選擇的顯卡為開普勒架構、GK104核心的GeForce GTX 770,以及更早的GCN 1.0架構的Radeon HD 7870,他們都是2013年、甚至更早的產物,如果負優化存在的話,他們自然難逃一劫。游戲方面,我們選取的也是在2012-2013年發布的Gaming Evolved、GameWorks游戲,包括《殺手5:赦免》、《蝙蝠俠:阿卡姆之城》、《蝙蝠俠:阿卡姆起源》。游戲設置方面,三款游戲的畫質全部選擇最高預設畫面,但為了充分拉大差距,我們關閉很影響性能的抗鋸齒和環境遮蔽光選項。
首先是Gaming Evolved陣營的殺手47,他們一直就是AMD Never Settle營銷計劃的??停螒騿禹撁嬉灿蠥MD Gaming Evolved的Logo,開發工具“冰川2”和后期的“黎明引擎”都一直伴隨DX12、TressFX等技術出現在一起。而蝙蝠俠系列自然更不用說,從娘胎里就是GameWorks技術的座上賓,尤其是其中PhysX技術和《阿卡姆起源》中的曲面細分的利用還曾一度引起一番口水戰,在《看門狗》之前就和《孤島危機2》一樣遭受過性能方面的質疑。
更重要的是所選的驅動不僅要完整的覆蓋2012年直到今天的1400多天,還要在其中篩選為特定的游戲優化的正式版驅動,因此我們選擇的驅動包括:
Catalyst 12.3 (支持Radeon HD 7000系列顯卡)
Catalyst 13.4 (優化《蝙蝠俠》)
Catalyst 13.9 (優化《蝙蝠俠》系列游戲)
Catalyst 13.12(2013年年終禮包)
Catalyst 14.4 (引入Mantle、幀平滑技術)
Catalyst 14.9 (繼續優化《蝙蝠俠》)
Catalyst 14.12 Omega(有史以來最強AMD驅動)
Catalyst 15.7 (正式支持Windows 10)
Crimson Edition 15.12 (淘汰催化劑后的第一個正式版)
Crimson Edition 16.11.4(11月中旬的驅動)
GeForce 320.18 (優化多款游戲)
GeForce 331.58 (優化蝙蝠俠)
GeForce 334.89 (優化《殺手》)
GeForce 337.50 (回應Mantle的超級驅動)
GeForce 344.11 (支持GTX 980、加入DSR)
GeForce 347.52 (羊年雞血大禮)
GeForce 353.62 (Windows 10正式版驅動)
GeForce 358.91 (年終大禮)
GeForce 375.95 (11月中旬的驅動)
可以看出,所選驅動除了為了回應Mantle而號稱依靠驅動就可以改進API效率的337.50 Beta之外,全部是號稱為游戲優化的正式版驅動。
測試結果:不存在負優化,但存在年終獎
說測就測,我們一個游戲一個游戲地看,首先是《蝙蝠俠:阿卡姆之城》:
可以看到,無論是AMD還是NVIDIA的驅動,都沒有出現隨著時間發展而性能倒退的現象,雙方都沒有出現負優化,而且現實是顯卡的性能在歷史的長河中總得來時是穩定在一個區間內,并不會存在劇烈的攀升或倒退,但是其中不乏在特定時期內的雞血,比如在2014年年底AMD重磅宣傳的Catalyst Omega,相比上一個正式版14.7提高9%,在此之后幀數基本穩定,不存在劇烈的浮動。
反觀NVIDIA方面,宣傳已久的負優化并沒有看到明顯的證據,但是同樣出現特定時期的雞血驅動,比如在2014年的上半年,為了抗衡對手的Mantle“饅頭”API而推出的重磅GeForce 337.50,相比上一款WHQL驅動提高7%,此后便沒有出現明顯的浮動。
再來看看NVIDIA主導的《蝙蝠俠:阿卡姆起源》:
這一次AMD展示出“A卡戰三年“的證據,從2012年最先開始支持HD 7870的Catalyst 12.3跑出的64幀到今年11月的Crimson Edition 16.11.4的86幀,性能竟然提高近20幀,轉換成百分比達到28%,仿佛一位忠實的管家在年月的長河中一直在慢慢地打補丁,可見家丁興旺地GCN架構還是得到充分的性能便車。而技術主導的NVIDIA顯卡性能則沒有出現較大的浮動,無論是當初聽上去很嚇人的雞血337.50,還是歷年年底的雞血都沒有任何提升。
再來看看AMD主導的《殺手:赦免》:
最后再來看看Gaming Evolved技術主導的《殺手》,這份成績中最明顯一點就是NVIDIA顯卡在2014年的337.50 Beta之后出現巨大進步,從54幀一大步提升50幀升至74幀,一口氣提升37%不得不說是一個讓人震驚的數字,并且在這之后沒有倒退,要知道GTX 770和HD 7870原本并不是一個位置的顯卡。
但是再看看技術上處于優勢地位的AMD Radeon HD 7870則顯得很穩定,在一開始憑借甜點級顯卡可以力戰對手旗艦顯卡不得不說讓AMD占盡優勢,但是在對手憑借雞血驅動而力爭更上游之后卻沒有做出進一步的動作。從今天來看,兩張顯卡的差距已經20幀以上,換算成百分比已經近40%的差距,這明顯大于兩張顯卡的真實距離。
總結:老顯卡確實仍可一幀,但取決于雞血驅動
最后來說說總結:就我們選取的游戲可以看出,其實并不存在什么”負優化”一說,正相反的是,老游戲在老顯卡下不僅沒有出現隨著歷史的車輪前進而出現的性能下降,反而雙方都出現了讓人驚訝的性能提升。
從幾年前的第一款驅動和今天的驅動對比
從上面一張圖上可以看出,以HD 7870、GTX 770發售的2012、2013年的第一款支持驅動和上個月中旬的這跨越1400天的驅動兩兩相比,幾年之間:N卡在《蝙蝠俠:阿卡姆之城》累計產生10.1%的性能提升,在《蝙蝠俠:阿卡姆起源》近乎原地踏步只有不到2%的提升,而在對手主導的《殺手:赦免》上甚至取得45.4%的性能提升,其中絕大多數進步來自2014年那個著名的雞血337.50 Beta。
在來看AMD陣營,在《蝙蝠俠:阿卡姆之城》上幾年累計提升12.7%,在對手主導的《蝙蝠俠:阿卡姆起源》上取得28.3%的進步,在自己主導的《殺手:赦免》則進步較小,幾年間累計取得9.61%的提升,其中絕大多數進步來自2014年底的Catalyst Omega。不過雙方最大的提升都是來自對手主導的游戲。
總的來說,可以確定世界上并不存在“負優化”這種現象,只有一年一見的重磅級別的驅動才會對顯卡性能產生足夠大的影響,例如2014年那兩款極為亮眼的驅動,否則一款顯卡先天的性能如何,后半生一貫的性能便是如何,可見平時我們覺得出現負優化的時候,經常都是因為游戲的優化不足而發生的對于新特定產生的“中招者偏差”。
在同樣顯示面積上擁有更多的像素,4K確實可以帶來更為精細的顯示效果,但是對系統的壓力卻是很多用戶沒有考慮到的。如果說一臺老式電腦勉強可以流暢運行1080p的高清影片,就算它可以運行4K分辨率播放起大片來也會卡頓。而應對目前主流游戲已經略有吃力的中端電腦,如果想在4K分辨率上運行游戲一定會出現“幻燈片”一樣的卡頓現象。
性能瓶頸和資源問題
4K顯示技術最早由電影行業提出,當時規定支持4096×2160分辨的超高清電影屬于4K影片級別。4K顯示技術后來不斷普及到民用領域,進入PC顯示器后最終3840×2160分辨率成為主流,被稱為Quad Full HD,是Full HD的1920×1080分辨率的四倍。
目前4K普及最大的問題不僅在配置能否跟上4倍增長的分辨率上,更嚴重的問題在資源方面。除了寥寥無幾的幾個4K分辨率演示視頻片段外,我們有機會獲取的4K視頻片源幾乎為零??晒┰诰€觀看或者下載的影片能夠達到1080p已屬不易,顯示器空有超高分辨率卻無片可看實在尷尬。
圖54K分辨率所能顯示的內容是1080P的四倍
圖6如果在相同尺寸上4K會比HD清晰很多
模擬分辨率技術體驗4K
如果我們實在拿不準我們是否已經做好4K的準備而在選購時猶豫不決,其實可以通過一些軟件實現模擬的4K環境,判斷自身電腦是否可以滿足超高的分辨率。臺式機上面兩大顯卡品牌NVIDIA和AMD都擁有這樣的高分辨率模擬技術。
NVIDIA在2014年重磅推出Maxwell架構,與GTX 980/970一起降臨的還有動態超級分辨率(DSR)技術。DSR是用來做什么的?簡而言之DSR能夠以更高、更細膩的分辨率渲染游戲,然后把畫面智能地縮放至顯示器的原生分辨率,因而可在任意屏幕上為玩家提供4K(3840×2160)或以上畫質的圖形效果。NVIDIA能做AMD也跟上了,最新的Omega驅動中AMD也引入了類似的技術,名字叫做視覺超分辨率技術(VSR),與NVIDIA的DSR技術在本質上是差不多的東西,都是把每一幀圖像按照4K分辨率渲染,在以1080p分辨率的方式輸出到顯示器上,以此達到讓圖像細節和抗鋸齒表現更好的效果。
圖7NVIDIA的DSR技術旨在實現更清晰的游戲畫面
圖8AMD的VSR技術的顯卡支持讓人有些“看不懂”
開啟方法
最初只有GTX 980/970支持DSR,需要安裝GeForce344.11WHQL或以上版本的驅動程序,點擊GeForceExperience 2.1.2中的優化即可,基本上游戲內支持用戶界面縮放的游戲都可以順利啟動。其實就算GeForceExperience不支持的游戲,也可以選擇進入NVIDIA控制面板的3D設置中把DSR縮放系數(1.2~4倍)選擇為自己想要的數值,然后選擇游戲中就能出現對應的分辨率。在新版本GeForce驅動程序中逐漸放開了支持DSR的顯卡型號,基本目前所有主流的NVIDIA顯卡都能享受這一技術。
AMD最新的Omega驅動并沒有把VSR選項集成到3D設置中,而是放在了顯示器屬性中。開啟VSR之后直接把顯示器原生分辨率給提升了,一款原生1080p分辨率的顯示器開啟VSR之后提升到了最高3200×1800分辨率了,刷新率維持在60Hz。由于只是在最新Omega中初次嘗試,支持VSR的AMD顯卡依然較少,目前只有R9 295X2、290X、290和R9 285四款顯卡支持。比較詭異的是不同顯卡所支持到的最高分辨率各有不同,能真正支持到3840×2160以上分辨率的只有最低端的R9 285顯卡,讓人有些匪夷所思的感覺。
圖9用戶可以在NVIDIA驅動程序面板中調整縮放比例
圖10GeForceExperience中對游戲的優化也有DSR選項
圖11AMD的VSR選項在顯示器屬性中
圖12兩者最終實現的效果十分相似
開啟感受
盡管命名不同,兩種顯示技術開啟后給人的感受高度一致。首先在Windows桌面上提高分辨率確實能夠顯示更多的內容,比如筆者使用這臺24英寸的1920×1080的顯示器選擇DSR的1.78倍縮放后直接可以實現2560×1440分辨率。不過縮放后所有字體都變得稍微有一些模糊,有籠罩在一層薄霧中的感覺。
游戲內可以開啟更高的分辨率,不過游戲性能的下降十分顯著。比如在1920x1080分辨率下狙擊精英3、地鐵2033、神偷4的幀數分別是127.7fps、46.2fps、56fps,開啟AMD的VSR后降低到了65.1fps、33.7fps和33.67fps,降幅甚至已經達到50%。
不過也有確實的好處,在1080p顯示器上運行高分辨率游戲,我們完全可以放棄游戲內的所有抗鋸齒效果,實際游戲畫面當中任何鋸齒似乎都蕩然無存。具體可以聯系到蘋果手機iPhone 4最初推出視網膜屏幕的感受,你確實很難在畫面當中找到肉眼可見的鋸齒邊緣了。