英偉達nVidia RTX2080(Ti)顯卡發布,價格和性能都遠超GTX1080

英偉達nVidia RTX2080(Ti)顯卡發佈,價格和性能都遠超GTX1080

傳統CUDA 提升性能的潛力 差不多耗盡,增加指令集 是提升特定應用性能的最有效方式。

參考下Intel吧,Core架構出來之後,每一代均被詬病擠牙膏。即使是八代增加了兩個核心似乎可以提升40%性能,但實際上單核性能的提升依然有限——架構優化、頻率提升等手段早已經用過了,再優化架構,再提升頻率,帶來的性能提升很是微弱。

現在看來,GPU也進入這麼一個瓶頸了。拋開RT Core和Tensor Core,1080 Ti是3584個CUDA核心,頻率1480 Boost 1582,2080 Ti是 4352個CUDA核心,頻率1350 Boost 1545。GPU傳統的塞核心提升並不多,而且在製程升級到12nm後還需要付出降低頻率的代價才塞下了多出來的核心(也有RT Core/Tensor Core佔用部分功耗的原因)。架構優化方面,從發佈會和外網新聞似乎都沒有提及,我個人猜測並沒有太大幅度的提升。

當然,從Core發佈以來,AVX,AVX2.0,AVX512的提升幅度其實是很大的——前提是應用能用上。同理,RT Core/Tensor Core的性能提升也是一樣——前提也是應用能用上。

不過和CPU不同的是,使用GPU計算的應用數量少得多。至今能發揮CPU的AVX性能的應用屈指可數,而且幾乎沒幾個普通用戶用得上。而GPU就民用市場來說,幾個遊戲引擎,幾個GPU渲染器支持,就可以算普及了——當然,遊戲廠商對應的優化還是要做的,但一年內只要獲得5~8個3A大作的支持,就可以體現出2080 Ti的RT性能優勢,這個對NV來說並不算難事。唯一的問題是:6倍的RT性能提升能帶來的畫面提升到底有多大?如果說以前能體現RT畫面優勢的場景,1080 Ti的性能是1 FPS的話,2080 Ti的6 FPS還是無法接受的。要提升到60 FPS,勢必要消減大量RT運算,只是這樣消減後,RTX還能體現出多大畫面優勢?

如果RT畫面優勢難以體現的話,那麼即使按照Boost頻率來計算,2080 Ti對比1080 Ti性能提升大概在18.6%左右;按照基本頻率計算則只有10.7%。平均一下,實際遊戲提升估計在15%左右——也就是說,1080 Ti能跑60 FPS的遊戲,2080 Ti能跑69 FPS。這個性能提升幅度,我個人認為沒有什麼吸引力——起碼是對不起2080 Ti和1080 Ti的價格差異。

英偉達nVidia RTX2080(Ti)顯卡發佈,價格和性能都遠超GTX1080

根據經驗來說,中低端直接一口說死不給光追,而不是稍後上市,很有可能是即使給你,你也不會有什麼太好的體驗。

看RTX2070的規格理論上倒是完全能做(175/185w,按照慣例,砍1/3左右差不多對應的就是120-130w的X60)

這代就是純白鼠,遊戲沒幾個支持的,而且廠商基於家用機開發不說,現在這套方案連PC中端都沒有支持(X60都沒有光追),就不說廠商有幾個下場,下場的也不可能特別激進的去調光追,比DX11初代卡還慘的趕腳,DX11當年NV從低端到高端好歹也都是一組SIMD一組多形體單元,怎麼著都是完整硬件支持,這個就真是餅,存量市場不支持不說,新甜點都不支持,那就真的很難受了。

我估摸著怎麼也得再換兩代顯卡以上這個技術才有可能真成熟,或者說至少甜點級能好好用。

AMD那邊倒是真不用擔心,索尼微軟兩個爸爸都在定製貨,一個是大部分銷量擔當,另一個是小部分銷量擔當+PC圖形標準制定,他們才是真確定遊戲畫面形態的巨頭。

還是那句話,遊戲畫面主要還是和遊戲公司同業競爭,和顯卡和消費者競爭的,肯定是沒有好結果的,對遊戲廠而言你充值10000買TITAN也好,2080ti也好,還不就是買那麼一份兩份豪華版遊戲,他們又不能本質得益,賺個口碑罷了。

英偉達nVidia RTX2080(Ti)顯卡發佈,價格和性能都遠超GTX1080

GeForce RTX 2080 ti VS GTX 1080 ti ——架構

和 10 系列的其它顯卡一樣,比如 GTX 1080,GTX 1080 ti 基於英偉達的 Pascal 架構,英偉達承諾會比前代顯卡性能提升 3 倍,在 VR 和其它高級遊戲技術上表現優異。

搭載了 Pascal 架構後,英偉達引入了 16 nm FinFET 工藝,使得 1080 ti 具有更低的功耗、更高密度的晶體管和更好的性能。

而這次發佈的 RTX 2080 ti 基於英偉達新的 Turing GPU 架構,是 RT Cores 的首秀。所謂 RT 就是英偉達的“光線追蹤”(Ray Tracing)技術,能夠計算在 3D 環境下光線和聲音的傳播,計算速度高達每秒 10 GigaRays。理論上能讓 RTX 2080 ti 這樣的 Turing GPU 的實時光線追蹤處理速度比 Pascal 架構快上 25 倍。

由於 Turing 架構還搭載了 Volta 架構中的 Tensor Core,能夠執行每秒達 500 萬億次的張量運算,因而能助力 AI 驅動的渲染方法,比如深度學習抗鋸齒處理,從而讓遊戲玩家體驗更逼真的圖像。

英偉達nVidia RTX2080(Ti)顯卡發佈,價格和性能都遠超GTX1080

英偉達 Turing 架構應用了 GDDR6 內存,速率達到 14Gbps,具有 186 億個晶體管,相較之下 Pascal 架構只有 118 億個晶體管。

RTX 2080/2080 ti VS GTX 1080/1080 ti ——規格

我們以一張表列一下 RTX 2080/2080 ti 和 GTX 1080/1080 ti 及 RTX 2070 的主要參數:

英偉達nVidia RTX2080(Ti)顯卡發佈,價格和性能都遠超GTX1080

英偉達則承諾 RTX 2080 ti 性能較上代顯卡最高可提升 6 倍,而從深度學習用 GPU 角度講,從參數規格上來看,RTX 2080 ti 的性能比 GTX 1080 ti 應該能至少提升 40%,當然這一切還是要靠時間來檢驗。

總之在我們看來,RTX 2080 ti 會是一件對遊戲行業以及深度學習領域帶來重大影響的硬件產品。 20%-40% 的硬件性能提升,再加上深度學習算法的優化,將大大促進深度學習領域的創新,對未來一兩年內 AI 技術的落地應用具有重要意義。

英偉達nVidia RTX2080(Ti)顯卡發佈,價格和性能都遠超GTX1080

單憑紙面顯存帶寬和cuda core數目還有14t浮點性能來對比1080ti的人,可都省省吧,連“除開rt之外2080比1080ti提升不多”這種話都出來了,合著圖靈核心裡新加的那個tensor core 被吃了?

事實是,就算完全拋開rt 的場景和rt core,光靠tensor core 和cuda core的合作,20系顯卡也是隨意吊打10系的存在,為什麼呢?因為20系靠著AI抄了近路。

英偉達nVidia RTX2080(Ti)顯卡發佈,價格和性能都遠超GTX1080

來看看到底為啥要用RTX OPS來評估新卡的性能

雖然TURING裡的cuda core 相對於1080ti確實只有百分之二三十的算力提升,但全新的渲染管線下,渲染1幀圖像的時候根本不用按照原來的逐個像素去渲染!渲染部分像素之後,剩下的都可以靠AI圖像處理來補。在1個turing frame下,除去傳統的靠cuda core去做的shading(黃色部分),還有tensor core去做ai圖像處理的部分,這部分算力呢,可是整整10倍於整個 1080ti的性能。靠這個技巧,可以大大縮短shading的時間。

這就好比是,都是讓你在1小時做數學題,老帕(1080ti)10分鐘可以從頭到尾做一道,因為他不太會估算,一小時勤勤懇懇做6道。小圖(2080ti)帶了個神算子幫手,這幫手可厲害了,會猜答案。小圖雖然光靠自己要8分鐘做道題(對應11tflops到14t的提升),但他其實根本不用把題做完,每個題花3分鐘寫個大框架,剩下的靠這幫手猜答案,秒秒鐘猜準,猜的答案也能在老師那裡得分(AI插幀和補強分辨率的結果人眼難以分辨),這一小時可就能答20道題了。

那到底具體的對比是什麼樣呢?

英偉達nVidia RTX2080(Ti)顯卡發佈,價格和性能都遠超GTX1080

結果就是,即使拋開Raytracing的部分,靠著ai增強的shading 過程,花在shading上的時間(橫條最左邊的深綠色部分)也遠遠短於帕斯卡架構,這可不止快30%這麼簡單。

這還不算完。當前的4K大作,特效全開的時候,除了AO耗機能(這個不比了,比就是欺負人),抗鋸齒,還有動態模糊這倆也是一開就狂掉幀數的兩個大頭。現在有了tensor core,抗鋸齒和動態模糊統統交給他做,效果真是又快又好

英偉達nVidia RTX2080(Ti)顯卡發佈,價格和性能都遠超GTX1080

所以僅僅在傳統shading和後處理方面,就已經到這種程度了。隨著技術在新遊戲上的逐漸普及,渲染管線的顛覆會越發的證明,所謂2080ti的78T RTX-OPS,相較於1080ti 6倍的提升,絕非誇大。

另外質疑遊戲廠商沒辦法快速跟進的和覺得這代rtx只是過渡的,看看之前星戰demo用啥做的?

知不知道 UE4 RTRT engine和 DirectX Raytracing都已經準備好了?虛幻4開發的遊戲用上20系的新特性不要太簡單。等著9月20號之後開啟新視界吧

2080ti相對1080ti在CUDA單元和顯存帶寬上的升級夠的上一次合格的換代,2080和2070就比較尷尬,常規單元增加少,頻率還沒什麼提高,估計用在現在的遊戲上都比1080ti要差。

RTX是大家關注的重點也是NV宣傳的重點,我個人的想法是等等看,一是看看RT Core能不能被DXR用上,RTX畢竟是獨家技術,以後的遊戲還是會DXR為主;二是看DXR性能相比於沒有RT Core的舊卡提升了多少,DXR是所有DX12顯卡都支持的技術,如果新卡相對於舊卡有提升能不能做到6倍提升;三是看新卡究竟在支持光追的新遊戲中能有什麼樣的實際表現,假設原來的老卡跑這些新遊戲能跑三幀,那你新卡即便提升6倍也只有18幀,那還是沒辦法玩,新卡起碼要做到4K 30幀的穩定輸出才能及格,如果FPS遊戲那起碼要50幀左右才可以;第四就是有多少遊戲會支持的問題了,我看了其他答案有提到,從2060開始就沒有RT Core了,如果消息屬實那就說明NV自己都沒有能力和決心推廣自己的RTX技術,那麼其他的廠家怎麼會支持呢,畢竟用主流卡的用戶不能丟,增加光線追蹤就要額外增加開支,這些錢能不能賺回來很難說。

我覺得,如果你只盯著光線追蹤看那你就掉入了廠家的概念營銷陷阱,對畫質提升最大的其實是分辨率,如果你有注意到最近發佈的所有光線追蹤演示,除了那些抽象的黑白的純原理演示外,其他演示都有著令人驚歎的清晰度,畫面既銳利又柔和,邊緣沒有一絲絲的毛刺,這完全是通過高分辨率超取樣得來的,憑我的經驗8K的原始分辨率也做不到這樣的效果,可是我們能買到的所有顯卡在跑4K的時候還稍顯吃力,怎麼能負擔得起更高分辨率的超取樣呢?

1、加~的價格並沒有開國行發佈會,僅僅是根據早期產品價格的猜測,2080Ti和2080不排除有更低的價格;

2、根據1080的經驗,早期普通非公版的價格會在非公底價和FE定價之間浮動,所以現在的8699和6299可能也只是非公底價和FE定價之間的一個數,不排除有更低的價格;

3、Mid 2017之前,顯卡發展對消費者很友好,2016年1070發佈底價不到3000RMB,2017年1080Ti發佈時1080還降到了3999元,但Late 2017老黃宣佈顯卡漲價,加上礦,1070Ti的價格就不那麼香了(雖然符合定位,雖然比Vega56香,但它的發佈已經在1070之後一年半了,只能勉強說中規中矩);

4、RTX 2070的非公底價(美元)=2017年降價後的1080,RTX 2080的非公底價(美元)=2017年的1080Ti,RTX 2080Ti已經是泰坦級定價;

5、普通CUDA Core部分的單精度標稱性能,2080和2070強於同後綴的上代產品,略弱於同價格的上代產品,但實際性能可能更強(可能被打臉,等評測),2080Ti強無敵,因為新架構也許有加成,當年980的單精度也低於780Ti但實際更強;

6、即使有新架構加成,在舊遊戲裡,2080和2070對比同價格上代產品也是隻擠牙膏式的提升,當然TDP會小一些,新裝機用戶自然買新不買舊,2080Ti強無敵;

7、目測媒體評測會拿2080對比1080、2070對比1070說事,但請注意至少在2018年下半年,這樣對比是不對的,2080是1080Ti的價格,2070是1080的價格(2080Ti強無敵,對比誰都一樣);

8、如果老黃把RTX下放到2060及以下,N卡內部會出現新舊交替的內戰,類似DX10和DX11的普及期,不知2060會是8600那樣的坑爹卡(空有新技術,基礎性能不如上代同價產品),還是460那樣的神卡(新技術完美下放,曲面細分真好擼)呢;

9、新技術代表更美好的未來,但未來是否屬於RTX,仍需時間檢驗;

10、顯卡預算4000以上且國行RMB價格不坑的情況下,買新不買舊;

11、顯卡預算4000以下,等2060出來後,看RTX戰未來的可能性以及自己的遊戲需求量力而行。


分享到:


相關文章: