詳解顯卡全參數

作者本想親自寫介紹關於顯卡參數的文章,奈何精力有限。

手把手教你識別顯卡主要性能參數

初識顯卡的玩家朋友估計在選購顯卡的時候對顯卡的各項性能參數有點摸不著頭腦,不知道誰對顯卡的性能影響最大、哪些參數並非越大越好以及同是等價位的顯卡但在某些單項上A卡或者是N卡其中的一家要比對手強悍等等。這些問題想必是每個剛剛接觸顯卡的朋友所最想了解的信息,可以說不少賣場的銷售員也正是利用這些用戶對顯卡基本性能參數的不瞭解來欺騙和矇蔽消費者。今天顯卡帝就來為入門級的顯卡用戶來詳細解讀顯卡的主要性能參數的意義。

關於顯卡的性能參數,有許多硬件檢測軟件可以對顯卡的硬件信息進行詳細的檢測,比如:Everest,GPU-Z,GPU-Shark等。這裡我們以玩家最常用的GPU-Z軟件來作為本文解析顯卡性能參數的示例軟件。


詳解顯卡全參數


GTX590的GPU-Z截圖

首先我們對GPU-Z這款軟件的界面進行一個大致分區的解讀,從上至下共8個分區,其中每個分區的具體含義是:

①.顯卡名稱部分:

名稱/Name:此處顯示的是顯卡的名稱,也就是顯卡型號。

②.顯示芯片型號部分:

核心代號/GPU:此處顯示GPU芯片的代號,如上圖所示的:GF110、Antilles等。

修訂版本/Revision:此處顯示GPU芯片的步進制程編號。

製造工藝/Technology:此處顯示GPU芯片的製程工藝,如55nm、40nm等。

核心面積/Die Size: 此處顯示GPU芯片的核心尺寸。

③.顯卡的硬件信息部分:

BIOS版本/BIOS Version:此處顯示顯卡BIOS的版本號。

設備ID/Device ID:此處顯示設備的ID碼。

製造廠商/Subvendor:此處顯示該顯卡OEM製造廠商的名稱。

④.顯示芯片參數部分:

光柵操作單元/ROPs:此處顯示GPU擁有的ROP光柵操作處理單元的數量。

總線接口/Bus Interface:此處顯示顯卡和主板北橋芯片之間的總線接口類型以及接口速度。

著色單元/Shaders:此處顯示GPU擁有的著色器的數量。

DirectX版本/DirectX Support:此處顯示GPU所支持的DirectX版本。

像素填充率/Pixel Fillrate:此處顯示GPU的像素填充率。

紋理填充率/Texture Fillrate:此處顯示GPU的紋理填充率。

⑤.顯存信息部分:

顯存類型/Memory Type:此處顯示顯卡所採用的顯存類型,如:GDDR3、GDDR5等。

顯存位寬/Bus Width:此處顯示GPU與顯存之間連接的帶寬。

顯存容量/Memory Size:此處顯示顯卡板載的物理顯存容量。

顯存帶寬/Bandwidth:此處顯示GPU-Z與顯存之間的數據傳輸速度。

⑥.驅動部分:

驅動程序版本/Driver Version:此處為系統內當前使用的顯卡驅動的版本號。

⑦.顯卡頻率部分:

核心頻率/GPU Clock:顯示GPU當前的運行頻率。

內存/Memory:顯示顯存當前的運行頻率。

Shader/Shader:顯示著色單元當前的運行頻率。

默認核心頻率/Default Clock:顯示GPU默認的運行頻率。

(默認)內存/Memory:顯示顯存默認的運行頻率。

(默認)Shader/Shader:顯示著色單元默認的運行頻率。

⑧交火和運算能力部分:

NVIDIA SLI或ATI Crossfire:顯示是否開啟SLI或者Crossfire多顯卡交火。

運算能力:顯示是否具備OpenCL、CUDA、PhysX和DirectCompute 5.0運算能力。

下面我們就重點為大將對顯卡的性能參數做一個詳盡的講解,最後終結出哪些性能參數最能影響的顯卡性能,以及我們消費者在實際購買顯卡時應該從哪方面去思考,以及怎麼依靠顯卡性能參數來對顯卡進行大致的判斷和比較。我們希望菜鳥讀完本文能夠對顯卡有個大致的“輪廓”,老鳥讀完本文能夠對顯卡的核心性能參數有個更深入的認識。

詳解顯卡全參數

顯卡名稱、芯片型號以及硬件信息

顯卡名稱、芯片型號以及硬件信息

消費者在購買顯卡的時候首先應該明確的就是我該購買的顯卡的型號(名稱)是什麼,也就是GPU-Z中的Name所示的參數信息,例如本例中的“GTX590”。


詳解顯卡全參數


顯卡GPU-Z截圖中關於顯卡名稱、芯片型號和硬件信息的部分

而通過顯卡芯片型號的解讀,我們又可以對顯卡核心GPU的信息作進一步的瞭解。從GPU這一項我們能夠得知顯卡核心的GPU研發代號。GPU的代號一般來說往往是與顯卡型號名稱相對應,舉例來說:

GF110 對應: NVIDIA GeForce GTX590

GF100 對應: NVIDIA GeForce GTX480

Antilles 對應:Radeon HD 6990

RV870 對應:Radeon HD 5970

當然也有一個GPU代號對應多個顯卡型號名稱的,而這些往往是JS忽悠小白的地方。例如:

基於GF104核心的顯卡同時有NVIDIA GeForce GTX 460 (768MB)、NVIDIA GeForce GTX 460 (1024MB)和NVIDIA GeForce GTX 460SE共三款產品,如果消費者對這些顯卡不大熟悉的話,很容量被商家所誤導而購買被“換型”的顯卡產品。


詳解顯卡全參數


同型號的三款GTX460的不同區別

從上面的對比圖中我們可以很清楚的看到768MB和1024MB版的GTX460主要在顯存容量和顯存帶寬上有很大區別,而GTX460SE的區別主要在於CUDA處理器縮減至了288個。

有同一GPU代號對應多款顯卡型號,自然也有同個顯卡型號對應多個GPU代號,例如:Radeon HD5670。


詳解顯卡全參數


HD5670的兩種版本

從上圖我們可以看到兩者的區別主要在於核心GPU、流處理器數量以及核心面積,雖然同為HD5670,但是640SP的HD5670性能已經幾乎接近HD5750的程度。

通過上面的總結得知,我們玩家在選購顯卡的時候一定要弄明白自己所要購買的顯卡型號和顯卡GPU核心代號具體是什麼,購買的時候最好當場對顯卡進行簡單的上機測試,用GPU-Z等相關測試軟件看下顯卡的硬件信息是否有異常情況,這樣玩家就可以儘可能的降低上當受騙的幾率。

詳解顯卡全參數

顯卡芯片參數解析:悟透ROPs

顯卡芯片參數解析:悟透ROPs

這一部分是我們所要重點解讀的內容,因為不少初玩顯卡的朋友或者老玩家對這些性能參數的都不是特別清晰,下面就讓我們來一起進行詳盡的解讀。


詳解顯卡全參數


顯卡芯片參數部分

首先一個重要的概念就是ROPs(Raster Operations Units),即光柵化處理單元,表示顯示GPU擁有的ROP光柵操作處理單元的數量。通常來說:3D圖形處理可以分成四個主要步驟,幾何處理、設置、紋理和光柵處理,而ROPs就是處理光柵單元。那麼光柵化處理單元的多少對顯卡性能有哪些影響了?


詳解顯卡全參數


ROPs架構圖

ROPs(光柵化處理單元)主要負責遊戲中的光線和反射運算,兼顧AA、高分辨率、煙霧、火焰等效果。遊戲裡的AA(抗鋸齒)和光影效果越厲害,對ROPs(光柵化處理單元)的性能要求也就越高,否則就可能導致遊戲幀數急劇下降.比如同樣是某個遊戲的最高畫質效果,8個光柵單元的顯卡可能只能跑25幀.而16個光柵單元的顯卡則可以穩定在35幀以上。舉一個例子:GTX550Ti和HD6790前者是24個ROPs單元,後者是16個ROPs單元,雖然在大部分測試項目中,HD6790都是領先GTX550Ti的,但是在高AA(抗鋸齒)負載的情況下,HD6790的弱點即刻暴露出來,16個ROPs單元顯得有點力不從心。從FarCry 2中也印證出了這一點:遊戲中4xAA設置下HD 6790的落後幅度為4%左右,而開啟8xAA後性能落後幅度則擴大至15-17%之多。(關於GTX550Ti和HD6790的ROPs數目,詳見於此)

需要注意的是,AMD顯卡和NVIDIA顯卡在ROPs的設計上是有區別的,N卡的ROPs單元和流處理器是“捆綁”的,即置於SIMD之內,所以倘若消減N卡的流處理數量,其ROPs單元也隨之消減;而A卡則不一樣,其ROPs單元和流處理器單元是沒有關聯的。


詳解顯卡全參數


傳統管線架構

第二個重要的概念:Shaders。傳統管線架構:以往顯卡由頂點渲染管線和像素渲染管線組成,生成圖像的過程都是先由頂點渲染管線中的Vertex Shader(頂點著色器)生成基礎的幾何圖形骨架(由三角形構成),然後再由像素渲染管線中的Pixel Shader(像素著色器)進行填色,最後才是像素渲染管線中的紋理單元進行貼圖。而

當新的統一渲染架構提出之後,頂點著色器和像素著色器被合二為一,成為流處理器(Shaders),它將同時負責頂點著色和像素著色,避免了負載不均衡的情況發生。最先提出統一渲染架構的是微軟的DirectX 10。


詳解顯卡全參數


步入DX10時代,shader單元數量成為衡量顯卡級別的重要參數之一

需要說明的是,N卡和A卡的所採取的核心架構是不一樣的,N卡採用的是MIMD架構。多指令流多數據流(MultipleInstructionStreamMultipleDataStream,簡稱MIMD),它使用多個控制器來異步地控制多個處理器,從而實現空間上的並行性,所以N卡是一個發射器;A卡採用的是SIMD架構設計,即Single Instruction Multiple Data(單指令流多數據流),A卡是將4個簡單指令+1個複雜指令打包,再用一個發射器發出。所以A/N兩者不能進行流處理器數量的簡單對比。

最後我們要解析的是像素填充率(Pixel Fillrate)和紋理填充率(Texture Fillrate)。

像素填充率是指圖形處理單元在每秒內所渲染的像素數量,單位是GPixel/S(每秒十億紋理)

像素填充率=核心頻率×光柵單元數目/1000

紋理填充速率是指在多邊形每個面上填充的顏色的紋理,單位是GPixel/S(每秒十億像素)

紋理填充率=核心頻率×紋理單元數目/1000

這兩個參數的值在GPU-Z中自然是越大則越能表明顯卡所能處理的能力越強悍。並且核心頻率是像素填充率(Pixel Fillrate)和紋理填充率(Texture Fillrate)的計算因數,顯然顯卡核心頻率越高,這兩個值越大。而其中的光柵單元數目即ROPs的值,ROPs的值越大,像素填充率也就越大。

顯存參數別忘了“位寬兄弟”

顯存的作用,說通俗點,其實和我們機器內部所使用的內存的作用是幾乎相同的。賣場裡的銷售人員也經常對顯存這個“賣點”來進行相關“炒作”,當然不少“小白”也因此上當受騙。下面顯卡帝就來為初級玩家進行相關解析。


詳解顯卡全參數


GPU-Z截圖關於顯存的部分

Memory Type(顯存類型),現如今,最新的主流高端級顯卡都採用的是GDDR5的顯存顆粒,之前主流的GDDR3顯存顆粒也正式退役至二線,而GDDR4顯存顆粒僅僅是個過渡型產品,市售的顯卡所見不多。GDDR5相對於GDDR3的核心優勢在於顯存帶寬大幅度提升

顯存帶寬(Bandwidth)=(顯存位寬 ×顯存工作頻率)/ 8

從上面的計算公司我們可以清楚的看到,由於GDDR5顯存顆粒具備兩條數據總線,所以雖然採用的是和GDDR3同樣的8位預取機制,但顯存的工作頻率可以到達GDDR3的兩倍。最為典型的一個例子就是:採用GDDR5顯存的GT240顯卡要比採用GDDR3顯存的GT240顯卡性能領先16%左右,所以憑藉強大的帶寬優勢,GDDR5在同位寬的情況下可以全面超越GDDR3。

Bus Width(位寬)往往是玩家最容易忽視的一個概念。顯存位寬是顯存在一個時鐘週期內所能傳送數據的位數,位數越大則瞬間所能傳輸的數據量越大。可以說顯存位寬對顯卡性能的影響相比顯存容量而言要大不少。


詳解顯卡全參數


顯卡對陣圖

顯卡顯存位寬的權重到底有多大了,我們從上面這張顯卡對陣圖中來一起找找答案。從大部分媒體的測試結果來分析,我們給上述顯卡在性能上進行一個簡單的排序。

HD6850 > HD6790 > GTX550Ti > HD5770

我們重點關注下HD6790和GTX550Ti這兩款顯卡,雖然說GTX550Ti在核心頻率和ROPs數量上均高於HD6790,但是在大部分的測試項目中為何又敗下陣來了?首先HD6790採用的HD6850的縮減核心架構這一點自然不用說,其二就在顯存位寬上,GTX550Ti僅為192Bit位的顯存位寬,所以顯存帶寬的處理能力僅為98.4GB/S,而HD6790則採用的是256Bit的顯存位寬,顯存帶寬處理能力達到了134.4GB/S,相比GTX550Ti提升36.58%。而為什麼GTX550Ti相比HD5770來說,又能夠將HD5770全面壓制了,其實道理也是一樣的。從顯存帶寬(Bandwidth)=(顯存位寬 ×顯存工作頻率)/ 8 這個公式我們也可以看到當都採用GDDR5顯存顆粒的時候,顯存位寬就成為了影響性能的關鍵瓶頸

最後我們需要提醒玩家注意的是顯存容量(Memory Size)這個最經典的“騙局”,就是利用A卡的Hyper Memory(HM)或N卡的Turbo Cache(TC)的動態共享系統內存技術來謊稱顯卡的顯存容量,想必這樣的招數在進過前些年的“洗禮”之後,現在的不少消費者也逐漸對這樣的雕蟲小技都能夠很快的精準識別。

顯卡頻率:核心頻率>顯存頻率

顯卡的頻率,我們主要關注的是核心頻率和顯存頻率。兩者相比較而言,核心頻率對顯卡性能的影響權重較大。所以我們玩家在超頻的時候先提升的核心頻率,再才是顯存頻率。為什麼說核心頻率的重要性更大一些了?打個比方,

核心頻率就相當於個人自身能力,而顯存頻率好比外在條件,而一個人的成功往往取決於個人能力而外在條件僅在一定程度上對其有影響,簡而言之:一個是內因而另一個是外因


詳解顯卡全參數


GPU-Z中關於顯卡頻率部分的截圖

需要說明的是由於核心架構的設計不同,N卡的GPU核心頻率和Shader頻率呈現2倍的關係,而A卡的GPU核心頻率和Shader頻率是一致的。

顯存頻率是指默認情況下,該顯存在顯卡上工作時的頻率,以MHz(兆赫茲)為單位。


詳解顯卡全參數


GDDR5顯存顆粒

關於GDDR5顯存頻率,由於以往GDDR1/2/3/4和DDR1/2/3的數據總線都是採用的DDR技術(通過差分時鐘在上升沿和下降沿各傳輸一次數據),官方標稱的頻率X2就是數據傳輸率,也就是通常我們所說的等效頻率。

而GDDR5則不同,它有兩條數據總線,相當於Rambus的QDR技術,所以官方標稱頻率X4才是數據傳輸率。比如GTX590官方顯存頻率是854MHz,而大家習慣稱之為3416MHz。

現在我們已經知道了顯卡頻率的對顯卡性能的影響,有個問題我們需要提出來討論一下:顯卡頻率是不是越高越好?

從旗艦顯卡的頻率設定來看,它們的核心頻率設定都不是特別高,而且前段時間也爆出:AMD對HD6990因超頻而致使顯卡損壞的顯卡用戶不予質保,同時也有國外媒體在測試GTX590顯卡的時候所出現的“燒燬”顯卡的現象。由此可見,高頻設定的高端顯卡由於GPU核心溫度的極高無比而致使顯卡燒燬這樣的一種玩卡方式確實有些不大妥當。畢竟玩家還是自己的顯卡能夠穩定運行。當然,在中端顯卡上我們也可以看到風冷情況下高頻設定的顯卡,例如新近推出的GTX550Ti,1G核心頻率設定的顯卡產品也有一些。高頻顯卡的意義何在,從另一個角度去分析:不妨作為一種檢測顯卡品質的方法,因為能夠在高頻下運行的顯卡需要很好的做工和強勁的顯卡散熱器做支持。其實我們玩家在大部分情況下應用的也就是顯卡的默認頻率設定,所以高頻設定的顯卡,我們也很擔心其壽命的長短。故而我們並不推薦玩家刻意的追求極致高頻,除非你是一個狂熱的超頻玩家。

驅動、交火和其他運算能力

顯卡的性能的表現在有些程度上與顯卡驅動存在著一定的關係,因為GPU廠商會對顯卡做針對性的優化。所以我們推薦玩家選擇最新版的WHQL版驅動來體驗你的顯卡。


詳解顯卡全參數


驅動、交火和運算能力

SLI和Crossfire技術提供了多卡互聯的技術解決方案。關於什麼樣的顯卡組建多卡互聯繫統會顯得更具性價比了?個人建議採用中斷顯卡組建系統會顯的更划算一些,當然資金充裕的話,採用中高端顯卡來組建多卡互聯繫統也可以,如果採用低端的顯卡來組建交火的話,這樣就不大太划算,因為可能低端顯卡組建的平臺性能優勢才僅僅相當於中端卡的能力,而價格卻已經超過了單塊中端顯卡的價錢。


詳解顯卡全參數


SLI速力技術平臺

詳解顯卡全參數


Crossfire交叉火力技術平臺

最後我們來看看Computing計算能力這一項,OpenCL(全稱Open Computing Language,開放運算語言)、CUDA(通用並行計算架構)、PhysX(物理加速)和DirectCompute 5.0(是一種用於GPU通用計算的應用程序接口)。


詳解顯卡全參數


AMD HD6990的相關截圖

對比A卡,N卡在Computing這項的表現上顯得更加出色,N卡全部支持四項運算能力,而A卡僅支持一項DirectCompute 5.0。倘若玩家對藉助CUDA技術實現高清轉碼或者玩的遊戲需要PhysX物理加速技術的支持,那麼玩家可以考慮購買N卡,因為這些正是N卡所強勢的地方。

總結:“顯卡性能參數排排坐”

進過了前面詳細的介紹與分析,我們對顯卡的主要性能參數有了一個相對全面的認識和了解。玩家在購買顯卡的時候,可能對這麼多性能參數“有點暈”,所以我們有必要對這些顯卡性能參數的權重進行一個高低順序的排序。下面是筆者所總結的一個相對簡潔的顯卡性能排序:

顯卡核心和製程

顯卡核心是關鍵,核心不行其他再好都是浮雲,核心先進那麼顯卡的性能自然會提升一個很大的檔次;製程越先進,顯卡的發熱量和功耗越低。

流處理器和ROPs

流處理器數量上的增加或縮減對顯卡的性能影響可謂是立竿見影,所以GPU廠商也常常利用這一方法來對顯卡產品進行市場細分。ROPs數量的多數影響在遊戲畫面中的AA(抗鋸齒)和光影特效等方面。

核心頻率和顯存頻率

核心頻率影響的是像素填充速率和紋理填充率,而顯存頻率影響的是顯存帶寬,兩者同時都作為影響因子,所以參數值越大,自然顯卡性能越強悍。不過過高的頻率設定對顯卡自身有一定影響,合理的頻率設定是我們所要選擇的顯卡。

像素填充速率和紋理填充率

像素填充率=核心頻率×光柵單元數目/1000

紋理填充率=核心頻率×紋理單元數目/1000

顯存位寬和顯存帶寬

顯存帶寬=工作頻率×顯存位寬/8(顯存帶寬 =顯存位寬×顯存頻率/8/1024)

顯存位寬越大,那麼瞬間所能傳輸的數據量越大。顯存帶寬的作用好比橋樑一樣,為顯示核心和顯存提供了一條交換數據的通道。

顯存大小和其他參數

顯存太小的話會導致在遊戲過程中有幀數不穩定的顯示。

以上排序作為玩家在購買顯卡時分析性價比的幾個方面,當然順序並非完全固定,具體還得需要考慮到玩家自身對顯卡的詳細要求。但是有一點是肯定的,知道這些決定顯卡性能的參數,我們玩家在購買顯卡或與人談論顯卡的時候會顯得更加專業,讓JS從此懼怕小白,這就是為您寫下此文的最終目的。


分享到:


相關文章: