AMD 新舊 800SP 顯卡對決,新中階 v.s 舊旗艦怎麼選?

魯蛇實驗室

電腦零組件中,顯示卡應該是推陳出新最快的產品,雖說是進步快,就會發生今天是卡王,不到2年卻被中階卡超車的現象。而顯示卡是可以依照技術規格,大略判斷效能好壞的一類產品,假設今天有張舊卡王,跟一張新生代的中階卡進行對決,它們都一樣是800個SP(Stream Processor串流處理器)的規格,那最後誰會勝出呢?

快速目錄:

規格都是800SP

很幸運地,自從AMD推出Radeon HD 6790之後,因為跟舊卡王Radeon HD 4890的規格非常類似,同樣都具備800個SP與GDDR5 256bit記憶體介面。讓我們有機會來進行驗證,看看除了規格以外,顯示卡新舊架構的差異,最後會不會對效能帶來影響。

無獨有偶地,中階卡Radeon HD 6770(也就是HD 5770)也是擁有800個SP,只是記憶體介面從256bit減半至128bit,讓實際頻寬大縮水,也藉此造成高一階型號Radeon HD 6790之間的效能差異。如果核心規模相同,但記憶體頻寬減半會帶來什麼影響,我們也可以一併了解。

看規格也看架構

自ATI在2007年5月推出Radeon HD 2900 XT之後,其中的R600繪圖核心晶片,便是一個跨時代新架構的設計。R600繪圖核心的最主要特色,就是採用Unified Shader架構,並把其中的運算單元稱為SP,這個運算單元可以同時執行以往vertex shader與pixel shader所負責的工作。雖然R600繪圖核心的評價不是很高,但是它在架構上的創舉卻是影響深遠,後來AMD繪圖卡的RV670、RV770、甚至到最新的Barts繪圖核心,主要架構仍然跟老祖宗R600一脈相承。

雖然這些晶片的架構大略相同,不過隨著時間經過、與研發精力的付出,除了電晶體數量繼續往上堆積以外,靠著不間斷的改良,電路設計也會隨之成熟,理論上在相同資源或規格之下,效能會有更好的表現。例如Radeon HD 3870的RV670晶片,在維持R600晶片320SP規格的前提下,只靠著製程從80nm升級至55nm,再精簡一部分的電晶體,成功減少55%的晶片面積,同時大幅降低實際功耗,就是一個很有名的例子。

RV770大反擊

初RV670晶片靠著最佳化,晶片面積大幅縮小所帶來的低成本優勢,成功幫AMD止血之後,已經儲備下一階段的反擊能量。下一代RV770更將「架構最佳化」發揮淋漓盡致,同樣是55nm半導體製程之下,RV770的電晶體數量是9.56億,只比RV670的6.66億多出43.5%,但是RV770卻成功塞進800個SP,數量規模正好是RV670的2.5倍。這麼一來,不論是用晶片設計效率的「C/P值」,或是純粹效能高低的眼光來看,都可以預見RV770在市場上戰鬥力的暴漲。

RV770晶片共推出Radeon HD 4850與HD 4870等2款產品,應該很多人都印象深刻,上市當天就給對手NVIDIA帶來巨大壓力,迫使NVIDIA大幅調降所有在AMD「射程範圍內」產品的價格。甚至出現GeForce 9800 GTX從9,000元,一次跳水至6,000元以下,「一夕暴跌」的激烈式降價,這種激烈的市場波動,確實是歷史少見。

大翻身並非火星科技

從Radeon HD 2900 XT人人失望的產品開始,直到Radeon HD 4870奇蹟問世,其中只間隔2個世代而已。短短這段時間能有這麼戲劇性的翻身,不少人都笑稱只是AMD比較幸運,突然得到外星科技而已。另一派較有技術根據的言論認為,自從AMD收購ATI之後,2間公司已經合為一體,當初負責設計處理器的那些研發人員,早就被x86架構「荼毒磨練」許久,功力已跟ATI公司的凡人不同。如果請他們來幫忙把繪圖晶片最佳化,相信對這些人只是小菜一碟,最終幫忙設計出效率極高的繪圖晶片,應該是很自然的一件事。

AMD Radeon HD 4890、6790規格對照表
產品型號 Radeon HD 4890 Radeon HD 6790
核心代號 RV790 Barts
核心製程 55nm 40nm
運算單元 800SP 800SP
核心時脈 850MHz 840MHz
記憶體種類 GDDR5 GDDR5
記憶體時脈 3.9GHz 4.2GHz
記憶體容量 1GB 256bit 1GB 256bit
ROP 16個 16個
Texture Unit 40個 40個
支援API DirectX 10.1 DirectX 11
發表日期 2009年4月2日 2011年4月5日
上市價格 約新台幣9,500元 約新台幣4,800元
目前價格 約新台幣3,000元(中古) 約新台幣4,200元(新品)
上市定位 旗艦級 主流級
這2張顯卡的主要規格都非常相近,運算核心的規模完全一樣,只差在時脈而已。至於新舊架構之間是否有效能差異,值得我們去驗證。

(後面還有:一代經典RV790)

延伸閱讀:

【好康特輯】開學季前緊急備戰,AMD中階顯卡3DMark 11第一擊全面啟動!

Asus EAH4890 Formula — 顯示卡也吹F1風

NVIDIA GTX 680 實測:GPU 開 Turbo、對決 AMD 卡王

AMD Radeon HD 7700 Series,直搗5K價位帶,免超就是1GHz

新卡王 Radeon HD 7970 實測:效能強大,驅動有待完善

傳 AMD 將於12月5日發表新 GPU:Radeon HD 7000


一代經典RV790

Radeon HD 4890是本文主角之一,它所採用的RV790繪圖晶片,其實是RV770的改良版。這2顆繪圖晶片都是同一時期的產物,半導體製程也同樣是55nm,畢竟當時RV770繪圖核心的架構已經夠完美,故新晶片能改善的地方並不多。事實上,RV790的晶片設計跟RV770幾乎相同,可以說完全沿用RV770的架構與電路,只是在晶片的最外層,另加一圈去耦合電容(decoupling capacitors),用意是過濾雜訊,並改善晶片的電氣特性。

相較於RV770的狀況,現在RV790加了這圈去耦合電容,只多付出0.03億顆電晶體的代價,卻帶來時脈大幅提昇,以及閒置功耗大幅下降的優點。只加這麼少的電晶體,卻能得到這麼多的效益,讓RV790比RV770還要更接近完美,要說是一代經典也不為過。

核心晶片比一比

Radeon HD 4890


▲HD 4890採用RV790繪圖核心,內建800個SP、40組texture unit與16組ROP,晶片設計上基於RV770核心,並在晶片外圍加了一圈去耦合電容(decap),改善電氣特性並易於提高時脈。內建9.56億顆電晶體,55nm半導體製程,晶片面積為282平方公釐。

Radeon HD 6790


▲HD 6790採用Barts繪圖核心,原先內建1120SP繪圖單元,以及56組texture unit組32個ROP。事後再遮蔽部分電晶體,讓規格縮減成800SP、40組texture unit與16組ROP,以符合HD 6790的規格。內建17億顆電晶體,40nm半導體製程,晶片面積為255平方公釐。

顯示記憶體比一比

Radeon HD 4890


▲HD 4890採用Qimonda 1DGV1G-05A1F1C-40X GDDR5記憶體,記憶體出廠標準時脈為4.0GHz,但在HD 4890顯卡上只以3.9GHz運行。單顆容量1Gb(128MB),共8顆組成1GB 256bit的規格。

Radeon HD 6790


▲HD 6790採用Elpida W1032BABG-50-F記憶體,記憶體出廠標準時脈為5.0GHz,但在HD 6790顯卡上只以4.2GHz運行,提昇穩定性與超頻空間。單顆容量1Gb(128MB),共8顆組成1GB 256bit的規格。

(後面還有:最新科技Barts核心)

最新科技Barts核心

Barts是AMD顯卡最新的中高階繪圖核心,它原生的規格是1120個SP主要被用在Radeon HD 6850與HD 6870顯示卡當中。在晶片設計上的方針,它仍然延續以高效率為主的設計目標,不做無謂的衝高效能,而是先研究該走的市場高低定位,再設定晶片該有的規模大小,最後再針對這個範圍再去做最佳化。

俗話說電腦買新不買舊,Barts繪圖核心是目前AMD的最新產品,理論上應該要具備最新技術,也要迎合當下最新潮流的發展,且擁有是最佳化的晶片設計,效能跟效率表現都要比以往出色才行。

Barts是一顆不錯的繪圖核心,為了因應市場需要,AMD決定藉由事後遮蔽功能的方式,刪減Barts的部分規格,推出再低一階的Radeon HD 6790顯示卡。如果細看它的規格,像是800個SP、40組texture unit與16組ROP、以及GDDR5 256bit 1GB等等,都跟老卡王Radeon HD 4890極為雷同,確實可以一戰。

HD 6770也亂入

原本我們是設定Radeon HD 4890老卡王,單獨對決Radeon HD 6790新秀的戰爭。不過次一階Radeon HD 6770,也就是上一代的HD 5770則使用Juniper繪圖核心,核心規格是800個SP、40組texture unit與16組ROP的晶片,只是記憶體最多僅支援到GDDR5 128bit,比Radeon HD 6790的GDDR5 256bit少了一半。如果再加入Radeon HD 6770同頻率的效能測試,就能讓我們同時了解,在運算核心規模完全相同,但是記憶體頻寬減半的時候,會對效能帶來多少影響。

DX9平分秋色

我們首先將3張顯示卡的核心時脈都固定在850MHz,記憶體時脈固定在3.9GHz。畢竟它們核心的主要規格都相同,這樣一來,差異只剩下核心架構的新舊。如果再把記憶體運作時脈統一,HD 4890與HD 6790的理論記憶體頻寬也會相同,而HD 6770正巧是它們的一半,可以驗證記憶體頻寬減半的效能影響。

Radeon HD 4890是當時的最高階產品,通常卡王給人的印象,就是在面對各種高負荷環境時,都能夠從容應付。在DirectX 9的4項遊戲測試中,The last Last rRemnant與Street Fighter 4於低解析度低特效負載時,新卡HD 6790跑得比舊卡HD 4890還要快,但是到了高解析度與高特效時,HD 4890就會轉而勝出,符合這個傳統印象。

除此之外,HD 4890還在Lost Planet 2的4種設定當中全面勝出,因為這4種全部都是特效最高的設定,如果HD 4890真能夠在高負荷環境下全面發揮,在這裡全面勝出,並不是一件很令人意外的事。最後一項FF XIV測試,雖然只提供Low與High等2種特效選項,但HD 6790反而都贏過HD 4890,而且HD 6770的成績也沒有明顯落後,可以推測它比較不在意顯卡記憶體的頻寬大小。平均下來HD 4890與HD 6790都各有勝負,雙方是平分秋色的情況。

Heaven見勝負

DirectX 10遊戲的4項測試,除了Unigen Heaven以外,其他3項都讓HD 4890與HD 6790戰成平手,不論是特效與解析度高低的設定,幾乎都在測試的誤差範圍之內。不過Unigen Heaven卻讓這回合明顯分出勝負,HD 6790終於甩開HD 4890的糾纏,成為3張顯卡之中最快的1張。另外值得注意的是,Unigen Heaven隨著解析度與反鋸齒程度的提高,HD 6770的落後幅度反而跟著縮小,有點跟普遍觀念「記憶體頻寬越大,反鋸齒效能越高」互相背離,值得玩味。

效能實測:DirectX 9遊戲

在The Last Remnant與Street Fighter 4遊戲當中,如果是低負載低解析度的設定,新卡HD 6790會贏過老卡王HD 4890。直到高解析度高負載的設定,HD 4890才贏過HD 6790。其他2項遊戲測試,則是2張卡各贏一場,基本上是平分秋色的狀態。


效能實測:DirectX 10遊戲

HD 6790終於在Unigen Heaven拉開跟HD 4890的領先差距,World in Conflict在特效拉高後,HD 4890會優於HD 6790,但是在S.T.A.L.K.E.R.遊戲裡卻產生相反結果,兩張卡的效能,仍是在同一水準內。唯獨HD 6770的記憶體頻寬只有128bit,讓效能明顯落後。


(後面還有:HD 6770最省電)

HD 6770最省電

平平都是800個SP的這3張顯示卡,經過測試後我們已經知道誰跑最快,那它們的耗電量是否有差異呢?先從規格看起,HD 4890採用的RV790是原生800SP,55nm舊製程的繪圖晶片。而HD 6770搭配的Juniper繪圖核心,技術規格與RV790類似,都是800SP再加40組texture unit與16組ROP的設計,只是內建記憶體控制器從256bit縮減至128bit。Juniper採用較新的40nm製程,靠著晶片面積縮小的優勢,功耗當然也比RV790還要少。

▲HD 4890與HD 6790的功耗都不低,同樣需要2組6pin電源插座。

雖然Barts繪圖核心跟Juniper同樣是40nm製程,不過繪圖單元卻擴充到1120SP個,算是規模比較大的晶片。即使Radeon HD 6790被削減SP只有800個的版本,但這些事後被遮蔽的電晶體,實際上並不會消失,還是會對發熱量造成影響。

顯示卡在低負載環境下的測試,筆者是使用FF XIV,中負載則是搭配Biohazard 5,高負載環境自然就是Furmark了。就實測結果而言,HD 6770果然是最省電的一張卡,HD 6790在閒置時的功耗表現跟它一樣好,但是滿載時的功耗卻稍微高了一點。令人不意外的,HD 4890成為這3張卡當中最耗電的型號,表示半導體製程的先進與否,對電力效率會有最直接的影響。

耗電特性實測

HD 4890是採用55nm較舊製程的老卡,高耗電不令人意外。雖然HD 6770與HD 6790都是採用40nm製程,不過HD 6790是沿用HD 6870高階卡的大型晶片,只是把其中一部分電晶體遮蔽而成。HD 6770則是一顆功能完整,但是規模較小的晶片,功耗會比較低。

測試平台配備
處理器 Intel Core i3-2105
主機板 技嘉GA-H61M-USB3-B3
記憶體 Elixir DDR3-1600 2GBx2
顯示卡 MSI AX4890 1GBD5-HM
ATI Radeon HD 6770
MSI R6790-2PM2D1GD5
硬碟 Seagate Momentus 7200.1 100GB
電源供應器 CoolerMaster GX 450W
作業系統 Windows 7 Ultimate x64
顯示驅動程式 Catalyst 11.8

新舊架構效能差距小

經過以上的測試結果,我們已經可以得到明確結論,目前AMD顯卡中,800個SP的新卡效能仍然跟800個SP的舊卡平分秋色,表示隨著時間與技術演進,新卡除了加入DirectX 11等新技術以外,在核心效率上仍然跟舊卡相同,只有在耗電量有些差距,但是影響耗電量的關鍵大半是核心製程。從單一SP的效率來看,新舊架構的差距並不明顯,新卡的核心單元使用效率並沒有比較高。

這意味著在現有AMD顯示卡的架構下,我們幾乎可以從SP運算單元的數量,以及記憶體種類與介面,就能大略判斷它的效能高低。日後AMD如果要提高產品效能,選擇繼續堆積更多的SP運算單元,應該是最直接,也是最主要的一條路。當然也希望除了規格提昇升之外,在功能面上也能帶給消費者新的驚喜。

原文網址:https://t17.techbang.com/topics/13066-new-amd-old-800sp-video-vs-old-and-new-order-vs-flagship-you-choose?page=1