前面我們介紹了Kepler架構解析,大家應該很好奇Kepler實際效能如何。從取得資料至測試之前,對於Kepler的效能預測是功耗減低、效能小幅提升。經過測試之後,前者一如預期,效能部分卻比想像中還要好,不僅勝過HD 7970,更能在部分測試中小勝雙核心的HD 6990,超乎預期水準。
快速瀏覽:
桌上型驅動獨缺XP
在GTX 680解禁之前,全球媒體只有Windows 7 64bit驅動可用,而解禁之後官網立刻放上Windows、Linux等5種作業系統,共計9個版本的驅動程式。相較於先前HD 7970遲遲不來的驅動程式,GTX 680在驅動表現的確如以往的準時。或許有不少人知道,NVIDIA在驅動程式部門配置的人員,比起硬體設計人員還多,因此在驅動程式的時效、最佳化與遊戲支援方面,反應會比AMD還快,但是這次還是有幾個小小的遺憾。
仔細瀏覽支援列表,也意外發現仍桌上型版本仍不支援任何版本的Windows XP。筆電核心則只有提供GT 630M的驅動程式,同時不支援「任何」Windows版本,僅有Linux等5個版本。
雖說Windows XP已經在2010年6月30日停止零售版的銷售,但是Windows XP在家用市場仍有相當的佔有率。不論AMD或NVIDIA都經常性遺忘Windows XP,導致這些玩家可能買了卡也沒最新的驅動可用,相信這不會是個好現象。
▲解禁當天官網就放上數個版本的驅動程式,但是也可看到獨缺Windows XP版本。
測試平台
拼效率:決戰28nm電力效率
前面文章提過,這次Kepler特色之一就是改用28nm製程,而採用新製程的優勢就是耗電量與TDP降低、超頻性增加。在官方文件中,也不只一次提出Kepler在電力效率上的表現。因此我們這次也順便測試Kepler在不同遊戲、API底下的電力效率變化。
電力效率指標
所謂的電力效率,就是單位功耗所得到的效能有多少,簡單來說就是每瓦(W)獲得的幀數。挑選了Street Fighter IV、Biohazard 5與Unigine Heaven 3.0做為測試項目,環境是在1920 x 1080解析度下,並開啟所有特效,得出結果後,將測試的FPS數值除以平台功耗,得到的數值就是電力效率。電力效率越高,代表花費的電力越是用在刀口上,對於追求效能的玩家而言,這數值可能沒有太大的意義,這指標對於環保的意義較大。此外,由於中低階卡功耗相對較低,因此顯卡的等級與效率不見得成正比。
電力效率提升43.1%
Kepler在電力效率方面成長多少?首先來跟Fermi 2.0架構的GTX 580比較。在開啟Tessellation的DirectX 11環境中,可看到GTX 680的電力效率為0.219幀,也就是每瓦(W)的耗電量獲得0.219幀。而Fermi 2.0架構GTX 580,電力效率表現則是0.153幀,兩者差距高達43.1%。架構與製程提升後的效益,在特效要求較高的DirectX 11與Tessellation環境相當明顯。
至於在DirectX 10方面,可看到GTX 680與GTX 580電力效率分別為0.603幀與0.436幀,比起DirectX 11的落差,差距縮小到38.3%。而DirectX 9方面則差距更小,只剩下18.4%。從數值中可看到,電力效率方面Kepler比起Fermi有十分明顯的進步,且特效強度越高差距越明顯,雖然不到官方宣稱的2倍效率,但是我們也測試出43.1%的差距。
效率領先HD 7970
28nm的電力效率領先40nm似乎是理所當然的事,接下來就來比較同為28nm製程的HD 7970跟GTX 680電力效率表現。從數據中,我們可以看到HD 7970在GCN與28nm製程加持下,表現並不差,但是跟GTX 680相比還是有明顯的落差。
在DirectX 9、10與11環境下,GTX 680分別領先HD 7970約7.8%、23.3%與15.9%,差距相當明顯。這也讓先前HD 7970對GTX 580的電力效率優勢蕩然無存,似乎重演了2010年4月Fermi推出時,在Tessellation效能狠狠打了RV 870的情況。
DX 9、10、11電力效率測試
▲從電力效率來看,不論Driect 9、10還是11,GTX 680是目前高階卡當中效率最高的顯卡,同為28nm的HD 7970效率也有不錯的表現。此外,電力效率並不是高階卡的特色,中低階卡的功率低,反而電力效率會更高。
(後面還有:戰效能:單核心硬上雙核心)
延伸閱讀:
新卡王核心 Kepler 解析:28nm 製程加持、2倍電力效率、更快的速度
完全看懂 HD 7970 新架構,GPU 如何跑出更高的效能?
AMD HD 7970 之 GCN 架構完全解析,帶來 GPU 革命
戰效能:單核心硬上雙核心
電力效率再高,遊戲效能不高還是只能吃土。這次編輯部挑選了前後代幾張高階顯卡一同測試,包括GTX 680、GTX 580、HD 7970、HD 6970,還有雙核心的HD 6990。至於NVIDIA最新的雙核心顯卡GTX 590則受限於時間,無法於截稿前借到,因此只能由上述5張卡互相廝殺。
Bindless Textures
Bindless Textures這次Kepler在效能面的技術著墨很多,除了GPU Boost外Bindless Textures也是重點功能。NVIDIA在DirectX 11基礎上進行Texture(紋理、質地)強化,過去的DirectX 11顯卡在進行Texture處理時,需要先配置Slot(槽),而這個Slot則位於固定空間的Binding Table中,Shader所能存取的Texture數據則是取決於Slot數量多寡,在微軟DirectX 11規範中每個Shader最多只能存取128個Texture數據。
而Bindless Textures技術就如同字面上的意思,解除了原本Texture的「綁定」限制,讓Shader能夠存取的Texture數據量從128個暴增到100萬個。讓Shader直接存取記憶體中的資料,不再受到Slot的限制。除了可以提高Texture數量外,並能減少CPU使用率,當然也有助於效能提升。
平均領先6.47%
說這麼多,實際效能是怎樣?從數據上來看,不論是DirectX 9、10、11,GTX 680對上HD 7970在效能表現都有明顯優勢,領先幅度大約在3~10%不等,差距大的項目最高可落差到15~30%。但是GTX 680並非所有項目都能完全領先HD 7970,尤其在特效強度、解析度較低的環境中,容易造成些微的落差。整體而言,GTX 680對上HD 7970大多是大勝小負的局面,總測試項目平均領先幅度約為6.47%,GTX 680遊戲效能領先HD 7970應是無庸置疑的事。
單核對雙核勝負難分
說句公道話,GTX 680比HD 7970晚推出數個月,擁有效能領先也是「應該的事」,而且它還沒成功挑戰雙核心顯卡。AMD陣營單核心顯卡王者雖是HD 7970,但實際上的紀錄保持人應該是雙核心HD 6990。雖然說CrossFire十分吃重遊戲支援性,但是在運算效能方面,雙核心顯卡還是有明顯的優勢。
以測試數據來看,要論斷GTX 680與HD 6990的勝負還真的有些困難,最大的因素在於對於CrossFire支援度差的遊戲,GTX 680領先的幅度相當驚人,最多可達30%上下。但是普遍而言,GTX 680都是呈現落敗的局面,幅度最高也會差到30%左右。兩者相比,若遊戲對雙核心的支援度較佳,HD 6990有較大的贏面,反之則是GTX 680佔優勢,客觀一點來分析,應該說是各有長處。
DX 9、10、11遊戲效能測試
▲效能表現上,GTX 680大多能領先HD 7970,但是跟雙核心的HD 6990在部分測試上仍有段差距。若是碰到CrossFire效率較差的軟體,GTX 680才有可能勝出。但是在價位、功耗等考量下,HD 6990並沒有明顯優勢。
(後面還有:玩特效: AA、Tessellation全開沒問題)
延伸閱讀:
新卡王核心 Kepler 解析:28nm 製程加持、2倍電力效率、更快的速度
完全看懂 HD 7970 新架構,GPU 如何跑出更高的效能?
AMD HD 7970 之 GCN 架構完全解析,帶來 GPU 革命
玩特效: AA、Tessellation全開沒問題
相較於DirectX 10剛推出的那個年代,由於Unified Shader(統一著色引擎)剛投入實戰,加上Crysis等怪獸級遊戲相繼推出,令人有種硬體追不上軟體的感覺。然而幾年下來,即使後來又出現Tessellation這項吃資源的技術,但整體而言硬體又趕上遊戲引擎的發展。加上Crysis的經驗,讓遊戲廠商也了解到遊戲不是越吃吃資源越好,能夠讓多數人享受遊戲,才是玩家與廠商雙贏的局面。
AA:新卡AA衰減量提升
以高階卡而言,當代指標遊戲都能順順跑是基本要求,以GTX 680而言,在Battlefield3的1920 x 1080環境開啟4倍AA,FPS表現平均有約60張的水準。不過在測試中也發現,AA的強度與以往相比,似乎在FPS衰減量方面有明顯的差異。於是透過Unigine Heaven 3.0的DirectX 11環境測試,從0倍提升到8倍反鋸齒,GTX 680的FPS衰減了38.7%,GTX 580則是30.9%;對手陣營HD 7970是38.4%,HD 6970則是23.2%。可看出在部分環境的反鋸齒效果上,新卡的衰減量反而比舊卡高。
AA衰減量測試
▲以Unigine Heaven 3.0測試,GTX 680與HD 7970的AA表現上差異並不算明顯,大約只有0.3%的落差。
▲若跟GTX 580比較,可發現雖然GTX 680運算效能較強,但是AA的衰減量反而比較高,兩者相差7.8%。
Tessellation:Kepler佔優勢
打從Fermi開始,在Tessellation特效方面,幾乎都是NVIDIA採用的架構較具優勢。從這次的測試來看,Kepler也延續Fermi傳統,在Tessellation特效表現領先GCN架構。以Unigine Heaven 3.0數據中來看,GTX 680開啟Tessellation後FPS衰減了19.5%,而GTX 580則是20.2%,兩者差距並不明顯。而在AMD方面,HD 7970衰減量為26.9%,HD 6970則是23.9%,明顯高於NVIDIA陣營。
Tessellation衰減量測試
▲在8AA環境下,開啟Tessellation後FPS約衰減19.5%,若關閉AA衰減量會稍微提升,約為20.6%。
▲HD 7970衰減量與GTX 680相當,約在20%上下,且不論0~8倍AA環境下,衰減量都相當。
(後面還有:尬溫控:隱藏的熱導管)
延伸閱讀:
新卡王核心 Kepler 解析:28nm 製程加持、2倍電力效率、更快的速度
完全看懂 HD 7970 新架構,GPU 如何跑出更高的效能?
AMD HD 7970 之 GCN 架構完全解析,帶來 GPU 革命
尬溫控:隱藏的熱導管
溫控一直是高階顯卡的痛,像是初期Fermi架構的功耗與TDP就是個標準的樣板。然而進入到28nm世代,不論是AMD或NVIDIA在這方面都得到緩解,至少很難聽到有人拿顯卡來煎雞蛋了。
棄均熱板就熱導管
Kepler的TDP只有195W,算是相當異類的高階卡。且打從均熱板(Vapor Chamber)進入高階顯卡以來,GTX 580、HD 6970甚至28nm的HD 7970都是採用這種設計。均熱板的好處是透過真空腔體,仍擁有比熱導管更高的傳導效率。不過拆開GTX 680卻發現並非採用均熱板配置,而是在鰭片底下佈了3條隱藏的熱導管。
高低負載溫差大
GTX 680的散熱鰭片以高階卡而言相當迷你,就以往的經驗來說,公板卡的散熱只能說是「堪用」。不論是新舊卡在閒置溫度方面差異都不大,普遍都在33~37度之間。至於滿載的表現,透過Furmark測試分析,GTX 680溫度為83度,GTX 580則是77度,HD 7970是75度,最後HD 6970溫度最高有90度。
溫控測試
▲閒置狀態下,溫度差距並不明顯,大多落在33~38度之間。這得歸功於各家的閒置降頻、降壓技術。
▲GTX 680滿載溫度並不如預期,主要是受到散熱器的限制,讓溫控表現甚至遜於GTX 580。
價位出色,缺點少
效能出色的顯卡,通常價位都不會出色,價位高達20,000元的HD 7970就是最好的例子。這次GTX 680建議售價為549美元(折合新台幣約16,470元),而台灣的市場售價則在17,500~19,000元之間,價位基本上維持以往高階卡的價位。HD 7970受到GTX 680的影響之下,近期之內肯定會降價以對,若有意選購AMD顯卡的玩家可以再等等。
整體而言,GTX 680在效能、效率、溫控、價位等方面都相當出色,加上新技術的加持,是這幾年來少數能用「革命性」來形容的高階卡。尤其在電力效率方面,更是有明顯的優勢,雙6pin供電的高階卡已經好幾年沒出現,這也讓人更期待中階核心的表現,GK 104以下的核心是否能維持Kepler的高效率,也值得我們繼續關注。
功耗測試
▲閒置環境下,GTX 680的平台功耗只有71W,數值低於其他高階卡。但是平心而論,差距並沒有大到令人吃驚。
▲若使用FurMark測試,受限於顯卡的超壓保護機制,GTX 580等卡難以跑到極限功耗,因此大多維持在300W上下。
(後面還有:NVIDIA GeForce GTX 680完全拆解)
延伸閱讀:
新卡王核心 Kepler 解析:28nm 製程加持、2倍電力效率、更快的速度
完全看懂 HD 7970 新架構,GPU 如何跑出更高的效能?
AMD HD 7970 之 GCN 架構完全解析,帶來 GPU 革命
NVIDIA GeForce GTX 680完全拆解
▲GTX 680是NVIDIA第一張可4螢幕輸出的顯卡,並支援多重3D螢幕技術3D Vision Surround。
▲核心型號為GK 104-400-A2,採用28nm製程Kepler架構,架構配置與Fermi相似但不相同。
▲PCB上共配置8顆GDDR5記憶體,總容量為2GB,相較於HD 7970而言,記憶體容量較少。
▲低功耗是Kepler的優勢,供電介面僅使用2個6pin插槽,是繼GTX 285之後,少數採用此種配置的頂級卡。
▲這次GTX 680的散熱器相當迷你,僅有117mm,且前方有特殊斜面設計,據官方說法,能夠減少亂流的產生。
▲傳輸介面採用PCI-E 3.0規格,不過在截稿之前,受限於驅動程式與Intel晶片組限制,並不能在Z77和X79上正常運作。
▲散熱器以銅底與核心直接接觸,銅底下方是隱藏的3條熱導管,而非均熱板設計,高負載環境下溫度高於前代。
▲供電模組由GTX 580的6+2相減少到4+2相,且核心供電部分,有預留1組空焊插槽,或許會用在更高階的版本上。
延伸閱讀:
新卡王核心 Kepler 解析:28nm 製程加持、2倍電力效率、更快的速度