最近市場上推出了 PCI-E Gen5 的 SSD,但和 Gen4 剛推出時一樣,價格仍然相對昂貴。回顧一下硬碟的發展速度,我們從 SATA 500MB/s 的時代,跳升到 PCI-E Gen3 的 3,000MB/s,再到 PCI-E Gen4 的 7,000MB/s,現在又有 PCI-E Gen5 12,000MB/s 的高速規格,這種速度提升的進步真是迅猛。
但除了規格上的速度提升之外,Gen5 相對 Gen4 在其他方面是否有更多幫助呢?這次透過對美光 Crucial T700 Gen5 SSD 與 Crucial P5 Plus Gen4 SSD 兩條 SSD 做不同的測試,來看看兩者在各種情況上的差異。

簡介 - DirectStorage API

硬碟的發展速度實在驚人,我還記得以前 SSD 還貴的時候,基本上要 1TB 以上的容量,都會選擇 HDD。但現在,除非需要大容量儲存,如 4TB 以上的資料,不然都直接用 SSD 了。尤其是現在許多遊戲開始要求安裝在 SSD 上,否則遊戲讀取速度真的會太慢。我甚至考慮是否要將遊戲安裝在 PCI-E SSD 上,因為 SATA SSD 的速度最高也只有 560MB/s,而 PCI-E SSD 可以輕鬆超過 3,000MB/s。

近年來,PCI-E SSD也經歷了許多變革,速度不斷倍增,直到最新的 PCI-E Gen5 世代,速度已經達到 12GB/s,實在嚇人。正因如此,隨著 SSD 速度的不斷提高,微軟也推出了新技術,以利用 SSD 的高速讀寫優勢來提高遊戲體驗,它就是 DirectStorage。DirectStorage API 是一個微軟自 Xbox 下放到 Windows 的一個遊戲技術。簡單來說,以前遊戲需要讀取地圖、材質等數據時,必須首先從硬碟讀到記憶體,然後通過 CPU 進行處理,最後再交給 GPU 進行渲染。這樣的過程不僅會受限於硬碟較慢的 I/O 速度,還會卡 CPU 瓶頸。

這時候,DirectStorage 就派上用場了,它允許數據直接從硬碟讀取到 GPU,然後在 GPU 上進行處理,如解壓縮、解碼等等。這樣,遊戲就不需要再等待 CPU,運行速度也變得更快。當然,前提是硬碟的速度足夠快,就像我們這次測試的 Crucial P5 Plus 和 T700 這樣高速的硬碟。如果硬碟讀取速度慢,那麼等待時間仍然會集中在 I/O 上,DirectStorage 的優勢就不明顯了。

接下來,我們使用了微軟提供的兩個 DirectStorage API demo 來測試 DiretStorage 的差異。首先是讀取多個模型與貼圖到 GPU,比較頻寬與 CPU 使用率,結果如下,可見到 Gen5 世代的 Crucial T700 擁有較短的讀取時間與較高的頻寬。

接下來測試通過 DirectStorage 將圖片加載到 GPU 進行解壓縮的速度。結果如下,可以看到 T700 在頻寬方面表現得更好。

除了 DirectStorage,還有類似的技術,比如 NVIDIA 的 RTX IO。隨著這些技術的出現,可以預見將來遊戲對硬碟速度的需求會越來越大。但現在,讓我們來測試看看將遊戲安裝在 Gen4 和 Gen5 SSD上是否會有什麼不同。

開箱 - Crucial T700 & P5 Plus SSD

簡單介紹這次待測的 SSD,分別是美光最新的 Crucial T700 Gen5 SSD 與 Gen4 世代的 Crucial P5 Plus。

Gen5 的 Crucial T700 帳面規格讀取可達 12.4GB/s,寫入 11.8GB/s。Gen4 的 Crucial P5 Plus 讀取可達 6,600MB/s,寫入 5,000MB/s。從這兩條 SSD 也可以看到這散熱片的厚實,足足比 Gen4 的 P5 Plus 厚了一圈,可見 Gen5 SSD 的火熱程度。

測試 - Crucial T700 & P5 Plus SSD

測試平台的規格如下:
CPU:Intel Core i9-12900K
MB:ASRock Z790 Steel Legend WiFi
RAM:Crucial DDR5 Pro 5600 16GB × 2
Graphics:PNY GeForce RTX 4070 Ti XLR8
OS Drive:Crucial T700 2TB(主機板散熱片)
Test Drive 1:Crucial T700 2TB(自帶散熱片,走 CPU PCI-E M.2 通道)
Test Drive 2:Crucial P5 Plus 2TB(自帶散熱片,走 CPU PCI-E M.2 通道)
Cooling:darkFlash DX360 v2 A-RGB
Case:InWin 303C
Power:FSP Hydro PTM PRO 850W

因為我們有三條 SSD,我們將有散熱片的款式作為測試對象,所以 OS 安裝在沒有附帶散熱片的 T700 上。待測的兩條 SSD 都會輪流安裝在 Z790 的 M.2_2 插槽中,這個位置確保了 SSD 可以使用 CPU 提供的 PCI-E Gen5 通道。然而,由於這個位置需要與顯示卡共享頻寬,因此當使用 M.2 時,顯示卡只能使用 PCI-E 4.0 x8。因此,不論是 Gen4 的 P5 Plus 還是 Gen5 的 T700,本次測試都將使用這個位置的 M.2 通道,以確保公平的測試基準。

首先看到代表著理論性能的 CrucialDiskMark,以最佳效能檔位搭配讀取混合模式,得到以下成績。

AIDA64 線性全硬碟讀取,也可以看到 T00 的速度是 P5 Plus 的兩倍。

AIDA64 線性全硬碟寫入,T700 平均速度高一些。在 SLC 快取內速度更可高達 9,000 多 MB/s,不過寫入超過 40% 後,會降速降到比 P5 Plus 還慢一些。

PCMark 10 Full System Drive Benchmark,T700 得分 5362。

對比 P5 Plus,得分為 2944。

不過這些都是理論上的表現,實際上呢?首先看到遊戲部分:微軟自家的賽車遊戲 Forza Horizon 5,這款遊戲是微軟工作室開發的,以它做為測試基準非常合適。這邊測試多個場景的平均讀取速度,可看到讀取速度 T700 平均快了 5 秒鐘。

FPS 大作 Call of Duty: Modern Warfare II,多個場景讀取平均只快了 0.26 秒,畢竟 CoD 的地圖面積偏小。

另一款 FPS 大作 BattleField 2042,多個地圖讀取平均…欸?超車了,P5 Plus 反而快了 3 秒。

同樣的情形也發生在 Cyberpunk 2077 中,讀取速度反而是 P5 Plus 快了 1.3 秒。

而以 CS: GO 這款知名的射擊遊戲而言,讀取速度的優勢使的 T700 回到了領先位置,平均比 P5 Plus 快了 1.9 秒。

知名農 Game 原神,T700 在地圖傳送的速度平均快了 P5 Plus 0.19 秒,但考慮到這款遊戲的傳送所需時間最久也才 4.26 秒,0.19 其實也是蠻大幅度的提升。

Final Fantasy XIV,平均讀取 T700 快了 0.21 秒,總共差距 1.1 秒。

從以上幾款遊戲看來,Gen5 的 T700 相比 Gen4 的 P5 Plus,雖說多數情況下較快,但快的程度其實不明顯。但這樣也蠻符合預期的,畢竟現在遊戲幾乎都是針對 Gen3、Gen4 的 SSD 設計,自然不會對 Gen5 的高速 SSD 做最佳化。但如果對比的是 Gen3、SATA SSD,甚至是傳統硬碟的話,我敢說這差距絕對是用感受就能體現出差異了。且相信在不久的未來,遊戲一定還會有更多對於 Gen5 SSD 的調整與最佳化。以目前已經上市的遊戲作為例子,今年初上市的 Forspoken,以及近期從 PS5 移植至 PC 的 Ratchet & Clank: Rift Apart 有支援 DirectStorage,且僅有後者支援 GPU 解壓縮, 暗黑破壞神 Diablo IV 則是預計在未來的更新中新增支援 DirectStorage。此外,GPU 製造商也需要微調驅動程式,避免 DirectStorage 功能消耗過多運算資源而影響原本的渲染繪圖工作,這些都需要時間以優化效能,近一步發揮 Gen5 SSD 的價值。

至於專業應用部分,我首先測試了透過 Davinci Resolve 輸出影片,在我的專案中,輸出的速度基本上差不多,沒有明顯差距。

而 AI Training 部分,我測試了用 transformers 搭配 PyTorch library 跑 ResNet50 image classification,分別用 8500 張的 RGB 224×224、512×512、1024×1024、2048×2048 的解析度跑訓練,結果如下。可以看到直到影像大小是 2048×2048 時,T700 才能呈現出較好的表現。其餘解析度下,使用 Gen5 的 SSD 並不會有特別的提升。

結論 - Crucial T700 vs P5 Plus SSD

在這次的測試中,我們對美光的 PCI-E Gen4 和 Gen5 SSD 進行了不同類型的測試。從結果來看,Gen5 的 Crucial T700 在多數遊戲中確實表現出較快的讀取速度,從而減少了遊戲的載入時間,但這種減少的幅度並不像跑分測試中那麼明顯。在專業軟件表現方面,就 Davinci Resolve 輸出 FHD 影片的結果來看,Gen5 的 T700 並沒有優勢。然而,影片剪輯的過程並不僅僅是輸出,還包括了文件傳輸、素材引入和同步等步驟,擁有 12GB/s 讀取和 11GB/s 寫入速度的 Crucial T700 在這些方面會更有優勢,文件載入速度也會更快,是 T700 會比較吃香的地方。

然而,在 AI 訓練方面,我有些驚訝兩款 SSD 居然無法拉開差距,因為在 AI 訓練的過程中,包括大量的硬碟讀取。根據測試結果,除非您的原始圖片解析度非常高,達到 1024×1024 以上,否則 PCI-E Gen5 的 SSD 難以體現出差距。但請不要誤會我的意思,無法體現出差距是因為 Gen4 的 P5 Plus 速度已經非常快了,如果對比的對象是傳統硬碟,那麼 SSD 對於訓練速度的提升仍然非常明顯。

總之,根據目前的情況,我認為 Gen5 相對於 Gen4 的提升仍然有限,但隨著時間的推移,例如更多的遊戲引入 DirectStorage API,或者由於硬碟速度的演進,遊戲開發商將進一步優化遊戲以利用高速 SSD,Gen5 的優勢可能會變得更加明顯。如果你追求極致性能,並且願意為之付出較多的預算,那麼 Gen5 的 SSD 是不錯的選擇,它能夠提供當前市場上最高速的讀寫速度。不過,如果你的主要用途是遊戲,Gen4 的 SSD 已經能夠提供出色的性能,並且價格相對較低,因此也是一個不錯的選擇。最終,選擇 Gen4 還是 Gen5 SSD 取決於你的預算和性能需求,以及你對未來的需求預期如何。