終於呀,Intel 12 代 CPU 終於上市,我個人是相當的期待牙膏廠逆襲 AMD,這次最特別的地方莫過於引入了 P-Core 與 E-Core 搭配的設計,理論上可以更有效地分配運算資源,達到更節能且高性能的目的。
其中我覺得,這也是 PC 處理器一個相當大的轉折點,第一次在同顆處理器內放入不同架構的處理核心,而這也是我最有興趣的部分。而對於一般用戶來說,最大的體驗差別莫過於遊戲的順暢度與剪片輸出的速度差異了吧!

簡介 - Alder Lake 架構

第 12 代引入了異質架構設計,也就是俗稱的大小核。大核是 Performance Core 使用的是 Golden Cove 微架構;Efficient Core 使用的是 Gracemont 微架構,是一款從 Atom 低功耗架構那延伸出來的產品,但是它不像以前的那陀 Atom,它的性能是能夠與以往的 Skylake 微架構匹敵的,也就是之前 Intel 第 6 / 7 / 8… 代的 CPU 架構。

雖說 Intel 一直說 P-Core 與 E-Core 並不是大小核設計,但其實就是差不多的東西。只是這小核不是 ARM A55 這種 “小” 核心級別的,比較像是 Cortex-X1 與 Cortex-A78 的差距。也就是 “超大” 核心搭配 “大” 核心。由於多了這個架構,因此作業系統 Schedular 的設計與效率會大大的影響處理器效率,這個等一下我們會深入探討。

而之所以 Intel 這次可以擠出這麼大一管牙膏,除了 P-Core 與 E-Core 外,最重要的就是將 Intel 7 製程導入,你可以把它視同為台積電的 7nm 製程等級。在能耗降低的情況下,能大幅拉抬處理器性能表現。這次 i9-12900K 搭載了 8 顆 P-Core,以及 8 顆 E-Core。而 i5-12600K 則 6 顆 P-Core 搭配 4 顆 E-Core,所以 P / E-Core 的搭配究竟對使用上有沒有加分呢?我們等一下告訴你。

簡介 - 第 12 代 CPU 測試平台

首先介紹一下這次的測試平台,CPU 當然是這次的主角 i9-12900K,為 Intel Core i 系列最強,也是目前消費級市場最強大的處理器。

搭配的是華碩 ProArt Z690 Creator WiFi 主機板。這款主機板沒有 RGB 燈覆蓋,I/O 遮罩與晶片組都用了一些半透明與透明的造型,有種簡潔的美,不愧稱作 ProArt。

而這次選擇這款主機板除了顏質與豪華的供電,其 I/O 的兩個 Thunderbolt 與 4 條 M.2 更是重要的原因之一,對於之後外接設備的擴充與硬碟的加裝都比較有彈性。

記憶體有兩個,第一款為來自威剛的普條 DDR5-4800,主要測試在一般環境下 DDR5 的性能表現,畢竟多數人還是選擇這種常見且較為便宜的普條。

另一條超頻條為 XPG LANCER DDR5-5200 32GB,黑色精緻低調的外表正好搭配 ProArt 主機板。

而為了壓制這高性能處理器,散熱器為 darkFlash 全新推出的 DX360 v2 水冷散熱器,全白設計與划算的價格,為他的優勢。

SSD 選用的是 Teamgroup 的 T-Force CARDEA A440 1TB,為 PCI-E Gen4 7000MB/s 高速 SSD,最近價格低的有點誇張,可以參考。

而顯示卡,則是我們熟悉的 ZOTAC GAMING GeForce RTX 3070 AMP Holo,側面的漸層很漂亮。在眾多的顯示卡之中,我覺得 ZOTAC GAMING 的卡一向都是最有特色的那張。

而為了應付之後可能的吃電大戶,Power Supply 選用的是全漢 Hydro PTM PRO 850W,一線廠商白金牌電供就屬他最便宜,最近火紅的 10 年保它也有。

最後機殼為方便拆裝,選用的是顏值 NO.1 的 InWin 303C。

跑分 - i9-12900K 性能表現如何?

照往例還是先看一下跑分,首先測個 Cinebench R23,這款軟體主要用來測試處理器的理論性能,多核 27576 分,單核 1983 分,擊潰了競品同價位的 Ryzen 9 5900X。可見這次 Intel 一點也不想慢慢擠牙膏啦,相較於 5900X,預設多核分數即高了 33%。

不過跑分很有感,功耗也不落人後呀,FPU 燒機功耗達 220.7 W。

雖說單看功耗挺高的,不過如果將頻率降下來,其實能夠省電不少。我將 i9-12900K 全核心鎖定 3GHz,R23 此時分數依舊有著 18336 分,但 FPU 功耗卻僅剩下了 65.9W。

就此看來,Intel 7 製程,也就是對應台積電的 7nm 製程雖說延後了許多,但也是真的有料,能夠兼顧高頻性能與低頻的省電。而既然提到了省電,就不得不提這次的 P-Core、E-Core。P-Core 大核心的性能你們剛剛已經見識過了,那麼小核心 E-Core 呢?由於 BIOS 不能將所有 P-Core 關閉,故我們這裡用了一些方式,使得 R23 能夠只在 E-Core 上跑,看跑分。8 顆 E-Core 全開分數 7944,已經比 Core i5-10500 還要高了,單核心分數 1126 也能夠與以往的 Skylake 微架構匹敵。

聽起來 E-Core 其實也很強了吧?告訴你,精彩的還沒說,在定頻 3GHz 時,i9 的能耗比來到了驚人的 278.2,可是連 Zen3 都只能垂涎三尺。而且,看一下 E-Core 的能耗比,哇!339.3 是什麼鬼?!遠遠超越其他競爭者。所以簡單對比一下你就可以發現,Intel 說 P-Core 與 E-Core 的結合能夠提升處理器性能不是開玩笑,4 顆 E-Core 占的面積與 1 顆 P-Core 雷同,R23 卻提升了將近 2 倍,且能用更低的功耗運行。

架構面還有另一點是 Hyper Thread,這東西你可把它當作是一顆處理器核心,模擬成兩顆,其目的是要提升執行的效率。為了知道 HT 的性能提升數據,我將 i9 的所有 E-Core 關閉。此時 R23 得分 19795。順帶一提,就算少了 8 顆小核心助陣,且核心數目比 R9 5900X 少,這個分數仍就可以打平 AMD R9 5900X。而在將 Hyper Thread 關閉後,分數來到了 16228。也就是開啟 Hyper Thread 技術,可以有著 21% 的性能提升。

由此可知,這次 Intel 第 12 代處理器能夠有如此大的提升,來自於

1. Intel 7 製程的進步
2. P-Core、E-Core 的結合
3. 架構提升

其中就架構的能耗比而言,Alder Lake 確實優於其他架構許多,不管是高性能的 P-Core,又或是高能效的 E-Core。而兩者的搭配又使的處理器在應付不同類型的運算時更有彈性。

實際情形 - P-Core、E-Core 真有那麼厲害?
不過這都是理論上,對於 R23 這種跑分軟體來說,當然能夠活用每個處理器的核心。然而面對真實場景,如遊戲,處理器的每個核心未必都能夠實時被運用。那麼 P-Core、E-Core 還有優勢嗎?這就得用到了 Intel 強調的 Thread Director 技術,Thread Director 透過提供作業系統 Scheduler 每個核心的狀態與性能,讓 OS Schedular 能夠運算出此時哪個核心最適合哪個運算,理論上比較複雜的運算會分給 P-Core,較為簡單的運算會扔給 E-Core。像是遊戲時的運算就可能會交由 P-Core 處理,而同時如果有在錄影,這錄影的運算就可能交由 E-Core 處理。由於主要的 Scheduling 還是得靠 OS 處理,因此在新的作業系統 Windows 11 下,才能夠完整應用 Thread Director 的資源,達到最佳效率。

那可能會有人好奇,P-Core E-Core 的分配機制究竟是如何?在用了多種測試以及觀察後,我發現分配機制先以 P-Core 為第一優先,當 P-Core 有空位時,優先分配給 P-Core;而第二順位則是 E-Core,最後才是 P-Core 的 Hyper Thread。

所以問題來了,既然 1 顆 P-Core 核心面積與 4 顆 E-Core 大致相同,那麼全 P-Core vs P-Core + E-Core 真的會有比較好的效果嗎?

為了驗證這件事,也避免 i9 核心太多效益不明顯的問題,我們對比兩種情況

1. 6 顆 P-Core
2. 4 顆 P-Core + 7 顆 E-Core

首先理論性能 R23,6 顆 P-Core 得分 14977,E-Core 組別 17987 分。可見理論上確實是大小核心的搭配較為強勢。

再來跑渲染,Blender bmw 渲染,P-Core 組別耗時 162 秒,E-Core 組卻僅有 137 秒。可見對於動畫創作等實際應用,大小核心仍有實際的優勢在。

最後遊戲情境,跑的遊戲是微軟的 Forza Horizon 4。由於顯卡瓶頸,兩者的遊戲幀數皆為 168 FPS,但是 P-Core 組別在 Forza Horizon 4 的 CPU 模擬與 CPU 繪圖的 FPS,相較於 E-Core 組別卻反而提升了 15% 的 FPS。

這情況還蠻有趣的,由此可觀察到,對於遊戲而言,因為跑遊戲時並不會運用到所有的核心,因此大核心為主還是比較吃香的;而對於渲染、跑運算來說,多核心效能才是最重要的,因此多核心 E-Core 的加入使的效率能夠更加提升。
當然作業系統對於 P-Core E-Core 的分配可不只前面提到的優先權而已,包含程式在前台、後台,或是運算跑的指令集等都會有影響。Thread Director 的存在意義是給予 OS Scheduler 足夠的資訊,那畢竟這東西是第一次出現在 x86 處理器上,所以我覺得可以預期,未來 Scheduling 的效率應該可以更加的提升,就希望 Wintel 聯盟還能帶給我們什麼好料囉。

oneAPI - Intel 想打造出他們自己的 CUDA?

oneAPI 這東西說來有點複雜,簡單來說就是讓軟體開發者可以透過一個統一的方式去存取硬體做運算。oneAPI 整合了 CPU、GPU 與 FPGA,因此理論上這東西的覆蓋範圍廣,能夠更容易地被推廣。這東西的實際應用之一就是深度學習。以往碰深度學習,基本上就是只能用 NVIDIA 的 CUDA+cudnn,而有了 oneAPI 與 oneDNN 後,或許之後會趕上 CUDA 那倒也不是不可能。

總之以往常常遇到專業軟體或是某些特定領域,如:Tensorflow、Solidworks 都只能選用 NVIDIA 的顯示卡,但隨著 oneAPI 的被各大框架支援,或許以後這情況能夠改善也說不定?
況且 oneAPI 的開源也是喊真的,我在查 AMD 的類似技術時,發現他們有針對 EPYC 處理器推出了 ZenDNN,但你仔細看,裡面的描述就有這麼一條
ZenDNN is based on OneDNN/DNNL v1.3 and leverages its basic infrastructure and APIs.
基本上就是說 ZenDNN 的技術也是繼承自 oneDNN,如果連競爭對手也都同意這東西的話,那我覺得這是真的有發展潛力的。

那當然,API 有支持,但硬體性能有跟上才有用,這邊測試了下 i9-12900K 與 R9 5900X 跑 Tensorflow 框架的深度學習運算性能,i9-12900K 以 1 倍的優勢輾壓 R9 5900X,可見 Intel 說 Alder Lake 有針對深度學習優化所言不假。

結論 - Intel 第 12 代處理器值得購買?

Intel 第 12 代 Alder Lake 處理器,老實說表現出奇的好。可能是因為第 11 代真的有點悽慘,也可能是因為 Intel 難得一次端出這麼多驚喜。P-Core / E-Core、Intel 7 製程,以及性能大提升的 Golden Cove 微架構。對於玩家來說,我覺得第 12 代還是很划算的,特別是 i5 處理器,憑藉著大核心優勢與較為親民的價格,可以預期之後這顆處理器與 B 系列主機板的大受歡迎。那對於創作者來說,單核性能大提升且搭配 P-Core、E-Core 異質架構,性能的提升是無庸置疑的;而除了架構上的提升,Intel 這次的 Z690 也是卯足功夫,一次給了 20 條 PCI-E Gen4 以及 Thunderbolt 的支持。CPU 更是提供了 16 條 PCI-E Gen5,對應在主機板上也可以看到誇張的 4 條 Gen4 M.2。

總而言之言而總之,如果你正好想換電腦,Alder Lake 絕對會是個好選擇,至於要上 DDR4 或是 DDR5,我覺得這就看你之後會不會想去升級記憶體了,像我這種有嚴重換換病的用戶,DDR4 當然不能滿足我。選擇 DDR5 更多的是嘗鮮,那要選帥氣的超頻條,還是一般較為便宜的 DDR5-4800,我覺得就看你想投多少預算到這上面吧。

而在見識了 P-Core E-Core 這組合的優異表現後,我不禁開始期待第 12 代架構應用上筆電的情境,這 E-Core 的高能效表現估計能讓筆電的性能提升上不少。

EnterBox 從多面向的角度,穿梭於理感之間。深入淺出各項規格數據,分享箱裡箱外的各種面貌,和你一起閱讀科技產品。Enter the Box, Explorer more。