代號「Colfox」、第二代 Ryzen Threadripper 登場
去年 8 月,AMD 正式發佈 Ryzen Threadripper 1900 系列處理器,挑戰 INTEL Core X 高階桌面 (HEDT)平台市場,擁有高達 16 核心、32 線程,相同 CPU 核心數目及規格下售價較 INTEL Core X 系列更便宜,或相同價位下 CPU 核心更多、性能更高,令不少高階玩家及工作站用家轉投 AMD 懷抱。
相隔一年,AMD 再次向 INTEL 投下震撼彈,代號「Colfax」、第二代 Ryzen Threadripper 處理器正式登場,採用經改良 Zen+ 微架構、更先進 12nm LP 制程,頂級型號 Ryzen Threadripper 2990WX 的核心數目提升至 32 核心、64 線程,性能完全拋離INTEL Core i9-7980XE,高階桌面 (HEDT) 平台已成為 AMD Ryzen Threadripper 的天下。
採用 MCM 封裝、4 顆 8 核心晶片
全新 Ryzen Threadripper 2990WX 研發代號為「Colfax」,處理器由 4 顆 Zeppelin 矽晶片所組成,採用 12nm LP 制程、GlobalFoundries 代工,矽晶片尺寸為 212.97mm² 、內含 48 億個電晶體,透過 Multi Core Module 封裝技術,將四顆 Zeppelin 矽晶片包裝在單一封裝之內,達成 32 核心處理器配置。
經改良的 AMD Zen+ 微架構
經改良的「Zen+」微架構主要沿至上代「Zen」設計,並針對 Cache Prefetch 高速緩存作出改良,降低記憶體子系統讀寫的延遲,當執行記憶體延遲敏感的運算工作能帶來明顯的性能提升,相較上代︰
→ L1 Cache 延遲降低約 8%
→ L2 Cache 延遲降低約 9%
→ L3 Cache 延遲降低約 15%
→ DRAM 延遲降低約 2%
→ IMC 控制器改良、提升至 DDR4-2933
受惠於 Cache 及記憶體系統的改良,AMD「Colfax」處理器的 IPC 性能相較上代「Whitehaven」,在同時脈下單線程性能提升約 1~2%。
升級 12nm LP 制程
AMD「Colfax」處理器除了針對微架構作出改良外,更採用了先進的 Global Foundries 12nm LP (Leading Performance) 制程,相較上代 14nm 制程電晶體性能提升約 10~15%,令處理器的核心時脈可進一步提升,同時降低了處理器V/f 曲線所需要的電流,相較上代「Whitehaven」︰
→ 時脈提升 +200MHz、最高可達 4.2GHz
→ 工作電壓下降約 80~120mV
→ All-Core下風冷超頻可達 4GHz+
Precision Boost 2 時脈管理
第二代 Ryzen Threadripper 處理器其中一項重大改進是,擁有更精準的「Precision Boost 2」時脈管理技術,同樣是根據 CPU 溫度、功耗及負載因素作出時脈調整,對比上代「Whitehaven」 只提供 4 Cores 及 All Cores 兩種時脈模式,新一代「Colfax」能精細地按照不同執行緒負載,以 25MHz 作出實時速度調整,讓效能與功耗表現達至更佳比值。
XFR 2 時脈擴展技術
此外,「Colfax」處理器亦新增了 XFR 2 (Extended Frequency Range 2) 加速技術,同樣是基於 Infinity Fabric 控制迴路,監測核心的溫度、電流及時脈,相較上代「Whitehaven」只有在 4 Cores 時脈模式下才會提供 XFR 時脈擴展技術,「Colfax」可以在不同線程數目負載下提供 XFR 2 時脈擴展,在散熱條件容許下能提供更高的運作時脈。
AMD 白皮書指出,採用 Ryzen Threadripper 2990WX 處理器執行 Cinebench R15 Full Cores 測試,當室溫約 32°C 下使用 180W TDP 散熱器,由於散熱能力不足時脈並不會得到擴展,如使用全新 Wraith Ripper 散熱器並在室溫約32°C下,XFR時脈擴展幅度可達 +11%,如果室溫下降為 20°C,XFR 2 時脈擴展幅度更可提升至 +13%,改用 360mm AIO 水冷更可達至最高 +16%。
高速 Infinity Fabric 鍊結
AMD Ryzen Threadripper 2990WX 處理器內含四顆 Zeppelin 矽晶片,每顆矽晶片均擁有 3 組高速 Infinity Fabric 鍊結與其他矽晶片進行互連,其連結速度與記憶體時脈掛鈎,當記憶體模組運作於 DDR4-3200 時,Die 與 Die 之間的雙向互連頻寬約為25GB/s。
只有 Die 0 與 Die 2 設有記憶體控制器及 PCIe I/O 單元,當 CPU 核心要存取另一顆矽晶片上的遠端記憶體或 PCIe I/O 單元時,需要透過 Infinity Fabric 鍊結進行訪問。據 AMD 指出,記憶體模組運作於 DDR4-3200 時, CPU 核心存取本地記憶體時延遲值約為 ~64ns ,當存取遠端記憶體延遲值會提升至 ~105ns 。
不支援 Memory Access 選項
有別於 Ryzen Threadripper X 版本,WX 版本擁有 4 顆 Zeppelin 矽晶片,只有其中 2 顆矽晶片的記憶體控制器被使用,並無法實現 Local (NUMA) 模式,因此 Ryzen Threadripper 2990WX 會恆定運作於 Distributed (UMA) 模式,作業系統會將所有核心認作為同一顆晶片內,記憶體讀寫操作將會均勻地流向各個記憶體通道,雖然存取遠端記憶體時會出現較高的延遲,但卻實現了記憶體頻寬最大化。
Legacy Compatibility 模式
對於不需要更多線程、對記憶體延遲值較敏感的應用程式,AMD 特別加入 Legacy Compatibility 傳統相容模式,提供 1/2 Core Mode 及 1/4 Core Mode 設定,對於需要讀寫大量數據資料、對延遲值不敏感的應用程式提供最佳化,例如執行 3D 遊戲、數學運算及數據庫存取等應用。
在 1/2 Core Mode下,Ryzen Threadripper 2990WX Die 1 與 Die 3 會被停用,僅提供 16 核心、32 線程配置,記憶體會被設定為Local (NUMA) 模式,作業系統會將兩顆 8 核心晶片分別認作為兩顆不同的 NUMA 節點,所有核心的記憶體讀寫操作會優先流向本地記憶體,直至本地記憶體滿載後才會流向遠端記憶體。
當設定至1/4 Core Mode 下,Ryzen Threadripper 2990WX 只有Die 0 繼續運算,僅提供 8 核心、16 線程配置,記憶體只提供 Dual Channel 技術,不過所有 PCIe 及 I/O 仍會正常運作,能為較舊的 3D 遊戲提供更佳的性能優化。
Precision Boost Overdrive 超頻技術
針對追求性能的玩家,AMD 在第二代 Ryzen Threadripper 處理器中加入「Precision Boost Overdrive」自動超頻功能,透過主機板提供更精準的系統溫度及供電狀況,Precision Boost Overdrive 能給予更進取的時脈擴展曲線,在多線程運算下能搾出更高的時脈空間。
玩家可以在 BIOS 或 Ryzen Master 套件中,啟動「Precison Boost OverDrive」選項,它會根據封裝功耗值 (PPT)、散熱設計電流 (TDC) 及電氣設計電流 (EDC) 三個數值,自動調整核心時脈增益,在主機板供電、散熱器性能許可下,啟動 Precision Boost Overdrive 後最高可提升 13% 多線程運算性能。
筆者採用 ASUS Zenith Extreme 主機板、Ryzen Threadripper 2990WX 處理器配搭 360mm AIO 水冷散熱器,在不啟動Precision Boost OverDrive 時,執行 Cinebench R15 All-Core 測試時,核心時脈最高為 3.375GHz,CPU 性能成績為 5,119。
啟動 Precision Boost OverDrive 後,再執行 Cinebench R15 All-Core 測試,核心時脈會提升至 3.7GHz,CPU 性能成績提升至5,613,性能提升非常明顯。
值得注意的是,「Precision Boost OverDrive」功能會將處理器超出規格所限,AMD 表示啟動如同手動超頻一樣,用家需承擔可能導致保固失效風險。
沿用 AMD X399 系統平台
第二代 Ryzen Threadripper 處理器可使用現有 AMD X399 主機板平台,規格上與 AMD X470 系統晶片大致相同,提供了 8 個 SATA 6Gbps 連接埠並支援 RAID 0 、 1 及 RAID 10 模式,內建 12 個 USB 連接埠,包括 2 個為 USB 3.1 Gen 2 提供高達 10Gbps 傳輸速度, 4 個 USB 3.1 Gen 1 及 6 個 USB 2.0 連接埠。
雖然所有 X399 平台處理器接口及供電設計,均可相容第二代 Ryzen Threadripper 處理器,用家只需更新 BIOS 即可升級支援。但值得注意的是,部份較入門的 X399 主機板產品的 VRM 供電及散熱設計,並無法完全滿足 AMD Ryzen Threadripper 2990WX需求,現有 X399 平台用家升級前,請查閱主機板 QVL 列表是否支援該處理器。
60 條 PCIe Lanes 、最多 7 個 PCIe 高速裝置
除了同價位擁有更多 CPU 核心, Ryzen Threadripper 另一個重大賣點是處理器內建更多 I/O 連接埠, 提供 64 條 PCIe 3.0 Lanes ,其中 4 條用作連接 AMD X399 系統晶片,餘下 60 條 PCIe Lanes 可分配至 7 個裝置接口,相較 INTEL Core X 處理器只有 16 ~ 44 條 PCIe Lanes , Ryzen Threadripper 在擴充能力上完全壓倒對手。
針對工作站應用市場, Ryzen Threadripper 處理器可提供高達 7 個 PCIe x8 Lanes 配置,用作連接 GPU 、 FPGA 、 10Gb Ethernet 等高速運算裝置。對於高階玩家平台,主機板廠商偏向採用 x16 / x16 / x16 或 x16 / x16 / x8 / x8 Lanes 的擴充槽配置,同時可提供 3 組 PCIe 3.0 x4 的 M.2 SSD 擴充槽。
此外, Ryzen Threadripper 處理器預留 3 組 PCIe x4 Lanes 專門用作 NVMe M.2 x4 SSD 介面,其最高頻寬可達 32Gbps ,這 3 組 PCIe Lanes 控制器同時具備 SATA 6Gbps Host 功能,這樣令 NVMe M.2 介面能同時提供 SATA M.2 SSD 支援外,亦能分拆出 4 個 SATA 6Gbps 連接埠。
值得注意的是, AMD Ryzen Threadripper 處理器同時內建了 8 個 USB 3.1 Gen 1 連接埠以及 HD Audio Codec 單元,可以看到 AMD 已將部份南橋功能移植至 CPU 內,理論上已具備完整 SoC 系統架構,無需額外使用系統晶片亦能正常運作。
AMD Ryzen Threadripper 2990WX 處理器
基於 Zen+ 微架構、研發代號「Colfax」,AMD 全新「Ryzen Threadripper 2990WX」正式登場,內建四顆 Zeppelin 8 核心矽晶片,採用 12nm LP 制程、由 GlobalFoundries 代工,每顆矽晶片尺寸約 213mm² 、內含 192 億個電晶體,透過 Multi Core Module 封裝技術,將四顆 Zeppelin 8 核心矽晶片包裝在單一封裝之內,達成 32 核心、64 SMT 線程處理器配置。
此次送測型號為 AMD Ryzen Threadripper 2990WX 處理器、B2-Stepping、內建 32 顆 CPU 核心、支援最高 64 SMT 線程,高達 3MB L1 Cache、16MB L2 Cache 及 64MB L3 Cache,基本時脈為 3.0GHz、最高 Precision Boost 時脈為 4.2GHz ,最高 TDP為 250W 、tCase 最高溫度為 56°C。
AMD 已公佈了 4 款 Ryzen Threadripper 2000 系列處理器,首批登場僅有 32 核心的 2990WX,緊接在 8 月 31 日再推出 16 核心的 2950X,其餘兩款包括 12 核心的 2920X 與 24 核心的 2970WX 將要到 10 月才正式登場,所有型號均不鎖倍頻,官方定價分別為 US$649 、 US$899、US$1299 及 US$1,799 美元。
Socket TR4/SP3r2 封裝
與 INTEL Core X 系列相似, AMD Ryzen Threadripper 系列是基於 AMD EPYC 伺服器處理器移植至高階桌面平台,採用 Socket TR4 接口、也被稱為 Socket SP3r2 ,是 AMD 首款桌面處理器使用 LGA-ZIF 設計,高達 4094 個 LGA 接點,其插座設計與 EPYC 處理器的 Socket SP3 完全相同,但兩者並不能互換使用。
相較於 Ryzen 3/5/7 處理器, Ryzen Threadripper 處理器除了擁有更多運算核心,讓用家能同一時間處理更多事情,具備更多的 PCIe I/O ,可用作連接更多的 GPU 或 FPGA 處理器、更多 PCIe SSD 儲存裝置,同時可支援更多 DRAM 記憶體模組、更高系統記憶體容量,能滿足高階 PC 玩家及工作站專業用家的使用需要。
優化 DDR4 記憶體控制器
記憶體支援方面, Ryzen Threadripper 2990WX 處理器支援 Quad Channel 四通道記憶體技術、 2 DIMM per Channel 配置,可配置 un-buffered 、 non-ECC 及 ECC 記憶體模組,雖然 AMD 規格上支援最高 1TB 記憶體容量,但由於僅支援 UDIMM 模組,暫時單條最高只有 16GB 容量,因此實際上最高支援 128GB 系統記憶體。
記憶體速度方面,由上代官方最高支援 DDR4-2666 提升至 DDR4-2933,AMD 針對「Colfax」的 IMC 控制器作出改良,記憶體兼容性相較「Whitehaven」有大幅的改善,官方記憶體支援速度由 DDR4-2666 提升至 DDR4-2933,非官方提供最高 DDR4-4400 記憶體倍頻選擇,而且在風冷下已可達成 DDR4-3600+ 速度。
Ryzen Threadripper 2000 系列型號編碼
要了解 AMD Ryzen Threadripper 2000 系列處理器規格,可以從型號編碼入手,開首 Y 為 Ryzen 消費級產品、D 代表為 Desktop 處理器、299 是代表為 2990、WX 代表具 Workstation 與功能、BG 代表 105W TDP、M 代表 AM4 PGA 封裝、88 代表8 核心、512KB x 8 L2 + 16MB L3,AF 代表 B2 Stepping。
測試平台︰
AMD Rzyen Threadripper 2990WX CPU (3-4.2GHz 32C/64T 250W TDP, US$1,799)
INTEL Core i9-7980XE CPU (2.6-4.2GHz 18C/36T 165W TDP , US$1,799)
ASUS ROG Zeninth Extreme (AMD X399 Chipset)
ASUS ROG Rampage VI Extreme ( (INTEL X299 Chipset)
GIGABYTE GeForce GTX 1080 Ti (GP102-350)
CORSAIR DDR4-3200 CL15-15-15-35 1T 8GB x 4
ADATA XPG SX7000 512GB M.2 NVMe SSD
ANTEC High Current Pro 1200W PSU
ARCTIC Liquid Freezer 360 AIO Watercooling
Windows 10 Enterprise LTSB 2016
PCMark 10
PCMark 10 是由 Futuremark 開發的 PC 性能基準測試工具,其中 Essentials 基準測試主要反映一般 PC 常見任務的工作負載, Productivity 測試反映辦公環境常見任務的工作負載, Creation 基準測試是媒體及視覺影像制作,成績為綜合性能分數。
Microsoft Office Benchmark
Microsoft Office Suite 基準測試,透過真實的 Microsoft Office 2016 的 Word 、 Excel 及 PowerPoint 應用軟件,衡量 PC 系統的辦公室軟件運算性能,成績為多個細項測試的平均執行時間。
Adobe Creative Benchmark
Adobe Creative Suite 基準測試,透過真實的 Adobe Creative CC 的 Illustrator 、 After Effects 、 InDesign 及 Photoshop 應用軟件,衡量 PC 系統的影像及繪圖軟件運算性能,成績為多個細項測試的平均執行時間。
CineBench R15 Benchmark
CineBench R15 是跨平台 3D 內容創作測試套件,測試場景包含大約 2000 個對象,它們總共包含超過 30 萬個多邊形,並使用清晰和模糊的反射,區域指示燈,陰影,程序著色器,抗鋸齒等等。成績以性能點數顯示,運算越快、分數越高。
CPUID Benchmark
CPUID 基準測試是內建於 CPUZ 內的基準測試程式,主要測試處理器對 x86 指令的吞吐量,能反映處理器 Front-End 引擎的性能表現,測試分為單一核心及所有核心完全負載,成績以性能點數顯示,運算越快、分數越高。
WinRAR 5 Benchmark
WinRAR 5 解壓工具所內建的基準測試,測試 CPU 對 RAR 壓縮和解壓縮算法的執行性能,非常著重浮點運算單元的性能,並對多線程運算作出性能優化,成績以 KB/s 作單位,運算越快、分數越高。
POV-Ray 3.7 Benchmark
POV-Ray 是開源視覺光線追踪 3D 渲染引擎,用於模擬的光物理行為,生成的逼真 3D 圖像影像,並在繪圖及工業領域包括生物、化學、蛋白質研究、醫藥、建築、工程、產品設計等廣泛使用,成績為運算時間,運算越快、時間越短。
RealBench V2
Realbench 是用開源應用程序和簡單腳本來模擬 PC 系統的真實性能的基準,包括了 GIMP 圖像編輯、 Handbrake h.264 視頻壓縮及以及上述兩個程序再加上 OpenCL 的繁重多任場景,運算越快、分數越高。
SPECviewperf 12
SPECviewperf 12 是基於專業應用程序的工業繪圖性能全球標準,測試項目包括 CATIA 、 Cero 、 Energy 、 Maya 、 Medical 、 Showcase 、 Siemens NX 及 Soildworks ,是業界認受性最高的工業繪圖基準測試,運算越快、分數越高。
採用模擬現實使用環境或實際的應用程式作評估,由於部份真實應用測試並無法體現多核優勢,尤其是典型家用或辦公室應用,並非多有測試都有線性增長,不過在繪圖、影像及運算應用測試, Ryzen Threadripper 2990WX 憑著多核心優勢在測試中表現佔優。
全新 Ryzen Threadripper 2990WX 憑著同價位擁有更多核心,在大部份測試中性能力壓同價位的 INTEL CORE i9-7980XE ,性價比完勝對手。
AIDA64