英特爾推出下一代資料中心CPU設計:Chiplet設計,效能提升達240%

王林
發布: 2023-08-30 12:53:04
轉載
626 人瀏覽過
下一代英特爾晶片,要有巨大的性能提升。

每年一度的 Hot Chips 是半導體業界最重要的技術會議。在其中,晶片領域專家齊聚一堂,全球晶片廠商也常選擇在這裡發表新產品,或是闡述未來的發展方向。

當地時間週一,在史丹佛大學舉辦的Hot Chips 2023 上,英特爾首次披露了新一代資料中心晶片“Sierra Forest”,它的每瓦性能較前代提升了240%,預計明年推出。
英特爾推出下一代資料中心CPU設計:Chiplet設計,效能提升達240%
同時,英特爾首次將旗下資料中心晶片分為兩類:一類是Granite Rapids,專注於高能耗高效能;一類是Sierra Forest,專注於高能效。

接下來看 Granite Rapids 和 Sierra Forest 這兩款資料中心晶片的具體細節。

整體來講,得益於引入了面積高效的E 核(能效核),Granite Rapids 和Sierra Forest 將有望成為迄今為止英特爾Xeon(至強)可擴展硬體生態系統中最重要的更新之一。

先來看 Sierra Forest,它是英特爾首款用於資料中心的 E 核心 Xeon 可擴充晶片,還是基於 EUV 的 Intel 3 製程的主導產品。英特爾表示,Sierra Forest 預計明年上半年上市。同時,Granite Rapids 也採用相同的 Intel 3 製程。
英特爾推出下一代資料中心CPU設計:Chiplet設計,效能提升達240%
在設計上,Granite 和Sierra 都是基於小晶片(chiplet)的設計,依賴透過英特爾EMIB(Embedded Multi-Die Interconnect Bridge, 嵌入式多核心互聯橋接)技術封裝在一起的運算和I/O 小晶片的混合。不僅如此,這次的小晶片設計還有獨到之處,使用不同的運算 / IO 小晶片,而不是將「完整的」Xeon 小晶片封裝在一起。

這意味著,Granite 和 Sierra 可以共享基於 Intel 7 製程所建構的、通用 I/O 小晶片。
英特爾推出下一代資料中心CPU設計:Chiplet設計,效能提升達240%
除了共享平台的詳細資訊外,英特爾還首次提供了 E 核和 P 核(性能核)所用架構的高級概述。正如現在多代 Xeon 的情況一樣,英特爾正在利用與其消費部件相同的基本 CPU 架構。

因此,Granite 和 Sierra 可以被認為是解構的 Meteor Lake 處理器,Granite 配備 Redwood Cove P 核心,而 Sierra 配備 Crestmont E 核心。

英特爾推出下一代資料中心CPU設計:Chiplet設計,效能提升達240%

#如前所述,這是英特爾首次嘗試為 Xeon 市場提供 E 核心。對英特爾來說,這意味著要針對資料中心工作負載調整 E 核心設計,與上一代以消費級應用程式為中心的 E 核心設計大有不同。

英特爾透露,Crestmont 正在提供 6-wide 指令解碼路徑以及 8-wide 隱退後端。雖然不如英特爾的 P 核心強大,但 E 核心絕不是輕量級核心,英特爾的設計決策反映了這一點。儘管如此,它的設計在晶片空間和能耗方面都比 Granite 中的 P 核心要高效得多。

Crestmont 的 L1 指令快取(I 快取)將為 64KB,是早期設計中 I-cache 大小的兩倍。同時,Crestmont E-core 系列的新成員可以將這些核心打包成 2 或 4 核集群,這與目前僅提供 4 核集群的 Gracemont 不同。最後,對於 Sierra/Crestmont,該晶片將提供與 Granite Rapids 盡可能接近的指令。這意味著有 BF16 資料類型支持,以及對各種指令集的支持,例如 AVX-IFMA 和 AVX-DOT-PROD-INT8。

英特爾推出下一代資料中心CPU設計:Chiplet設計,效能提升達240%

#同時對於 Granite Rapids,我們有 Redwood Cove P 核心。 Redwood/Granite 是 Xeon 處理器的傳統核心,對於英特爾來說,變化並不像 Sierra Forest 那麼大,但這並不意味著他們沒有改進。

在微架構方面,Redwood Cove 獲得了與 Crestmont 相同的 64KB I 緩存,容量是其前身的 2 倍。但最值得注意的是,英特爾成功地進一步降低了浮點乘法的延遲,將其從 4/5 個週期減少到僅 3 個週期。像這樣的基本指令延遲改進很少見,因此我們總是期盼能夠出現。

除此之外,Redwood Cove 微架構還有分支預測和預取等特性,這是英特爾的典型最佳化目標。它們可以採取的任何措施來改善分支預測(並降低罕見失誤的成本),經常在性能方面帶來相對較大的紅利。

Redwood Cove 的AMX 矩陣引擎獲得了FP16 支持,尤其適用於Xeon 系列,而FP16 的使用不如已支援的BF16 和INT8 那麼多,但它總體上改進了AMX 的靈活性。

對於記憶體加密的支援也正在改進。 Granite Rapids 的 Redwood Cove 將支援 2048 個 256 位元記憶體 key,而 Sapphire Rapids 則支援 128 個 key。

英特爾推出下一代資料中心CPU設計:Chiplet設計,效能提升達240%

#雖然現在談論Granite Rapids 和Sierra Forest 的各個SKU 還為時過早,但英特爾已明確告訴我們,核心數量總體正在增加。 Granite Rapids 晶片將提供比 Sapphire Rapids 更多的 CPU 核心(SPR XCC 為 60 個)。當然,Sierra 的 144 個核心將提供更多的 CPU 核心。

在之前的Xeon 推遲並花費很長時間才將E 核Xeon 可擴展晶片推向市場之間,英特爾並沒有像以前那樣在數據中心市場佔據主導地位,因此Granite Rapids 和Sierra Forest 將標誌著一個重要的轉折點,為英特爾資料中心產品的未來發展指明了道路。

英特爾推出下一代資料中心CPU設計:Chiplet設計,效能提升達240%

#我們知道,為網路和線上服務提供動力的資料中心承載著巨量的算力需求,同時也需要消耗大量電力。近幾年隨著 AI 等技術的發展,科技公司正面臨提升算力、降低能耗的挑戰,促使晶片公司專注於提升功耗效率。

目前,在資料中心晶片市場,英特爾的市佔率正一步步被 AMD 和 Ampere(前英特爾高層 Renee James 成立的新創公司)等競爭對手蠶食。

今年,Ampere 和 AMD 都已推出了自己的高效率雲端運算晶片,Arm 也在本次的 Hot Chips 2023 上提出了 Neoverse V2 平台。在競爭愈加激烈的當下,英特爾有危機感在所難免。

參考連結:
https://www.anandtech.com/show/20034/hot-chips-2023-intel-details -granite-rapids-and-sierra-forest-xeons
#https://www.reuters.com/technology/intel-says-new-sierra-forest-chip-more- than-double-power-efficiency-2023-08-28/
#

以上是英特爾推出下一代資料中心CPU設計:Chiplet設計,效能提升達240%的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:jiqizhixin.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!