本文介紹云服務器ECS超級計算集群實例規格族的特點,并列出了具體的實例規格。
背景信息
在閱讀各個實例規格族的特點及詳細指標之前,您需要提前學習以下信息:
了解實例規格命名及分類:幫助您更好地理解實例規格族的命名及分類信息,了解各規格族之間差異,詳參見實例規格分類與命名。
了解實例規格指標:提前了解實例規格的各項指標說明,請參見實例規格指標說明,您也可以通過調用DescribeInstanceTypeFamilies和DescribeInstanceTypes查詢阿里云ECS提供的實例規格族列表及所有實例規格的詳細信息。
根據業務場景選擇實例規格族:想獲取更多關于如何在實際業務場景中選擇合適的規格,請參見實例規格選型指導。
在確定您要選擇的實例規格之后,您可能需要進一步了解以下信息:
查看實例可購買地域:各個地域下可供售賣的實例規格可能存在差異,實例的可購情況,您可以前往ECS實例可購買地域查看,也可以調用DescribeRegions和DescribeZones查詢ECS資源支持的地域和可用區。
預估實例費用:想了解實例在不同付費方式下大概的花費,可使用阿里云的ECS價格計算器查看,也可以調用DescribePrice查詢ECS資源的最新價格。
直接購買實例:可直接前往ECS購買頁下單。
您可能還會關注:
超級計算集群介紹
超級計算集群SCC(Super Computing Cluster)在彈性裸金屬服務器基礎上,加入高速RDMA(Remote Direct Memory Access)互聯支持,大幅提升網絡性能,提高大規模集群加速比。因此SCC在提供高帶寬、低延遲優質網絡的同時,還具備彈性裸金屬服務器的所有優點。
SCC主要用于高性能計算和人工智能、機器學習、科學計算、工程計算、數據分析、音視頻處理等場景。在集群內,各節點間通過RDMA網絡互聯,提供高帶寬低延遲的網絡,保證了高性能計算和人工智能、機器學習等應用的高度并行需求。同時,RoCE(RDMA over Converged Ethernet)網絡速度達到InfiniBand網絡級別的性能,且能支持更廣泛的基于Ethernet的應用。
SCC與阿里云ECS、GPU云服務器等計算類產品一起,為阿里云彈性高性能計算平臺E-HPC提供了極高性能的并行計算資源,實現真正的云上超算。
高性能計算優化型包含以下規格族:
機型對比
SCC與物理機、虛擬機的對比如下表所示。其中,Y表示支持,N表示不支持,N/A表示無數據。
功能分類 | 功能 | SCC | 物理機 | 虛擬機 |
運維自動化 | 分鐘級交付 | Y | N | Y |
計算 | 免性能損失 | Y | Y | N |
免特性損失 | Y | Y | N | |
免資源爭搶 | Y | Y | N | |
存儲 | 完全兼容ECS云盤系統 | Y | N | Y |
使用云盤(系統盤)啟動 | Y | N | Y | |
系統盤快速重置 | Y | N | Y | |
使用云服務器ECS的鏡像 | Y | N | Y | |
物理機和虛擬機之間相互冷遷移 | Y | N | Y | |
免操作系統安裝 | Y | N | Y | |
免本地RAID,提供更高云盤數據保護 | Y | N | Y | |
網絡 | 完全兼容ECS VPC網絡 | Y | N | Y |
完全兼容ECS經典網絡 | Y | N | Y | |
物理機集群和虛擬機集群間VPC無通信瓶頸 | Y | N | Y | |
管控 | 完全兼容ECS現有管控系統 | Y | N | Y |
VNC等用戶體驗和虛擬機保持一致 | Y | N | Y | |
帶外網絡安全 | Y | N | N/A |
通用型超級計算集群實例規格族sccg7
規格族介紹:具備彈性裸金屬服務器的所有特性。更多信息,請參見彈性裸金屬服務器規格。
適用場景: 大規模機器學習訓練;大規模高性能科學計算和仿真計算;大規模數據分析、批量計算、視頻編碼。
計算:
處理器與內存配比為1:4。
處理器:2.9 GHz主頻的Intel ? Xeon ? Platinum 8369(Ice lake),全核睿頻3.5 GHz。
存儲:
I/O優化實例。
支持的云盤類型:ESSD云盤、ESSD AutoPL云盤、SSD云盤和高效云盤。
網絡:
支持IPv4、IPv6。關于IPv6通信,參見IPv6通信。
同時支持RoCE網絡和VPC網絡,其中RoCE網絡專用于RDMA通信。
sccg7包括的實例規格及指標數據如下表所示。
實例規格 | vCPU | 物理內核 | 內存(GiB) | 網絡基礎帶寬(Gbit/s) | 網絡收發包PPS | RoCE網絡(Gbit/s) | 彈性網卡 |
ecs.sccg7.32xlarge | 128 | 64 | 512.0 | 100 | 2400萬 | 200 | 32 |
如果基于CentOS 7.9或CentOS 8.4版本的自定義鏡像創建ecs.sccg7規格族的ECS實例,實例創建完成后,需要在ECS實例內手動安裝RDMA驅動。具體操作,請參見基于SCC實例規格族的RDMA驅動安裝說明。
計算型超級計算集群實例規格族sccc7
規格族介紹:具備彈性裸金屬服務器的所有特性。更多信息,請參見彈性裸金屬服務器規格。
適用場景: 大規模機器學習訓練;大規模高性能科學計算和仿真計算;大規模數據分析、批量計算、視頻編碼。
計算:
處理器與內存配比為1:2。
處理器:2.9 GHz主頻的Intel ? Xeon ? Platinum 8369(Ice lake),全核睿頻3.5 GHz。
存儲:
I/O優化實例。
支持的云盤類型:ESSD云盤、ESSD AutoPL云盤、SSD云盤和高效云盤。
網絡:
支持IPv4、IPv6。關于IPv6通信,參見IPv6通信。
同時支持RoCE網絡和VPC網絡,其中RoCE網絡專用于RDMA通信。
sccc7包括的實例規格及指標數據如下表所示。
實例規格 | vCPU | 物理內核 | 內存(GiB) | 網絡基礎帶寬(Gbit/s) | 網絡收發包PPS | RoCE網絡(Gbit/s) | 彈性網卡 |
ecs.sccc7.32xlarge | 128 | 64 | 256.0 | 100 | 2400萬 | 200 | 32 |
如果基于CentOS 7.9或CentOS 8.4版本的自定義鏡像創建ecs.sccc7規格族的ECS實例,實例創建完成后,需要在ECS實例內手動安裝RDMA驅動。具體操作,請參見基于SCC實例規格族的RDMA驅動安裝說明。
高主頻計算型超級計算集群實例規格族scchfc6
如需使用,請提交工單。
規格族介紹:具備彈性裸金屬服務器的所有特性。更多信息,請參見彈性裸金屬服務器規格。
適用場景: 大規模機器學習訓練;大規模高性能科學計算和仿真計算;大規模數據分析、批量計算、視頻編碼。
計算:
處理器與內存配比為1:2.4。
處理器:3.1 GHz主頻的Intel ? Xeon ? Platinum 8269(Cascade Lake),全核睿頻3.5 GHz。
存儲:
I/O優化實例。
支持的云盤類型:ESSD云盤、ESSD AutoPL云盤、SSD云盤和高效云盤。
網絡:
支持IPv4、IPv6。關于IPv6通信,參見IPv6通信。
同時支持RoCE網絡和VPC網絡,其中RoCE網絡專用于RDMA通信。
scchfc6包括的實例規格及指標數據如下表所示。
實例規格 | vCPU | 物理內核 | 內存(GiB) | 網絡基礎帶寬(Gbit/s) | 網絡收發包PPS | RoCE網絡(Gbit/s) | 彈性網卡 |
ecs.scchfc6.20xlarge | 80 | 40 | 192.0 | 30 | 600萬 | 50 | 32 |
ecs.scchfc6.20xlarge在40個物理內核上提供80個邏輯處理器。
高主頻通用型超級計算集群實例規格族scchfg6
如需使用,請提交工單。
規格族介紹:具備彈性裸金屬服務器的所有特性。更多信息,請參見彈性裸金屬服務器規格。
適用場景: 大規模機器學習訓練;大規模高性能科學計算和仿真計算;大規模數據分析、批量計算、視頻編碼。
計算:
處理器與內存配比為1:4.8。
處理器:3.1 GHz主頻的Intel ? Xeon ? Platinum 8269(Cascade Lake),全核睿頻3.5 GHz。
存儲:
I/O優化實例。
支持的云盤類型:ESSD云盤、ESSD AutoPL云盤、SSD云盤和高效云盤。
網絡:
支持IPv4、IPv6。關于IPv6通信,參見IPv6通信。
同時支持RoCE網絡和VPC網絡,其中RoCE網絡專用于RDMA通信。
scchfg6包括的實例規格及指標數據如下表所示。
實例規格 | vCPU | 物理內核 | 內存(GiB) | 網絡基礎帶寬(Gbit/s) | 網絡收發包PPS | RoCE網絡(Gbit/s) | 彈性網卡 |
ecs.scchfg6.20xlarge | 80 | 40 | 384.0 | 30 | 600萬 | 50 | 32 |
ecs.scchfg6.20xlarge在40個物理內核上提供80個邏輯處理器。
高主頻內存型超級計算集群實例規格族scchfr6
如需使用,請提交工單。
規格族介紹:具備彈性裸金屬服務器的所有特性。更多信息,請參見彈性裸金屬服務器規格。
適用場景: 大規模機器學習訓練;大規模高性能科學計算和仿真計算;大規模數據分析、批量計算、視頻編碼。
計算:
處理器與內存配比為1:9.6。
處理器:3.1 GHz主頻的Intel ? Xeon ? Platinum 8269(Cascade Lake),全核睿頻3.5 GHz。
存儲:
I/O優化實例。
支持的云盤類型:ESSD云盤、ESSD AutoPL云盤、SSD云盤和高效云盤。
網絡:
支持IPv4、IPv6。關于IPv6通信,參見IPv6通信。
同時支持RoCE網絡和VPC網絡,其中RoCE網絡專用于RDMA通信。
scchfr6包括的實例規格及指標數據如下表所示。
實例規格 | vCPU | 物理內核 | 內存(GiB) | 網絡基礎帶寬(Gbit/s) | 網絡收發包PPS | RoCE網絡(Gbit/s) | 彈性網卡 |
ecs.scchfr6.20xlarge | 80 | 40 | 768.0 | 30 | 600萬 | 50 | 32 |
ecs.scchfr6.20xlarge在40個物理內核上提供80個邏輯處理器。
高主頻型超級計算集群實例規格族scch5
規格族介紹:具備彈性裸金屬服務器的所有特性。更多信息,請參見彈性裸金屬服務器規格。
適用場景: 大規模機器學習訓練;大規模高性能科學計算和仿真計算;大規模數據分析、批量計算、視頻編碼。
計算:
處理器與內存配比為1:3
處理器:3.1 GHz主頻的Intel ? Xeon ? Gold 6149(Skylake)
存儲:
I/O優化實例
支持的云盤類型:SSD云盤和高效云盤。
網絡:
僅支持IPv4。
同時支持RoCE網絡和VPC網絡,其中RoCE網絡專用于RDMA通信。
scch5包括的實例規格及指標數據如下表所示。
實例規格 | vCPU | 物理內核 | 內存(GiB) | 網絡基礎帶寬(Gbit/s) | 網絡收發包PPS | RoCE網絡(Gbit/s) | 彈性網卡 |
ecs.scch5.16xlarge | 64 | 32 | 192.0 | 10 | 450萬 | 50 | 32 |
ecs.scch5.16xlarge在32個物理內核上提供64個邏輯處理器。
GPU計算型超級計算集群實例規格族sccgn7ex
規格族介紹:sccgn7ex是阿里云為了面對日益增長的大規模AI訓練需求開發的高帶寬超算集群實例。多臺裸金屬服務器之間采用第三代RDMA SCC網絡互聯,支持800 G的互聯帶寬。您可以根據訓練需求彈性選擇線上集群數量,快速滿足大規模AI參數訓練的需求。
適用場景:超大規模AI訓練場景。
計算:
支持NVSwitch,算力高達312T(TF32)。
處理器與內存配比為1:8。
處理器:采用第三代Intel? Xeon? 8369可擴展處理器(Ice Lake),基頻2.9 GHz,全核睿頻3.5 GHz,支持PCIe 4.0接口。
存儲:
I/O優化實例
僅支持ESSD云盤和ESSD AutoPL云盤
網絡:
支持IPv4、IPv6。關于IPv6通信,參見IPv6通信。
僅支持專有網絡VPC。
超高網絡性能,2400萬PPS網絡收發包能力。
sccgn7ex實例間支持800 Gbit/s的互聯帶寬(4 * 雙口100 Gbit/s RDMA),支持GPUDirect,每顆GPU直連一個100 Gbit/s網口。
sccgn7ex包括的實例規格及指標數據如下表所示。
實例規格 | vCPU | 內存(GiB) | GPU顯存(GB) | 網絡基礎帶寬(Gbit/s) | 網絡收發包PPS | RoCE網絡(Gbit/s) | 彈性網卡 |
ecs.sccgn7ex.32xlarge | 128 | 1024 | 80 GB * 8 | 64 | 2400萬 | 800 | 32 |
計費方式
SCC支持按量付費和包年包月。不同計費方式的區別,請參見計費方式概述。