阿里云容器服務ACK支持對各種異構計算資源進行統一調度和運維管理,能夠顯著提高異構計算集群資源的使用效率。本文介紹阿里云容器服務ACK支持的異構計算集群。
背景信息
隨著5G、人工智能、HPC( High Performance Computing)、邊緣計算等業務的興起,人們對算力的性能要求達到了一個新的高度,以CPU為代表的通用計算越來越不能滿足這些業務的算力需求。因此,人們逐漸將注意力轉移到以領域專有架構DSA(Domain Specific Architecture)為代表的異構計算上,各種異構計算設備(GPU、FPGA等)在這些業務領域承擔著重要的角色。
如何大規模管理這些異構計算資源成為一個比較棘手的問題。為了解決這個問題,阿里云容器服務提供一站式管理異構計算資源方案,實現對異構計算資源的統一調度和運維管理。
異構計算集群介紹
阿里云容器服務ACK支持對GPU、FPGA、ASIC和RDMA異構資源進行統一調度和運維管理,提高集群資源的使用效率。容器服務ACK支持的異構計算集群及具體功能如下。
異構資源 | 功能描述 |
GPU | 阿里云容器服務ACK支持創建帶有T4、P100、V100等市場主流GPU卡的集群。更多信息,請參見創建GPU集群和創建專有GPU集群。
|
FPGA | 阿里云容器服務ACK支持創建帶有FPGA設備的集群。更多信息,請參見創建FPGA集群。
|
ASIC | 阿里云容器服務ACK支持創建帶有NETINT ASIC設備的集群,支持以單張NETINT ASIC卡為單位申請集群資源。更多信息,請參見創建ASIC集群。 |
RDMA | 容器服務ACK支持創建帶有RDMA設備的集群。更多信息,請參見eRDMA。
|