集群概述
更新時(shí)間:
集群是運(yùn)行高性能計(jì)算的節(jié)點(diǎn)集合,可以提供單節(jié)點(diǎn)不能提供的強(qiáng)大計(jì)算能力,擁有高性能、彈性擴(kuò)展、穩(wěn)定可靠等優(yōu)點(diǎn)。本文介紹集群的定義、E-HPC支持的集群類型和組成部分,以及集群相關(guān)的功能。
支持的集群類型
E-HPC集群根據(jù)部署環(huán)境、集群架構(gòu)、調(diào)度器等分為以下幾種:
部署模式 | 系列 | 說明 | 創(chuàng)建集群文檔 |
公共云 | 標(biāo)準(zhǔn)版 | 由ECS實(shí)例組成的云上HPC集群,創(chuàng)建集群后,E-HPC會安裝調(diào)度器、服務(wù)組件等,您需要自行維護(hù)集群服務(wù)可用性。 根據(jù)調(diào)度器類型可分為以下幾種:
| |
托管版 | 由ECS實(shí)例組成的云上HPC托管集群,管理節(jié)點(diǎn)由E-HPC負(fù)責(zé)維護(hù)。調(diào)度器為Slurm,計(jì)算節(jié)點(diǎn)為ECS實(shí)例。 |
如何選擇集群類型?
您可以參考以下幾種使用場景,判斷需要創(chuàng)建的集群類型,以便更好地滿足業(yè)務(wù)需求。
如果您期望從零開始搭建HPC集群,可以選擇創(chuàng)建標(biāo)準(zhǔn)版集群。
如果您希望由E-HPC負(fù)責(zé)管理節(jié)點(diǎn)的維護(hù),可以選擇創(chuàng)建托管版集群。
管理集群
自動化部署集群環(huán)境:
管理集群資源:
管理集群用戶:用戶管理
作業(yè)調(diào)度
文檔內(nèi)容是否對您有幫助?