創(chuàng)建和管理節(jié)點(diǎn)池
ACK提供了節(jié)點(diǎn)池功能對節(jié)點(diǎn)進(jìn)行分組管理。節(jié)點(diǎn)池是具有相同屬性(例如實(shí)例規(guī)格、操作系統(tǒng)、標(biāo)簽和污點(diǎn)等)的一組節(jié)點(diǎn)的邏輯集合。一個集群中可以創(chuàng)建多個不同配置和類型的節(jié)點(diǎn)池。節(jié)點(diǎn)池的配置包含節(jié)點(diǎn)的屬性,例如節(jié)點(diǎn)實(shí)例規(guī)格、可用區(qū)、操作系統(tǒng)、標(biāo)簽和污點(diǎn)等。您可以創(chuàng)建節(jié)點(diǎn)池,并在節(jié)點(diǎn)池維度對節(jié)點(diǎn)進(jìn)行統(tǒng)一的運(yùn)維和管理。
建議您在創(chuàng)建節(jié)點(diǎn)池前,先參見節(jié)點(diǎn)池概述了解節(jié)點(diǎn)池的基本信息、使用場景、相關(guān)功能、涉及的計(jì)費(fèi)等信息。
操作入口
您可以在目標(biāo)集群的節(jié)點(diǎn)池頁面進(jìn)行節(jié)點(diǎn)池的相關(guān)操作,包括創(chuàng)建、編輯、刪除、查看等。
登錄容器服務(wù)管理控制臺,在左側(cè)導(dǎo)航欄選擇集群。
在集群列表頁面,單擊目標(biāo)集群名稱,然后在左側(cè)導(dǎo)航欄,選擇 。
創(chuàng)建節(jié)點(diǎn)池
您可以在控制臺完成節(jié)點(diǎn)池的配置,包括基本配置、網(wǎng)絡(luò)配置、存儲配置等。部分配置項(xiàng)(尤其是節(jié)點(diǎn)池可用性相關(guān)和網(wǎng)絡(luò)相關(guān)的配置)在創(chuàng)建后不支持調(diào)整,請參見下文重點(diǎn)關(guān)注。創(chuàng)建節(jié)點(diǎn)池的過程中不會影響其他已有節(jié)點(diǎn)池內(nèi)節(jié)點(diǎn)和業(yè)務(wù)的運(yùn)行。
除控制臺外,ACK還支持通過API和Terraform方式創(chuàng)建節(jié)點(diǎn)池,請參見CreateClusterNodePool - 創(chuàng)建節(jié)點(diǎn)池、通過Terraform創(chuàng)建具備自動伸縮功能的節(jié)點(diǎn)池。
在節(jié)點(diǎn)池頁面,單擊創(chuàng)建節(jié)點(diǎn)池,然后在創(chuàng)建節(jié)點(diǎn)池對話框,完成創(chuàng)建節(jié)點(diǎn)池的配置項(xiàng)。
節(jié)點(diǎn)池創(chuàng)建完成以后,支持在編輯節(jié)點(diǎn)池頁面修改配置項(xiàng)。如下表所示,是否支持修改代表節(jié)點(diǎn)池創(chuàng)建后對應(yīng)的配置項(xiàng)是否支持修改,代表不支持修改,代表支持修改,不涉及代表配置項(xiàng)僅在創(chuàng)建節(jié)點(diǎn)池時(shí)展示。
基本配置
配置項(xiàng)
說明
是否支持修改
節(jié)點(diǎn)池名稱
自定義的節(jié)點(diǎn)池名稱。
不涉及
地域
默認(rèn)選擇當(dāng)前集群所在地域,且不可更改。
加密計(jì)算
說明當(dāng)前僅白名單用戶可以配置加密計(jì)算,請提交工單申請。
僅容器運(yùn)行時(shí)選擇為containerd時(shí),需配置該參數(shù)。
是否開啟加密計(jì)算。加密計(jì)算是為有強(qiáng)安全訴求的用戶提供基于硬件加密技術(shù)的云原生一站式機(jī)密計(jì)算容器平臺,可以幫助您保護(hù)數(shù)據(jù)使用(計(jì)算)過程中的安全性、完整性和機(jī)密性,同時(shí)簡化可信或機(jī)密應(yīng)用的開發(fā)、交付和管理成本。更多信息,請參見ACK-TEE機(jī)密計(jì)算介紹。
不涉及
容器運(yùn)行時(shí)
根據(jù)集群Kubernetes版本選擇容器運(yùn)行時(shí)。如何選型,請參見containerd、安全沙箱、Docker運(yùn)行時(shí)的對比。
containerd(推薦):支持所有版本的集群。
安全沙箱:支持1.31及以下版本的集群。
Docker(已停止支持):支持1.22及以下版本的集群。
托管節(jié)點(diǎn)池相關(guān)配置
托管節(jié)點(diǎn)池
ACK將在維護(hù)窗口期內(nèi)執(zhí)行托管節(jié)點(diǎn)池的自動化運(yùn)維操作,例如kubelet升級、運(yùn)行時(shí)升級、OS CVE漏洞自動修復(fù)等。您可以單擊設(shè)置,配置具體的維護(hù)策略。
自愈規(guī)則
需開啟托管節(jié)點(diǎn)池。
勾選后,節(jié)點(diǎn)NotReady時(shí),系統(tǒng)會嘗試自動重啟相關(guān)組件來修復(fù)故障節(jié)點(diǎn),并在重啟前執(zhí)行排水。
自動升級規(guī)則
需開啟托管節(jié)點(diǎn)池。
勾選后,系統(tǒng)會在有可用的kubelet版本時(shí)自動升級到該版本。更多信息,請參見升級節(jié)點(diǎn)池。
自動修復(fù) CVE(OS)
需開啟托管節(jié)點(diǎn)池。
可配置自動修復(fù)漏洞的級別,包括高危、中危、低危漏洞。更多信息,請參見開啟節(jié)點(diǎn)池節(jié)點(diǎn)故障自動恢復(fù)、修復(fù)節(jié)點(diǎn)池操作系統(tǒng)CVE漏洞。
有些漏洞修復(fù)完成后需要重啟服務(wù)器來使其修復(fù)生效。開啟必要時(shí)重啟節(jié)點(diǎn)以修復(fù) CVE 漏洞后,ACK會按需自動重啟節(jié)點(diǎn);未開啟時(shí),需在修復(fù)完成后手動重啟節(jié)點(diǎn)。
集群維護(hù)窗口
需開啟托管節(jié)點(diǎn)池。
托管節(jié)點(diǎn)池將在維護(hù)窗口進(jìn)行自動化升級,例如節(jié)點(diǎn)池鏡像升級、運(yùn)行時(shí)升級、Kubernetes版本等。
單擊設(shè)置,在集群維護(hù)窗口對話框,設(shè)置維護(hù)周期、維護(hù)起始時(shí)間以及維護(hù)時(shí)長,然后單擊確定。
擴(kuò)容模式
支持手動擴(kuò)容和自動伸縮兩種擴(kuò)容方式,根據(jù)業(yè)務(wù)需求和策略自動調(diào)整計(jì)算資源,節(jié)省集群成本。
手動擴(kuò)容:ACK會根據(jù)配置的期望節(jié)點(diǎn)數(shù)調(diào)整節(jié)點(diǎn)池中的節(jié)點(diǎn)數(shù),將節(jié)點(diǎn)數(shù)始終維持在期望節(jié)點(diǎn)數(shù)。更多信息,請參見手動擴(kuò)縮容節(jié)點(diǎn)池。
自動伸縮:當(dāng)集群的容量規(guī)劃無法滿足應(yīng)用Pod調(diào)度時(shí),ACK會根據(jù)配置的最小和最大實(shí)例數(shù)自動擴(kuò)縮節(jié)點(diǎn)資源。1.24及以上版本的集群默認(rèn)啟用節(jié)點(diǎn)即時(shí)彈性;1.24以下版本的集群默認(rèn)啟用節(jié)點(diǎn)自動伸縮。更多信息,請參見節(jié)點(diǎn)伸縮概述。
網(wǎng)絡(luò)配置
配置項(xiàng)
說明
是否支持修改
網(wǎng)絡(luò)配置
專有網(wǎng)絡(luò)
默認(rèn)選擇集群VPC,節(jié)點(diǎn)池創(chuàng)建完成后不可更改。
交換機(jī)
節(jié)點(diǎn)池的擴(kuò)縮容將根據(jù)擴(kuò)縮容策略,在選擇的虛擬交換機(jī)可用區(qū)下彈出節(jié)點(diǎn)。您可以在已有虛擬交換機(jī)列表中,根據(jù)可用區(qū)選擇交換機(jī)。
如果沒有您需要的交換機(jī),可以單擊創(chuàng)建虛擬交換機(jī)創(chuàng)建。具體操作,請參見創(chuàng)建和管理交換機(jī)。
實(shí)例和鏡像配置
配置項(xiàng)
說明
是否支持修改
付費(fèi)類型
節(jié)點(diǎn)池?cái)U(kuò)容ECS實(shí)例時(shí)默認(rèn)采用的付費(fèi)類型,支持按量付費(fèi)、包年包月和搶占式實(shí)例。
包年包月:需配置購買時(shí)長以及自動續(xù)費(fèi)。
搶占式實(shí)例:目前僅支持具有保護(hù)期的搶占式實(shí)例。需同時(shí)配置單臺實(shí)例上限價(jià)格。
當(dāng)指定實(shí)例規(guī)格的實(shí)時(shí)市場價(jià)格低于單臺實(shí)例上限價(jià)格時(shí),能成功創(chuàng)建搶占式實(shí)例。超過保護(hù)期后(1小時(shí)),每5分鐘檢測一次實(shí)例規(guī)格的實(shí)時(shí)市場價(jià)格和庫存。如果某一時(shí)刻的市場價(jià)格高于出價(jià)或?qū)嵗?guī)格庫存不足,搶占式實(shí)例會被釋放。使用方式,請參見搶占式實(shí)例節(jié)點(diǎn)池最佳實(shí)踐。
為保證節(jié)點(diǎn)池統(tǒng)一,按量付費(fèi)、包年包月節(jié)點(diǎn)池與搶占式實(shí)例節(jié)點(diǎn)池之間不支持轉(zhuǎn)換。例如,對于創(chuàng)建節(jié)點(diǎn)池時(shí)選擇付費(fèi)類型為按量付費(fèi)或包年包月的節(jié)點(diǎn)池,編輯節(jié)點(diǎn)池時(shí)不展示搶占式實(shí)例;反之亦然。
重要修改節(jié)點(diǎn)池的付費(fèi)類型僅對擴(kuò)容的新節(jié)點(diǎn)生效,不會改變節(jié)點(diǎn)池內(nèi)已有節(jié)點(diǎn)的付費(fèi)類型。如果您期望修改節(jié)點(diǎn)池中已有節(jié)點(diǎn)的付費(fèi)類型,請參見按量付費(fèi)轉(zhuǎn)包年包月。
為保證節(jié)點(diǎn)池的統(tǒng)一,不支持按量付費(fèi)、包年包月節(jié)點(diǎn)池修改為搶占式實(shí)例節(jié)點(diǎn)池;也不支持搶占式實(shí)例節(jié)點(diǎn)池修改為按量付費(fèi)、包年包月節(jié)點(diǎn)池。
實(shí)例相關(guān)的配置項(xiàng)
根據(jù)實(shí)例規(guī)格或?qū)傩赃x擇Worker節(jié)點(diǎn)池使用的ECS實(shí)例,可通過vCPU、內(nèi)存、規(guī)格族、架構(gòu)等屬性篩選所需的實(shí)例規(guī)格族。您可以參見ECS實(shí)例規(guī)格配置建議獲取節(jié)點(diǎn)的配置建議。
節(jié)點(diǎn)池?cái)U(kuò)容時(shí),將從選中的實(shí)例規(guī)格中擴(kuò)容。具體擴(kuò)容到的實(shí)例規(guī)格取決于節(jié)點(diǎn)池?cái)U(kuò)縮容策略。選擇的實(shí)例規(guī)格越多,節(jié)點(diǎn)池成功彈出節(jié)點(diǎn)的概率越大。
由于實(shí)例規(guī)格不可用或庫存不足,導(dǎo)致節(jié)點(diǎn)池彈出節(jié)點(diǎn)失敗時(shí),可以嘗試添加更多實(shí)例規(guī)格。您可以參照控制臺的彈性強(qiáng)度建議添加實(shí)例規(guī)格,也可以創(chuàng)建節(jié)點(diǎn)池后查看節(jié)點(diǎn)池彈性強(qiáng)度。
如果您選擇的實(shí)例均為GPU服務(wù)器,您可以按需開啟共享 GPU 調(diào)度。更多信息,請參見共享GPU調(diào)度概述。
操作系統(tǒng)
云市場鏡像處于灰度發(fā)布中。
公共鏡像:容器服務(wù) Kubernetes 版提供的ContainerOS、Alibaba Cloud Linux 3、Ubuntu、Windows等操作系統(tǒng)的公共鏡像。詳細(xì)信息請參見操作系統(tǒng)。
自定義鏡像:使用自定義操作系統(tǒng)鏡像,詳細(xì)信息請參見如何基于創(chuàng)建好的ECS實(shí)例創(chuàng)建自定義鏡像,并使用該鏡像創(chuàng)建節(jié)點(diǎn)?。
云市場鏡像:使用阿里云云市場鏡像。
說明修改節(jié)點(diǎn)池系統(tǒng)鏡像時(shí),僅影響新增節(jié)點(diǎn),不會修改節(jié)點(diǎn)池已有節(jié)點(diǎn)的系統(tǒng)鏡像。已有節(jié)點(diǎn)的系統(tǒng)鏡像升級,請參見升級節(jié)點(diǎn)池。
為保證節(jié)點(diǎn)池內(nèi)節(jié)點(diǎn)系統(tǒng)鏡像的統(tǒng)一,修改節(jié)點(diǎn)池鏡像時(shí),僅允許修改為同類型鏡像的最新版本,不支持更改鏡像類型。
安全加固
為集群開啟安全加固。創(chuàng)建完成后,加固方案不支持轉(zhuǎn)換。
不開啟:對ECS實(shí)例不進(jìn)行安全加固。
等保加固:阿里云為Alibaba Cloud Linux 2和Alibaba Cloud Linux 3等保2.0三級版鏡像提供等保合規(guī)的基線檢查標(biāo)準(zhǔn)和掃描程序。等保加固在保障原生鏡像兼容性和性能的基礎(chǔ)上進(jìn)行了等保合規(guī)適配,使其滿足國家信息安全部發(fā)布的《GB/T22239-2019信息安全技術(shù)網(wǎng)絡(luò)安全等級保護(hù)基本要求》。更多信息,請參見ACK等保加固使用說明。
重要等保加固會禁止Root用戶通過SSH遠(yuǎn)程登錄。您可通過ECS控制臺使用VNC方式登錄系統(tǒng)創(chuàng)建可使用SSH的普通用戶。具體操作,請參見使用VNC登錄實(shí)例。
阿里云 OS 加固:僅當(dāng)系統(tǒng)鏡像選擇Alibaba Cloud Linux 2或Alibaba Cloud Linux 3時(shí),可為節(jié)點(diǎn)開啟阿里云OS加固。
不涉及
登錄方式
選擇等保加固時(shí),僅支持設(shè)置密碼。
支持設(shè)置密鑰、設(shè)置密碼和創(chuàng)建后設(shè)置。
創(chuàng)建時(shí)設(shè)置:
設(shè)置密鑰:阿里云SSH密鑰對是一種安全便捷的登錄認(rèn)證方式,由公鑰和私鑰組成,僅支持Linux實(shí)例。
請同步配置登錄名(root登錄或ecs-user登錄)和所需的密鑰對。
設(shè)置密碼:密碼限制為8~30個字符,且必須同時(shí)包含大寫字母、小寫字母、數(shù)字和特殊符號。
請同步配置登錄名(root登錄或ecs-user登錄)和密碼。
創(chuàng)建后設(shè)置:在實(shí)例創(chuàng)建完成后,自行綁定密鑰對或者重置實(shí)例密碼。具體操作,請參見綁定SSH密鑰對和重置實(shí)例登錄密碼。
不涉及
登錄名
當(dāng)登錄方式選擇設(shè)置密鑰或者設(shè)置密碼時(shí),需按需選擇以root登錄還是以ecs-user登錄。
不涉及
存儲配置
配置項(xiàng)
說明
是否支持修改
系統(tǒng)盤
支持ESSD AutoPL、ESSD云盤、ESSD Entry、SSD云盤和高效云盤。系統(tǒng)盤可選的類型與選擇的實(shí)例規(guī)格族相關(guān)。如果云盤類型下拉列表沒有顯示的云盤類型,代表不支持該云盤類型。
ESSD云盤支持自定義性能級別。ESSD云盤容量越大,可供選擇的性能級別越高(460 GiB容量以上可選PL2,1260 GiB以上可選PL3)。更多信息,請參見容量范圍與性能級別的關(guān)系。
創(chuàng)建系統(tǒng)盤時(shí),僅ESSD云盤支持加密。選擇密鑰時(shí),阿里云默認(rèn)使用服務(wù)密鑰(Default Service CMK)進(jìn)行加密,您也可以選擇事先在KMS服務(wù)中創(chuàng)建好的自定義密鑰(BYOK)為該云盤加密。
您可以選擇配置更多系統(tǒng)盤類型,配置與系統(tǒng)盤不同的磁盤類型,提高擴(kuò)容成功率。創(chuàng)建實(shí)例時(shí),系統(tǒng)將根據(jù)指定的磁盤類型順序,選擇第一個匹配的磁盤類型用于創(chuàng)建實(shí)例。
數(shù)據(jù)盤
支持ESSD AutoPL、ESSD云盤、ESSD Entry以及上一代云盤(SSD云盤和高效云盤)。數(shù)據(jù)盤可選的類型與選擇的實(shí)例規(guī)格族相關(guān)。如果云盤類型下拉列表沒有顯示的云盤類型,代表不支持該云盤類型。
預(yù)配置性能:在保持存儲容量大小不變的情況下,可以結(jié)合實(shí)際業(yè)務(wù)的需求量靈活配置云盤的預(yù)配置性能,從而實(shí)現(xiàn)云盤容量與性能解耦。
性能突發(fā):開啟后,波動性業(yè)務(wù)面臨突發(fā)的數(shù)據(jù)讀寫壓力時(shí),云盤會根據(jù)業(yè)務(wù)實(shí)際情況臨時(shí)提升云盤性能,直至業(yè)務(wù)恢復(fù)至平穩(wěn)狀態(tài)。
自定義性能級別。ESSD云盤容量越大,可供選擇的性能級別越高(460 GiB容量以上可選PL2,1260 GiB以上可選PL3)。更多信息,請參見容量范圍與性能級別的關(guān)系。
掛載數(shù)據(jù)盤時(shí),所有云盤類型均支持加密。選擇密鑰時(shí),阿里云默認(rèn)使用服務(wù)密鑰(Default Service CMK)進(jìn)行加密,您也可以選擇事先在KMS服務(wù)中創(chuàng)建好的自定義密鑰(BYOK)為該云盤進(jìn)行加密。
在需要容器鏡像加速、大模型快速加載等場景下,您還可以使用快照創(chuàng)建數(shù)據(jù)盤,提升系統(tǒng)的響應(yīng)速度和處理能力。
每個節(jié)點(diǎn)上需有一塊數(shù)據(jù)盤被掛載到
/var/lib/container
(/var/lib/kubelet
、/var/lib/containerd
將掛載到/var/lib/container
目錄下)。對于節(jié)點(diǎn)上的其他數(shù)據(jù)盤,您可以進(jìn)行初始化設(shè)置,自定義其掛載目錄。使用說明,請參見ACK節(jié)點(diǎn)池中數(shù)據(jù)盤可以自定義目錄掛載嗎?
說明一臺ECS實(shí)例最多可掛載64塊數(shù)據(jù)盤,不同實(shí)例規(guī)格支持掛載的云盤數(shù)量上限不同。實(shí)例規(guī)格支持掛載的云盤數(shù)量上限,可以通過DescribeInstanceTypes接口查詢(DiskQuantity)。
彈性臨時(shí)盤
白名單功能,請提交工單申請。
彈性臨時(shí)盤用于臨時(shí)數(shù)據(jù)存儲,為ECS實(shí)例提供臨時(shí)數(shù)據(jù)存儲空間,具備高性能、高性價(jià)比等特點(diǎn)。典型使用場景如下。
臨時(shí)數(shù)據(jù)存儲
適用于在本地盤存放臨時(shí)數(shù)據(jù),例如臨時(shí)計(jì)算中間結(jié)果、緩存數(shù)據(jù)、臨時(shí)文件等。
高性能計(jì)算
對IOPS(數(shù)十萬到百萬)和吞吐量(數(shù)百M(fèi)B/s至數(shù)GB/s)要求高的計(jì)算任務(wù),彈性臨時(shí)盤可以提供高性能的臨時(shí)存儲支持。
臨時(shí)彈性盤僅支持在部分地域和部分ECS實(shí)例規(guī)格中使用,請參見地域限制、實(shí)例規(guī)格限制。
您可以選擇是否對彈性臨時(shí)盤進(jìn)行初始化設(shè)置,自定義其掛載目錄。
實(shí)例數(shù)量
配置項(xiàng)
說明
是否支持修改
期望節(jié)點(diǎn)數(shù)
節(jié)點(diǎn)池應(yīng)該維持的總節(jié)點(diǎn)數(shù)量,建議至少配置2個節(jié)點(diǎn),以確保集群組件正常運(yùn)行。您可以通過調(diào)整期望節(jié)點(diǎn)數(shù),達(dá)到擴(kuò)容或縮容節(jié)點(diǎn)池的目的,請參見擴(kuò)縮容節(jié)點(diǎn)池。
如無需創(chuàng)建節(jié)點(diǎn),可填寫為0,后續(xù)再手動調(diào)整,增加節(jié)點(diǎn)數(shù)。
高級配置
展開高級選項(xiàng)(選填),配置節(jié)點(diǎn)擴(kuò)縮容策略、資源組、ECS標(biāo)簽、污點(diǎn)等信息。
配置項(xiàng)
說明
是否支持修改
資源組
創(chuàng)建的集群將歸屬于選擇的資源組。一個資源只能歸屬于一個資源組。根據(jù)不同的業(yè)務(wù)場景,您可以將資源組映射為項(xiàng)目、應(yīng)用或組織等概念。
不涉及
擴(kuò)縮容策略
優(yōu)先級策略:根據(jù)集群配置的虛擬交換機(jī)的優(yōu)先級進(jìn)行擴(kuò)縮容(選擇的虛擬交換機(jī)的順序,由上到下優(yōu)先級遞減)。當(dāng)優(yōu)先級較高的虛擬交換機(jī)所在可用區(qū)無法創(chuàng)建ECS實(shí)例時(shí),自動使用下一優(yōu)先級的虛擬交換機(jī)創(chuàng)建ECS實(shí)例。
成本優(yōu)化策略:按vCPU單價(jià)從低到高嘗試創(chuàng)建實(shí)例。
當(dāng)節(jié)點(diǎn)池付費(fèi)類型為搶占式實(shí)例時(shí),將優(yōu)先創(chuàng)建搶占式計(jì)費(fèi)實(shí)例。支持同時(shí)配置按量實(shí)例所占比例(%),當(dāng)搶占式計(jì)費(fèi)實(shí)例規(guī)格因庫存等原因無法創(chuàng)建時(shí),自動使用按量付費(fèi)實(shí)例來補(bǔ)充。
均衡分布策略:只有設(shè)置多個專有網(wǎng)絡(luò)交換機(jī)時(shí),均衡分布策略才能生效。在伸縮組指定的多可用區(qū)(即指定多個專有網(wǎng)絡(luò)交換機(jī))之間均勻分配ECS實(shí)例。如果由于庫存不足等原因造成可用區(qū)之間不平衡,您可以再次進(jìn)行均衡操作,以平衡資源的可用區(qū)分布。
使用按量實(shí)例補(bǔ)充搶占式容量
需同時(shí)選擇付費(fèi)類型為搶占式實(shí)例。
開啟后,如果因價(jià)格或庫存等原因無法創(chuàng)建足夠的搶占式實(shí)例,ACK將自動嘗試創(chuàng)建按量實(shí)例,以滿足ECS實(shí)例數(shù)量要求。
開啟搶占式實(shí)例補(bǔ)償
需同時(shí)選擇付費(fèi)類型為搶占式實(shí)例。
開啟后,當(dāng)收到搶占式實(shí)例將被回收的系統(tǒng)消息時(shí)(即搶占式實(shí)例被回收前5分鐘左右),開啟彈性的節(jié)點(diǎn)池將嘗試創(chuàng)建新的實(shí)例,替換掉將被回收的搶占式實(shí)例。
ECS 標(biāo)簽
為彈出的ECS添加標(biāo)簽,標(biāo)簽鍵不可重復(fù)。最大長度為128個字符,標(biāo)簽鍵和標(biāo)簽值不能以
aliyun
、acs:
開頭,不能包含https://
、http://
。一臺ECS可綁定標(biāo)簽的上限為20個。如需提高上限,請到配額平臺提交申請。由于ACK和ESS存在以下標(biāo)簽占用,因此最多可指定17個ECS標(biāo)簽。
ACK默認(rèn)占用兩個ECS標(biāo)簽。
ack.aliyun.com:<您的集群ID>
ack.alibabacloud.com/nodepool-id:<您的節(jié)點(diǎn)池ID>
ESS默認(rèn)占用1個ECS標(biāo)簽:
acs:autoscaling:scalingGroupId:<您的節(jié)點(diǎn)池伸縮組ID>
。
說明開啟彈性伸縮后,因彈性伸縮將默認(rèn)占用兩個ECS標(biāo)簽,因此節(jié)點(diǎn)池會額外占用兩個ECS標(biāo)簽:
k8s.io/cluster-autoscaler:true
和k8s.aliyun.com:true
。自動伸縮組件為了預(yù)檢測彈出節(jié)點(diǎn)的調(diào)度行為,需依靠ECS標(biāo)簽記錄K8s的節(jié)點(diǎn)標(biāo)簽和污點(diǎn)。因此,節(jié)點(diǎn)的每個標(biāo)簽都會被轉(zhuǎn)為
k8s.io/cluster-autoscaler/node-template/label/標(biāo)簽鍵:標(biāo)簽值
;節(jié)點(diǎn)的每個污點(diǎn)會被轉(zhuǎn)為k8s.io/cluster-autoscaler/node-template/taint/污點(diǎn)鍵/污點(diǎn)值:污點(diǎn)效果
。
污點(diǎn) (Taints)
為節(jié)點(diǎn)添加污點(diǎn),污點(diǎn)(Taints)包含鍵、值和Effect(效果)。有效污點(diǎn)鍵包含前綴(可選)和名稱。如果有前綴,用正斜線(/)分隔。更多信息,請參見污點(diǎn)和容忍度。污點(diǎn)有以下限制:
鍵:污點(diǎn)鍵的名稱長度為1~63個字符,必須以字母、數(shù)字或字符
[a-z0-9A-Z]
開頭和結(jié)尾,中間可包含字母、數(shù)字、短劃線(-)、下劃線(_)、英文半角句號(.)。如果指定前綴,必須是DNS子域。即一系列由英文半角句號(.)分隔的DNS標(biāo)簽,不超過253個字符,并以正斜線(/)結(jié)尾。關(guān)于DNS子域,請參見DNS子域。
值:污點(diǎn)值可以為空,不超過63個字符,必須以字母、數(shù)字或字符
[a-z0-9A-Z]
開頭和結(jié)尾,可包含字母、數(shù)字、短劃線(-)、下劃線(_)、英文半角句號(.)。Effect:可選擇NoSchedule、NoExecute、PreferNoSchedule三種。
NoSchedule:如果污點(diǎn)中存在至少一個Effect值為NoSchedule的污點(diǎn),則系統(tǒng)不會將Pod分配到該節(jié)點(diǎn)。
NoExecute:任何不能忍受這個污點(diǎn)的Pod都會被驅(qū)逐,任何可以忍受這個污點(diǎn)的Pod都不會被驅(qū)逐。
PreferNoSchedule:系統(tǒng)會盡量避免將Pod調(diào)度到存在其不能容忍污點(diǎn)的節(jié)點(diǎn)上,但不會強(qiáng)制執(zhí)行。
節(jié)點(diǎn)標(biāo)簽(Labels)
為節(jié)點(diǎn)添加標(biāo)簽,標(biāo)簽是鍵值(Key-Value)對。有效Key包含前綴(可選)和名稱,如有前綴,前綴和名稱之間用正斜線(/)分隔。標(biāo)簽有以下限制。
Key:名稱長度為1~63個字符,必須以字母數(shù)字字符
[a-z0-9A-Z]
開頭和結(jié)尾,中間可包含字母、數(shù)字、短劃線(-)、下劃線(_)、英文半角句號(.)。如果指定前綴,必須是DNS子域,即一系列由英文半角句號(.)分隔的DNS標(biāo)簽,不超過253個字符,以正斜線(/)結(jié)尾。
kubernetes.io/
k8s.io/
以
kubernetes.io/
和k8s.io/
結(jié)尾的前綴。例如test.kubernetes.io/
。以下除外:
kubelet.kubernetes.io/
node.kubernetes.io
以
kubelet.kubernetes.io/
結(jié)尾的前綴。以
node.kubernetes.io
結(jié)尾的前綴。
Value:可以為空,不超過63個字符,必須以字母數(shù)字字符
[a-z0-9A-Z]
開頭和結(jié)尾,可包含字母、數(shù)字、短劃線(-)、下劃線(_)和英文半角句號(.)。
CPU Policy
指定kubelet節(jié)點(diǎn)的CPU管理策略。
不涉及
自定義節(jié)點(diǎn)名稱
是否開啟自定義節(jié)點(diǎn)名稱。自定義節(jié)點(diǎn)名稱后,將同時(shí)更改節(jié)點(diǎn)名稱、ECS實(shí)例名稱、ECS實(shí)例Hostname。
說明對于開啟自定義節(jié)點(diǎn)名稱的Windows實(shí)例,其Hostname固定為IP地址,使用
-
代替IP地址中的.
,且不包含前綴和后綴。節(jié)點(diǎn)名稱由前綴、節(jié)點(diǎn)IP地址及后綴三部分組成:
總長度為2-64個字符。節(jié)點(diǎn)名稱首尾必須為小寫字母和數(shù)字。
前綴和后綴允許使用大小寫字母、數(shù)字、連字符(-)和點(diǎn)號(.)。必須以大小寫字母開頭,不能以連字符(-)或點(diǎn)號(.)開頭或結(jié)尾。不能連續(xù)使用連字符(-)或點(diǎn)號(.)。
前綴必選(ECS限制),后綴可選。
例如:節(jié)點(diǎn)IP地址為192.XX.YY.55,指定前綴為aliyun.com,后綴為test。
如果節(jié)點(diǎn)為Linux節(jié)點(diǎn),則節(jié)點(diǎn)名稱、ECS實(shí)例、ECS實(shí)例Hostname均為aliyun.com192.XX.YY.55test。
如果節(jié)點(diǎn)為Windows節(jié)點(diǎn),則ECS實(shí)例Hostname為192-XX-YY-55,節(jié)點(diǎn)名稱、ECS實(shí)例名稱均為aliyun.com192.XX.YY.55test。
Worker RAM 角色
僅支持1.22及以上版本的ACK托管集群
在節(jié)點(diǎn)池的維度指定一個Worker RAM角色,降低在集群所有節(jié)點(diǎn)中共用一個Worker RAM角色可能存在的風(fēng)險(xiǎn)。
默認(rèn)角色:使用集群默認(rèn)創(chuàng)建的Worker RAM角色。
自定義:節(jié)點(diǎn)池將使用指定的角色作為Worker RAM角色,為空時(shí)將使用默認(rèn)角色。更多信息,請參見使用自定義Worker RAM角色。
不涉及
實(shí)例預(yù)自定義數(shù)據(jù)
請前往配額平臺申請
節(jié)點(diǎn)加入集群前,將運(yùn)行您指定的實(shí)例預(yù)自定義數(shù)據(jù)腳本。關(guān)于User-Data腳本,請參見User-Data腳本。
例如,指定實(shí)例預(yù)自定義數(shù)據(jù)為
echo "hello world"
,則節(jié)點(diǎn)實(shí)際運(yùn)行腳本如下。#!/bin/bash echo "hello world" [節(jié)點(diǎn)初始化腳本]
實(shí)例自定義數(shù)據(jù)
節(jié)點(diǎn)加入集群后,將運(yùn)行您指定的實(shí)例自定義數(shù)據(jù)腳本。關(guān)于User-Data腳本,請參見User-Data腳本。
例如,指定實(shí)例自定義數(shù)據(jù)為
echo "hello world"
,則節(jié)點(diǎn)實(shí)際運(yùn)行腳本如下。#!/bin/bash [節(jié)點(diǎn)初始化腳本] echo "hello world"
說明創(chuàng)建集群或擴(kuò)容節(jié)點(diǎn)成功不代表實(shí)例自定義腳本執(zhí)行成功。您可以登錄節(jié)點(diǎn)執(zhí)行
grep cloud-init /var/log/messages
命令查看執(zhí)行日志。云監(jiān)控插件
安裝后,可在云監(jiān)控控制臺查看所創(chuàng)建ECS實(shí)例的監(jiān)控信息。
該選項(xiàng)僅對節(jié)點(diǎn)池新增節(jié)點(diǎn)生效,對節(jié)點(diǎn)池已有節(jié)點(diǎn)無效。已有節(jié)點(diǎn)如需安裝云監(jiān)控插件,請通過云監(jiān)控控制臺安裝。
公網(wǎng) IP
是否為節(jié)點(diǎn)分配IPv4地址。如果未選中,不會分配公網(wǎng)IP地址,當(dāng)選擇公網(wǎng)IP后,還需配置帶寬計(jì)費(fèi)方式和帶寬峰值。
該選項(xiàng)僅對節(jié)點(diǎn)池新增節(jié)點(diǎn)生效,對節(jié)點(diǎn)池已有節(jié)點(diǎn)無效。已有節(jié)點(diǎn)如需訪問公網(wǎng),請配置并綁定彈性公網(wǎng)IP地址。具體操作,請參見將EIP綁定至ECS實(shí)例。
自定義安全組
自定義安全組為白名單功能,請前往配額中心申請
可選擇普通安全組或企業(yè)級安全組,僅支持同時(shí)選擇一種類型的安全組。節(jié)點(diǎn)池的安全組不支持修改,安全組的類型也不允許變更。關(guān)于安全組的更多信息,請參見安全組。
RDS 白名單
將節(jié)點(diǎn)IP添加至RDS實(shí)例的白名單。
部署集
白名單功能,請前往配額中心申請。
通過ECS控制臺創(chuàng)建部署集后,通過ACK控制臺為節(jié)點(diǎn)池指定部署集。部署集指定后不支持修改。
您可以使用部署集將節(jié)點(diǎn)池彈出的ECS實(shí)例分散部署在不同的物理服務(wù)器上,以保證業(yè)務(wù)的高可用性和底層容災(zāi)能力。在部署集內(nèi)創(chuàng)建ECS實(shí)例時(shí),根據(jù)事先設(shè)置的部署策略,分散啟動指定地域下的ECS實(shí)例。更多信息,請參見節(jié)點(diǎn)池部署集最佳實(shí)踐。
重要選擇部署集后,節(jié)點(diǎn)池內(nèi)最大節(jié)點(diǎn)數(shù)會受限。部署集默認(rèn)支持節(jié)點(diǎn)上限為
20 * 可用區(qū)數(shù)量
(可用區(qū)數(shù)量由虛擬交換機(jī)決定)。請謹(jǐn)慎選擇,確保部署集內(nèi)配額充足,避免節(jié)點(diǎn)彈出失敗。不涉及
私有池類型
私有池類型包括:開放、不使用和指定。
開放:實(shí)例將會自動匹配開放類型的私有容量池,如果沒有符合條件的私有池,則使用公共池資源啟動。
不使用:實(shí)例不會使用任何私有池容量,直接使用公共池資源啟動。
指定:您需要進(jìn)一步選擇私有池ID來指定實(shí)例只使用該私有池容量啟動,如果該私有池不可用,則實(shí)例啟動失敗。
關(guān)于私有池的更多信息,請參見私有池。
單擊確認(rèn)配置。
在節(jié)點(diǎn)池列表,如果節(jié)點(diǎn)池狀態(tài)顯示初始化中,表明節(jié)點(diǎn)池正在創(chuàng)建。創(chuàng)建完成后,狀態(tài)顯示為已激活。
編輯節(jié)點(diǎn)池
創(chuàng)建節(jié)點(diǎn)池后,ACK集群支持通過控制臺調(diào)整部分節(jié)點(diǎn)池配置,例如節(jié)點(diǎn)池所在的虛擬交換機(jī)、付費(fèi)類型、實(shí)例規(guī)格、系統(tǒng)盤及啟用或停用彈性伸縮等。您可以參見創(chuàng)建節(jié)點(diǎn)池的配置項(xiàng)說明了解支持更新的配置項(xiàng)。
節(jié)點(diǎn)池編輯過程中,不會影響節(jié)點(diǎn)池內(nèi)已有節(jié)點(diǎn)和業(yè)務(wù)的運(yùn)行。
節(jié)點(diǎn)池配置更新后,除特殊說明場景外(例如同步更新存量節(jié)點(diǎn)的 ECS 標(biāo)簽、同步更新存量節(jié)點(diǎn)的標(biāo)簽(Labels)及污點(diǎn)(Taints)),不會修改節(jié)點(diǎn)池已有節(jié)點(diǎn)的配置,僅作用于新增節(jié)點(diǎn)。
節(jié)點(diǎn)池配置更新后,后續(xù)節(jié)點(diǎn)池中新增的節(jié)點(diǎn)都將默認(rèn)使用該配置。
在節(jié)點(diǎn)池列表頁面中,單擊目標(biāo)節(jié)點(diǎn)池所在行操作列的編輯。
在編輯節(jié)點(diǎn)池頁面,編輯節(jié)點(diǎn)池的配置項(xiàng),并按照頁面提示完成配置。
在節(jié)點(diǎn)池頁面,如果節(jié)點(diǎn)池狀態(tài)顯示更新中,則說明節(jié)點(diǎn)池正在變更中。變更完成后,狀態(tài)顯示為已激活。
查看節(jié)點(diǎn)池
您可以查看節(jié)點(diǎn)池的基本信息、監(jiān)控信息,以及節(jié)點(diǎn)池中的全部節(jié)點(diǎn)信息和節(jié)點(diǎn)伸縮活動的記錄。
單擊目標(biāo)節(jié)點(diǎn)池名稱,查看以下信息。
基本信息頁簽:展示集群信息、節(jié)點(diǎn)池信息、節(jié)點(diǎn)配置信息。如果集群已開啟自動彈性伸縮,還將展示自動彈性伸縮的配置信息。
監(jiān)控頁簽:集成了阿里云Prometheus服務(wù),展示節(jié)點(diǎn)池的資源水位情況,包括CPU或內(nèi)存使用情況、磁盤使用情況、節(jié)點(diǎn)CPU或內(nèi)存平均使用率等。
節(jié)點(diǎn)管理頁簽:當(dāng)前節(jié)點(diǎn)池中的全部節(jié)點(diǎn)列表,支持對節(jié)點(diǎn)進(jìn)行移除、運(yùn)維、排水、調(diào)度等操作。單擊導(dǎo)出可以通過CSV文件導(dǎo)出節(jié)點(diǎn)的各項(xiàng)信息。
伸縮活動頁簽:最近節(jié)點(diǎn)實(shí)例伸縮活動記錄,包括伸縮后的實(shí)例數(shù)量、伸縮活動描述等。伸縮活動失敗時(shí),您可以查看失敗的原因。關(guān)于擴(kuò)縮容失敗常見錯誤碼,請參見手動擴(kuò)縮容節(jié)點(diǎn)池。
刪除節(jié)點(diǎn)池
不同計(jì)費(fèi)規(guī)則的實(shí)例釋放規(guī)則不同,請參見下文使用標(biāo)準(zhǔn)的操作刪除節(jié)點(diǎn)池中的節(jié)點(diǎn)。在刪除節(jié)點(diǎn)池前,請確認(rèn)該節(jié)點(diǎn)池是否設(shè)置了期望節(jié)點(diǎn)數(shù),這將直接影響節(jié)點(diǎn)的釋放行為。
節(jié)點(diǎn)池 | 釋放規(guī)則 |
已開啟期望節(jié)點(diǎn)數(shù)的節(jié)點(diǎn)池 |
|
未開啟期望節(jié)點(diǎn)數(shù)的節(jié)點(diǎn)池 |
|
(可選)單擊目標(biāo)節(jié)點(diǎn)池名稱,在基本信息頁簽中檢查是否配置了期望節(jié)點(diǎn)數(shù)。如果未啟用,期望節(jié)點(diǎn)數(shù)字段會顯示為-。
在目標(biāo)節(jié)點(diǎn)池右側(cè)的操作列,單擊更多>刪除,仔細(xì)閱讀彈出信息,確認(rèn)無誤后,單擊確定。
相關(guān)操作
節(jié)點(diǎn)池激活完成后,您可以在節(jié)點(diǎn)池列表區(qū)域,單擊更多,按需進(jìn)行以下操作。
界面詞 | 說明 | 相關(guān)文檔 |
同步節(jié)點(diǎn)池 | 節(jié)點(diǎn)信息異常時(shí),同步節(jié)點(diǎn)池的數(shù)據(jù)信息。 | 無 |
詳情 | 節(jié)點(diǎn)池配置詳情。 | 無 |
編輯 | 調(diào)整節(jié)點(diǎn)池的配置,例如節(jié)點(diǎn)池所在的虛擬交換機(jī)、托管節(jié)點(diǎn)池配置、付費(fèi)類型、實(shí)例規(guī)格、啟用或停用彈性伸縮等。 | 參見上文的編輯節(jié)點(diǎn)池 |
監(jiān)控 | 集成了阿里云Prometheus服務(wù),展示節(jié)點(diǎn)池的資源水位情況,包括CPU或內(nèi)存使用情況、磁盤使用情況、節(jié)點(diǎn)CPU或內(nèi)存平均使用率等。 | 參見上文的查看節(jié)點(diǎn)池 |
擴(kuò)縮容 | 支持手動擴(kuò)容和自動伸縮兩種擴(kuò)容方式,根據(jù)業(yè)務(wù)需求和策略自動調(diào)整計(jì)算資源,節(jié)省集群成本。
| |
配置登錄方式 | 設(shè)置節(jié)點(diǎn)的登錄方式,支持密鑰和密碼兩種方式。 | 參見前文的實(shí)例和鏡像配置 |
開啟托管 | 開啟節(jié)點(diǎn)池的自動化運(yùn)維能力,包括節(jié)點(diǎn)故障自動恢復(fù)、kubelet和運(yùn)行時(shí)自動升級、OS CVE自動修復(fù)等。 | 參見前文的基本配置 |
添加已有節(jié)點(diǎn) | 如購買ECS實(shí)例后需將其添加到ACK集群中作為Worker節(jié)點(diǎn),或移除Worker節(jié)點(diǎn)后需重新加入節(jié)點(diǎn)池,可以使用添加已有節(jié)點(diǎn)的功能。此功能存在一些使用限制和注意事項(xiàng),請參見文檔了解。 | |
克隆 | 基于現(xiàn)有節(jié)點(diǎn)池配置,克隆一個相同配置的節(jié)點(diǎn)池。 | 無 |
節(jié)點(diǎn)恢復(fù) | 當(dāng)托管節(jié)點(diǎn)池中的節(jié)點(diǎn)發(fā)生異常時(shí),ACK會自動發(fā)起故障節(jié)點(diǎn)的恢復(fù)操作,使節(jié)點(diǎn)保持正常運(yùn)行(部分復(fù)雜的節(jié)點(diǎn)故障可能仍然需要手動修復(fù))。關(guān)于ACK提供的檢查項(xiàng)及具體的恢復(fù)行為請參見文檔了解。 | |
修復(fù) CVE(OS) | 執(zhí)行CVE漏洞的批量修復(fù),提升集群的穩(wěn)定性、安全性、合規(guī)性。部分CVE漏洞的修復(fù)需要通過重啟節(jié)點(diǎn)來實(shí)現(xiàn),請參見文檔了解功能說明及注意事項(xiàng)。 | |
Kubelet 配置 | 在節(jié)點(diǎn)池維度自定義節(jié)點(diǎn)的kubelet參數(shù)配置,調(diào)整節(jié)點(diǎn)行為,例如整集群資源預(yù)留以調(diào)配資源用量等。強(qiáng)烈不建議您通過黑屏操作自行定義控制臺不支持的kubelet參數(shù)。 | |
OS 配置 | 在節(jié)點(diǎn)池維度自定義節(jié)點(diǎn)的OS參數(shù)配置,以調(diào)優(yōu)系統(tǒng)性能。強(qiáng)烈不建議您通過黑屏操作自行定義控制臺不支持的OS參數(shù)。 | |
更換操作系統(tǒng) | 更換節(jié)點(diǎn)操作系統(tǒng)類型,或升級操作系統(tǒng)的版本。 | 無 |
Kubelet 升級 | 升級節(jié)點(diǎn)池中節(jié)點(diǎn)的kubelet版本和containerd版本。 | |
刪除 | 刪除不再使用的節(jié)點(diǎn)池,以減少不必要的資源浪費(fèi)。節(jié)點(diǎn)池是否開啟期望節(jié)點(diǎn)數(shù)以及節(jié)點(diǎn)的計(jì)費(fèi)模式會影響節(jié)點(diǎn)釋放的行為。 | 參見上文的刪除節(jié)點(diǎn)池 |
常見問題
如何基于創(chuàng)建好的ECS實(shí)例創(chuàng)建自定義鏡像,并使用該鏡像創(chuàng)建節(jié)點(diǎn)?
您可以在創(chuàng)建ECS實(shí)例后,根據(jù)業(yè)務(wù)需要自定義該實(shí)例(如安裝軟件、部署應(yīng)用環(huán)境等),并為更新后的實(shí)例創(chuàng)建自定義鏡像。使用該鏡像創(chuàng)建的新實(shí)例,會包含您已配置的自定義項(xiàng),省去您重復(fù)自定義實(shí)例的時(shí)間。
登錄ECS實(shí)例,執(zhí)行以下命令,刪除指定的文件。關(guān)于如何登錄實(shí)例,請參見使用Workbench工具以SSH協(xié)議登錄Linux實(shí)例。
chattr -i /etc/acknode/nodeconfig-* rm -rf /etc/acknode systemctl disable ack-reconfig rm -rf /etc/systemd/system/ack-reconfig.service rm -rf /usr/local/bin/reconfig.sh rm -rf /var/lib/cloud
基于ECS實(shí)例創(chuàng)建自定義鏡像。相關(guān)注意事項(xiàng)和具體操作步驟,請參見使用實(shí)例創(chuàng)建自定義鏡像。
配置節(jié)點(diǎn)池,選擇操作系統(tǒng)類型為自定義鏡像,并參見前文說明完成節(jié)點(diǎn)池的創(chuàng)建。
請基于ACK集群支持的操作系統(tǒng)制作自定義鏡像。詳細(xì)信息,請參見操作系統(tǒng)。
請勿使用ACK集群中正在運(yùn)行的ECS實(shí)例制作自定義鏡像。如需使用,請先從集群移除,請參見移除節(jié)點(diǎn)。
自定義鏡像中預(yù)定義的行為邏輯可能影響集群節(jié)點(diǎn)初始化、容器運(yùn)行、節(jié)點(diǎn)OS升級、托管節(jié)點(diǎn)池的節(jié)點(diǎn)自動恢復(fù)等操作。在生產(chǎn)環(huán)境使用前,請確保已經(jīng)過嚴(yán)格的測試驗(yàn)證。
相關(guān)文檔
當(dāng)不再需要某節(jié)點(diǎn)繼續(xù)工作時(shí),請按照標(biāo)準(zhǔn)化操作將節(jié)點(diǎn)移除,請參見移除節(jié)點(diǎn)。
ACK需要占用一定的節(jié)點(diǎn)資源來為kube組件和system進(jìn)程預(yù)留資源,請參見節(jié)點(diǎn)資源預(yù)留策略。
當(dāng)集群的容量規(guī)劃無法滿足應(yīng)用Pod調(diào)度時(shí),您可以啟用節(jié)點(diǎn)伸縮自動擴(kuò)縮節(jié)點(diǎn)資源,請參見節(jié)點(diǎn)伸縮概述。
單Worker節(jié)點(diǎn)支持的最大Pod數(shù)受網(wǎng)絡(luò)插件類型影響,在大部分場景下不支持變更。如需提升可用的Pod數(shù)量,需通過節(jié)點(diǎn)池?cái)U(kuò)容、實(shí)例規(guī)格提升、重建集群并重新規(guī)劃Pod網(wǎng)段等手段,具體操作請參見調(diào)整可使用的節(jié)點(diǎn)Pod數(shù)量。