創(chuàng)建帶有ACK靈駿托管版的集群
阿里云容器服務ACK靈駿托管版集群是容器服務Kubernetes版(ACK)針對智能計算靈駿提供的集群類型,提供全托管和高可用控制面板的標準Kubernetes集群服務,支持以靈駿計算節(jié)點作為Kubernetes集群的工作節(jié)點。本文為您介紹如何創(chuàng)建帶有ACK靈駿托管版的集群。
前提條件
已根據(jù)業(yè)務需求購買所需靈駿產(chǎn)品(計算節(jié)點、靈駿連接),具體操作,請參見購買產(chǎn)品。
已根據(jù)業(yè)務需求,購買并配置好所需的其他云產(chǎn)品,例如CEN、ARMS、VPC,ACK靈駿托管版等。更多信息,請參見購買并配置其他云產(chǎn)品。
用戶需通過實名認證,并有100元的現(xiàn)金余額或信控余額,才能創(chuàng)建ACK集群。更多信息,請參見如何設置子賬號信控額度。
背景信息
ACK靈駿托管版集群提供了全托管和高可用控制面板的標準Kubernetes集群服務,支持高效管理異構(gòu)資源、調(diào)度異構(gòu)任務,作為支撐PAI的云原生底座,并提供AI、HPC等高性能計算場景下的云原生增強能力。ACK靈駿托管版集群的更多信息,請參見什么是容器服務靈駿版。
創(chuàng)建集群配置
登錄靈駿控制臺。
在左側(cè)導航欄,選擇資源與節(jié)點 > 集群管理,進入集群管理頁面。
單擊一鍵創(chuàng)建集群,進入創(chuàng)建集群配置頁面。
單擊?PAI靈駿集群(包括PAI、ACK、CPFS等)卡片。
根據(jù)界面配置指引,分別完成集群和分組配置、網(wǎng)絡配置、軟件實例基本參數(shù)配置和軟件實例和分組映射關系配置。
ACK靈駿托管版集群需單獨計費,計費說明請參見ACK靈駿集群計費說明。
集群和分組配置
您可以根據(jù)業(yè)務需求規(guī)劃多個集群,集群內(nèi)的計算節(jié)點可進一步細化節(jié)點分組,通過對集群、計算節(jié)點的規(guī)劃來提高計算節(jié)點的資源利用率。規(guī)劃完成后,集群的創(chuàng)建步驟如下。
配置集群信息。
配置集群名稱、集群節(jié)點的root密碼、資源組等信息。資源組的相關信息,請參見創(chuàng)建資源組。
單擊創(chuàng)建分組,配置節(jié)點分組信息。
根據(jù)規(guī)劃和界面提示,配置分組名稱和歸屬當前分組的節(jié)點信息,例如節(jié)點機型、鏡像等信息。
單擊請選擇節(jié)點實例,選擇將哪些節(jié)點添加到當前分組中。
單擊保存,進入下一步網(wǎng)絡配置繼續(xù)后續(xù)配置。
網(wǎng)絡配置
集群初始時處于一個隔離的網(wǎng)絡環(huán)境中,您需要通過靈駿連接和云企業(yè)網(wǎng)來實現(xiàn)與公共云的網(wǎng)絡連通,同時指定用于監(jiān)控網(wǎng)絡連通狀態(tài)的VPC網(wǎng)絡環(huán)境。
如上述網(wǎng)絡拓撲圖所示,網(wǎng)絡配置中涉及的核心網(wǎng)絡有以下幾類:
集群網(wǎng)段:為集群內(nèi)部使用的網(wǎng)段,用于給計算節(jié)點分配IP,為私有網(wǎng)段。
監(jiān)控網(wǎng)絡:為用于監(jiān)控網(wǎng)絡連通狀態(tài)的VPC網(wǎng)絡。
您進行網(wǎng)絡規(guī)劃和配置時,以上各網(wǎng)段不能沖突。完成網(wǎng)絡規(guī)劃后,您可參考下面的步驟進行集群的網(wǎng)絡配置。
完成集群的網(wǎng)絡配置后,您還需關注CEN的其他網(wǎng)絡配置是否正確,CEN的配置要點可參見購買并配置CEN。
配置集群網(wǎng)段。
集群網(wǎng)段為靈駿集群內(nèi)部使用的網(wǎng)段,用于給計算節(jié)點分配IP,請?zhí)顚懹行У乃接芯W(wǎng)段。
集群子網(wǎng)是靈駿集群網(wǎng)段的子網(wǎng)段。靈駿網(wǎng)段和靈駿子網(wǎng)的更多信息,請參見管理靈駿網(wǎng)段。
說明您需要提前規(guī)劃集群網(wǎng)段,集群網(wǎng)段不能和靈駿待連通的其他網(wǎng)絡環(huán)境(如用戶其他VPC網(wǎng)絡、線下IDC網(wǎng)段)沖突。
集群網(wǎng)段可用IP數(shù)量,決定了集群可部署的最大節(jié)點數(shù)量。您需要提前預留足夠大的網(wǎng)段(優(yōu)先選擇掩碼長度小于22位的網(wǎng)段),避免之后無法擴容集群。
(可選)配置集群子網(wǎng)bond分配策略。如果選擇了特定計算節(jié)點,需要配置靈駿節(jié)點物理網(wǎng)卡bond接口的分配策略,bond接口與靈駿節(jié)點實例綁定。您可以按照bond策略、機型策略或節(jié)點策略配置bond接口。
添加bond策略
不同節(jié)點機型有不同的bond接口數(shù)量,集群的bond接口數(shù)量等于集群所有節(jié)點機型中最多的bond數(shù)量。集群的bond接口以bondx的格式命名,其中x從0開始編號。
例如,一個集群的A、B兩種節(jié)點對應的bond接口數(shù)量分別為3和4,那么集群的bond接口數(shù)量為4,分別從bond0到bond3命名。而且A節(jié)點使用bond0到bond2的接口策略。
說明一個集群最多只能配置一個bond分配策略。
操作步驟
配置集群的bond策略。
(可選)配置默認bond。未分配策略的bond接口按照默認bond進行分配。選中應用于全部復選框,可以將默認bond分配給所有bond接口。
添加機型策略
您可以為集群中的每種機型設定一個機型分配策略,一個集群中的機型分配策略數(shù)量最多為集群的分組數(shù)量。
操作步驟
在下拉列表選中相應節(jié)點機型。
配置bond策略,相應節(jié)點策略會應用到選中機型的所有節(jié)點實例。
添加節(jié)點策略
您可以為集群中的每個節(jié)點實例設定一個節(jié)點分配策略。同一節(jié)點實例的不同bond口可以接入不同的靈駿網(wǎng)段或靈駿子網(wǎng)。
操作步驟
在下拉列表選中相應節(jié)點實例。
配置bond策略,相應節(jié)點策略會應用到選中的節(jié)點實例。
配置靈駿連接。
單擊授權,為靈駿連接授權。
后續(xù)通過靈駿連接來對接CEN并訪問其他云產(chǎn)品,因此您需要授權靈駿有訪問其他云產(chǎn)品的權限。更多信息,請參見附錄:靈駿連接服務關聯(lián)角色說明。
在下拉列表中選擇靈駿連接實例ID,指定當前集群使用哪個靈駿連接實例連接云上環(huán)境。
在下拉列表中選擇云企業(yè)網(wǎng)實例,指定當前集群后續(xù)通過靈駿連接對接哪個CEN實例。
重要您需要在CEN中創(chuàng)建轉(zhuǎn)發(fā)路由器,轉(zhuǎn)發(fā)路由器的地域應該和靈駿節(jié)點的地域一致。具體操作,請參見轉(zhuǎn)發(fā)路由器實例。
配置監(jiān)控網(wǎng)絡信息。
配置云企業(yè)網(wǎng)。創(chuàng)建新的VPC或?qū)⒁延械?span id="z68uejxpaoma" class="help-letter-space">VPC連接至第2步中的云企業(yè)網(wǎng)實例中的轉(zhuǎn)發(fā)路由器實例,請參見開通并配置CEN。請確保VPC下的交換機至少有1個空閑IP,靈駿將使用該交換機對靈駿連接的連通性進行監(jiān)控。
重要只有將VPC連接至已選擇的轉(zhuǎn)發(fā)路由器,才能在下拉列表中選擇相應的VPC。
集群網(wǎng)段、監(jiān)控網(wǎng)絡的專有網(wǎng)絡VPC互相之間不能沖突,且監(jiān)控網(wǎng)絡的專有網(wǎng)絡VPC不能和靈駿待連通的其他網(wǎng)絡環(huán)境(如用戶其他VPC網(wǎng)絡、線下IDC網(wǎng)段)沖突。
單擊專有網(wǎng)絡(VPC)下拉列表和交換機(vSwitch)下拉列表后的,選擇相應的專有網(wǎng)絡和交換機。
單擊保存,進入下一步 軟件實例基本參數(shù),繼續(xù)后續(xù)配置。
軟件實例基本參數(shù)配置
完成基本參數(shù)配置。
ACK頁簽
配置ACK靈駿托管版容器集群的相關參數(shù)。容器集群參數(shù)的說明,請參見創(chuàng)建Kubernetes托管版集群。
重要關于容器集群參數(shù),需要注意Service CIDR、靈駿的集群網(wǎng)段、互聯(lián)網(wǎng)段和專有網(wǎng)絡網(wǎng)段,互相之間不能重疊。
CPFS頁簽
配置CPFS的相關參數(shù)。關于創(chuàng)建文件系統(tǒng)CPFS,請參見創(chuàng)建文件系統(tǒng)。
說明CPFS創(chuàng)建完成后,您可以通過CPFS控制臺查看實例信息。
PAI頁簽
配置PAI的相關參數(shù)。
說明關于RDS信息、云存儲、ACR鏡像倉庫、OAuth認證信息的配置,請參見開通并配置其他云產(chǎn)品。
單擊?保存,進入下一步軟件實例和分組映射關系,繼續(xù)后續(xù)配置。
軟件實例和分組映射關系配置
ACK靈駿托管版集群為靈駿計算節(jié)點提供靈駿節(jié)點池類型,您可以更方便地對靈駿節(jié)點進行分組管理,例如節(jié)點配置、批量管理、指定調(diào)度、GPU配置等。節(jié)點池的更多信息,請參見靈駿節(jié)點池概述。
單擊創(chuàng)建節(jié)點池,創(chuàng)建ACK節(jié)點池。
配置節(jié)點池名稱、最大節(jié)點數(shù)量等。
單擊?選擇關聯(lián)分組,在彈出的對話框中,選中您想要關聯(lián)的集群分組前的復選框,單擊確定。
單擊保存,進入下一步,確認配置,繼續(xù)后續(xù)配置。
確認配置
在確認配置頁面確認集群基本信息、網(wǎng)絡配置、軟件實例和分組映射關系和軟件實例參數(shù),無誤后單擊提交配置,開始創(chuàng)建集群。
單擊依賴檢查區(qū)域的?完成授權,完成對容器服務的授權。