云原生AI套件提供了簡單的運維大盤和開發控制臺,滿足快速瀏覽集群狀態、提交訓練任務的需要。由于ACK Edge集群的Ingress組件部署方式與ACK集群Pro版有差異,AI套件控制臺在ACK Edge集群的部署流程有一些變化。本文介紹如何在ACK Edge集群中部署AI套件控制臺。
前提條件
步驟一:部署Nginx Ingress Controller
登錄容器服務管理控制臺,在左側導航欄選擇集群。
在集群列表頁面,單擊目標集群名稱,然后在左側導航欄,選擇 。
在Helm頁面,單擊創建。參考如下信息完成基礎信息配置。
參數
示例值
應用名
ack-ingress-nginx-{節點池名稱}
命名空間
kube-system
來源
默認為應用市場
Chart
應用場景:選擇全部。
支持架構:選擇amd64。
搜索框:搜索ack-ingress-nginx-v1。
單擊下一步進入參數配置頁面,配置下列參數信息。然后單擊確定完成安裝。
說明您可以在容器服務管理控制臺集群管理頁左側導航欄中,選擇 ,查看節點池列表,找到對應的云端節點池ID。
在
service. nodeSelector
配置項中加入云端節點池的Label:alibabacloud.com/nodepool-id: {節點池ID}
。說明service. nodeSelector
字段只需保留alibabacloud.com/nodepool-id: {節點池ID}
信息。在
ingressClassResource
配置項中設置name
和controllerValue
。說明在同一個ACK Edge集群中多次部署ack-ingress-nginx-v1時,每次部署的
name
和controllerValue
要確保唯一。命名規范建議如下:name
:ack-nginx-{節點池名稱}
, 例如:ack-nginx-edge-hangzhou
。controllerValue
:"k8s.io/ack-ingress-nginx-{節點池名稱}"
,例如:"k8s.io/ack-ingress-nginx-edge-hangzhou"
。
在參數配置頁面,根據需求選擇SLB的類型為公網或私網,并相應設置
external
和internal
的enabled
值。如果您選擇公網,請將域名解析到公網IP,如果選擇私網,請使用可訪問且可解析的私網IP。
步驟二:部署AI套件控制臺
部署AI套件控制臺具體操作,請參見安裝云原生AI套件。安裝過程中需要注意以下信息。
推薦將AI套件控制臺組件部署到云端節點,以充分利用云端的各項能力。若您希望將其調度到指定的節點池,只需設置相應組件Pod的Selector或Affinity。
如果您在集群中使用自建的數據存儲,則需在部署AI套件控制臺過程中選中安裝ack-mysql組件,且該組件需部署在云端節點。
安裝完成后,會在路由頁面中增加兩個控制臺的Ingress條目,您需要增加
ingressClassName
的配置,指定其與部署的Nginx-Ingress所使用的Ingress Class相同。在控制臺左側導航欄,選擇
,單擊對應目標右側YAML編輯。增加
ingressClassName
配置,與步驟一中ingressClassResource.name
保持一致。
在部署AI套件控制臺過程中,若您需要通過公網域名訪問控制臺,需要將該域名解析到安裝的nginx-ingress負載均衡器(LB)的IP地址。你可以通過控制臺左側導航欄,選擇
進行查看。
部署完成后,可通過AI運維控制臺進行訪問,具體操作,請參見訪問AI運維控制臺。