靈駿智算資源,作為阿里云PAI AI計算引擎的核心組成部分,提供了大規模且高密度的計算資源。它旨在滿足高性能AI訓練和計算的異構算力需求,支持DSW、DLC和EAS模塊,助力您的AI開發、訓練和服務部署操作。本文為您介紹如何創建資源組并購買靈駿智算資源。
功能簡介
資源類型
靈駿智算類型的資源,是阿里云自主研發的新一代智能計算資源,提供:
RDMA高速網絡架構
高性能通信庫
高性能加速軟件
GPU虛擬化的技術方案
可以更好地滿足高性能算力需求。
資源組類型
阿里云PAI為您提供全托管的靈駿智算資源,您可在PAI產品控制臺便捷地完成購買、使用的全流程,如果您已購買單獨的靈駿硬件資源,也可將此類資源作為半托管的資源添加至PAI產品控制臺,用于后續的訓練任務使用。
使用限制
支持使用的地域
當前僅支持華北6(烏蘭察布)和新加坡地域。
支持使用的用戶
當前靈駿智算資源僅供白名單用戶受限申請使用,如果您希望使用靈駿智算資源提交訓練任務,您可先提交工單,申請添加靈駿智算使用白名單。
支持的任務類型
當前靈駿智算資源僅支持TensorFlow、PyTorch、ElasticBatch和MPIJob類型的訓練任務。
操作賬號和權限要求
阿里云主賬號(推薦):使用主賬號可完成所有操作,無需額外授權。
RAM用戶:需要通過主賬號為RAM用戶授予管理資源池權限或授予AliyunPAIFullAccess權限。
重要AliyunPAIFullAccess擁有管理和操作PAI所有資源和功能的權限,請謹慎授權。建議您直接使用主賬號進行操作。
依賴的云產品
靈駿智算資源在創建、購買及后續使用的過程中,依賴以下其他云產品,您在購買使用前需先了解依賴的云產品,并根據實際需要提前準備好對應的云產品。
(必選)VPC
分配靈駿智算資源時,您需綁定一個同地域的VPC,并配置交換機與安全組信息,保障靈駿智算資源與各云產品的網絡是連通狀態。
(按需)公網NAT網關與EIP
如果后續您需要訪問公網環境,例如使用公網環境下的自定義鏡像等場景,您還需開通并配置公網NAT網關的SNAT功能,綁定EIP,實現靈駿智算資源訪問公網的能力。
配置公網NAT網關的SNAT功能操作詳情可參見使用公網NAT網關SNAT功能訪問互聯網。
(按需)OSS/NAS/智算CPFS
您后續使用靈駿智算資源提交DLC任務時,需先創建數據集,當前支持使用OSS、NAS、智算CPFS類型的數據集,因此您需根據數據集的應用需要提前準備好OSS或NAS或智算CPFS資源,并創建好對應的數據集。詳情請參見準備工作:準備數據集。
新建資源組并購買靈駿智算資源
新建靈駿資源組
登錄并進入PAI控制臺的AI計算資源 > 資源池頁面。
在靈駿智算資源頁簽中,單擊新建資源組。
在新建資源組對話框中配置以下參數,完成后單擊確定。
參數
說明
類型
選擇專有資源組。
資源組名稱
根據界面提示設置滿足規則的資源組名稱。
購買靈駿智算資源
您可以按照以下操作步驟為專有資源組購買靈駿智算資源,關于靈駿智算資源的計費詳情,請參見靈駿智算資源Serverless版計費說明。
在靈駿智算資源頁簽的資源組列表中,單擊資源組名稱。
在資源組詳情頁面右上方,單擊新建訂單。
在購買頁面中根據實際業務需要選擇節點規格、每一個訂單中的節點數量和購買時長等必要參數,完成后單擊立即購買。
在支付頁面完成支付后,在訂單列表頁面中會展示已購買的靈駿智算資源列表。
相關文檔
資源組創建成功并購買計算資源后,您可以進行以下操作: