本文為您介紹DSW完整的使用流程。
步驟一:準備工作
權限開通
使用主賬號開通PAI并創建工作空間。登錄PAI控制臺,左上角選擇開通區域,然后一鍵授權和開通產品,詳情見開通PAI并創建工作空間。
操作賬號授權。當使用主賬號操作DSW實例時,可跳過此步。當使用RAM賬號操作時,需要進行操作賬號授權。
【可選】準備專有資源組
在完成步驟1后,系統將為您準備好公共資源組。當您需要使用專有資源組時,請參見新建及管理通用計算資源和新建資源組并購買靈駿智算資源。
【可選】掛載數據集
公共資源組和專有資源組默認數據存儲空間有限,且無法持久化存儲,因此,當您需要擴展實例的存儲空間或持久化存儲數據時,可通過掛載NAS、OSS類型數據集或OSS路徑的方式實現。新建數據集,請參見創建及管理數據集。
重要公共資源組的DSW實例,數據存儲在空間有限的免費云盤中,在刪除實例或停機超過15天后,云盤數據將被清空。
專有資源組的DSW實例,數據存儲在實例的系統盤中,在停止或刪除實例后,臨時存儲將被清空。
【可選】自定義鏡像
DSW預置了多種類型的官方鏡像,例如PyTorch、TensorFlow、ModelScope等。如果您需要自定義鏡像來滿足特定場景下的開發需求,請參見自定義鏡像。
步驟二:創建及訪問DSW實例
創建實例
DSW實例創建,請參見創建DSW實例。
管理實例
訪問實例
步驟三:使用DSW實例
模型開發與訓練
您可以直接在DSW實例中進行模型開發,DSW提供了交互式的開發環境,便于調試代碼和查看運行結果。您可以管理第三方庫,以滿足特定的環境需求。
分布式訓練的具體操作,請參見創建訓練任務。
模型部署
訓練好的模型,您可以將其部署為EAS在線服務,以實現模型推理功能。具體操作,請參見模型部署。
數據傳輸
步驟四:玩轉DSW實例
最佳實踐
DSW Gallery提供了豐富的Notebook案例,包括LLM、AIGC前沿領域,覆蓋了Llama2、通義千問、Stable Diffusion等熱門模型,您可以選擇感興趣的內容,在DSW一鍵運行,以及二次開發。請參見Notebook Gallery。
高階功能
除了上述功能之外,DSW還支持以下高階應用場景:
在DSW利用Tensorboard進行訓練可視化,請參見Tensorboard:訓練可視化。
在DSW運行R語言,請參見DSW支持R語言。
在DSW使用SQL查詢MaxCompute數據源,請參見使用SQL File查詢MaxCompute表。
在DSW連接EMR集群,提交Spark作業,請參見DSW連接EMR集群。
更多操作實踐,請參見DSW使用案例匯總。