Designer(Studio 2.0)是PAI產品基于云原生架構Pipeline Service -- PAIFlow的可視化建模工具,提供端到端的機器學習全鏈路開發環境,幫助您實現端到端的機器學習開發流程。同時,Designer中內置了豐富且成熟的機器學習算法,覆蓋商品推薦、金融風控及廣告預測等場景,支持基于MaxCompute、通用訓練資源、Flink等計算資源進行大規模分布式運算,可以快速滿足不同方向的業務需求。
Designer&PAIFlow產品架構
Designer功能特性
Designer支持阿里云主子賬號登錄方式。如果使用子賬號,則需要主賬號對其進行授權,詳情請參見云產品依賴與授權:Designer。
Designer支持使用模板或手動創建工作流。通過模板可以快速創建工作流,運行成功后,直接進行模型部署。關于如何創建及管理工作流,詳情請參見參考工作流概述。
系統提供百余種AI開發流程組件,支持接入MaxCompute表數據或OSS數據等多種數據源,通過自帶阿里最佳實踐的算法進行模型構建,并將模型部署至EAS。
提供當前工作流相關任務的管理、工作流版本管理及回滾,詳情請參見調試模型。
進行模型訓練時,Designer提供可視化大屏,對過程中的數據、模型、評測指標進行可視化分析,輔助您獲得最佳模型。
Designer支持工作空間內的工作流協作共享,同時支持將運行成功的工作流部署至DataWorks做周期性調度或者發布為自定義模板。
在Designer工作流中開發測試完成的模型支持注冊至模型管理,一鍵部署模型服務或是打包成復合模型進行部署,詳情請參見模型預測概述。
Designer提供的工作流組件
Designer為您提供百余種組件,滿足多種場景的使用,組件詳情請參見組件參考:所有組件匯總。
從使用場景來區分,包括以下三種類型的組件:
傳統機器學習組件
包括數據預處理、特征工程、統計分析、異常檢測、推薦算法、時間序列及網絡分析等算法組件。
深度學習框架組件
包括基于PAI-Easy系列的視覺類算法、語音類算法、自然語言處理算法,及TensorFlow、PyTorch等深度學習框架。
自定義算法組件
包括SQL腳本、Python腳本、PyAlink腳本等自定義算法組件,可以滿足您更加定制化的算法工作流串聯需求。
從實現框架及支持的計算資源來區分,包括Alink框架及PAICommand框架,兩種框架的算法組件各自有一些獨特的功能特性:
Alink框架算法組件(組件上有紫色圓點標記),支持運行在MaxCompute、Flink或通用訓練資源上。
Alink框架算法支持Pipeline部署,詳情請參見Pipeline部署在線服務。
Alink框架算法支持成組運行,詳情請參見高級功能:Alink組件成組執行。
PAICommand框架算法組件除了支持直接使用組件,還支持PAI命令的調用方式。您可以在Designer的SQL組件、DataWorks數據開發、MaxCompute命令行工具中進行調用。
Designer的使用流程
Designer的使用流程圖如下所示。
工作流調度引擎:PAIFlow
PAIFlow是Designer底層的工作流調度引擎,您可以從Designer提交工作流任務到PAIFlow執行,也可以通過PAIFlow OpenAPI直接構建工作流并在PAIFlow執行。
說明通過PAIFlow OpenAPI構建的工作流不會在Designer中展示,OpenAPI和Designer可以理解為兩個獨立的實現構建并提交PAIFlow任務的客戶端,面向不同需求。
PAIFlow任務管理頁包含了全部通過OpenAPI、Designer手動執行、DataWorks周期性調度Designer工作流提交的Pipeline任務,詳情請參見管理工作流任務。
PAIFlow OpenAPI
習慣于使用OpenAPI進行開發的用戶,建議使用PAIFlow進行工作流的創建和任務提交,詳情請參見API概覽。
Designer創建的工作流無法通過PAIFlow的OpenAPI進行管理,但Designer提交的工作流任務可以在PAIFlow的任務管理中統一管理。