成功創建實驗后,您可以實時查看實驗詳情,包括實驗的基本信息、Trial列表、各個Trial的運行詳情以及日志。本文為您介紹實驗中支持查看的詳細內容。
查看實驗的基本信息
進入自動機器學習(AutoML)頁面。
登錄PAI控制臺。
在左側導航欄單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。
在左側導航欄,選擇
。
在實驗列表頁面中,單擊實驗名稱,進入實驗詳情頁面。
在實驗詳情頁面的基本信息頁簽,您可以查看該實驗的基本配置、Trial配置、執行配置、搜索配置和Trial的執行進度。
在基本配置區域,您可以查看該實驗的ID、狀態等。實驗可能的狀態如下:
CREATED:在實驗的創建初期,系統正在執行創建管理進程、解析各個配置模塊的內容,以及向DLC或MaxCompute等后臺提交任務等操作。此時,Trial還沒有開始運行。
FINISHED:當實驗下的所有Trial都執行完成,且Trial的狀態至少有一個為FINISHED時,實驗狀態會變為FINISHED。
FAILED:當實驗下的所有Trial都執行完成,且Trial的狀態均為FAILED時,實驗狀態會變為FAILED。當手動停止實驗下的所有Trial時,實驗狀態會變為FAILED。
RUNNING:當實驗下的Trail狀態為RUNNING時,實驗狀態為RUNNING。
TERMINATING:當手動停止實驗后,實驗狀態會變為TERMINATING。
USER_CANCELED:當手動停止實驗且實驗完全停止后,實驗狀態會變為USER_CANCELED。
NO_MORE_TRIAL:當實驗已經運行的Trial數量達到了實驗設置的最大Trial數量時,不會再生成新的Trial。在最后一個Trial運行結束后,實驗會自動從NO_MORE_TRIAL狀態轉換為Finished狀態。
TUNER_NO_MORE_TRIAL nuner:當實驗缺乏足夠的信息來確定下一組需要測試的超參數時,Tuner會停止生成新的Trial。此時的實驗狀態為TUNER_NO_MORE_TRIAL nuner。
在Trial配置、執行配置和搜索配置區域,您可以查看該實驗的參數配置詳情。
在Trial執行進度區域,您可以查看Trial的執行進度和狀態統計信息。
查看Trial列表
進入實驗詳情頁面。具體操作,請參見查看實驗的基本信息。
在Trial列表頁簽中,展示該實驗下自動生成的所有Trial列表。
根據配置的算法,每次實驗都會生成超參數組合,并為每組超參數組合創建一個Trial。同時,每個Trial可能會對應一個DLC任務,也可能對應1個或多個MaxCompute任務。任務的類型取決于實驗的執行配置。后續將通過配置的任務來執行Trial。
查看Trial的運行詳情
在Trial列表頁簽,您可以查看實驗下的Trial詳情,包括執行狀態、最終指標和超參數組合等。
狀態:Trial可能的狀態如下:
RUNNING:正在執行中。
FINISHED:已執行成功。
FAILED:執行失敗。
USER_CANCELED:手動停止。
EARLY_STOPPED:Trial被提前終止。
最終指標:根據實驗中的指標權重配置,系統將使用加權求和值作為最終的評估指標。
超參數組合:根據實驗配置的算法自動生成的超參數組合。每個Trial對應一組超參數組合。
通過對比每個Trial的最終指標,并根據在搜索配置中配置的優化方向,您可以判斷哪個Trial使用的超參數組合是最優的。
查看日志
當實驗或Trial執行失敗時,您可以通過操作日志來有效定位實驗和Trial的異常情況。
查看實驗的日志
進入實驗詳情頁面。具體操作,請參見查看實驗的基本信息。
您可以單擊頁面右側的日志按鈕,或在基本信息頁簽的基本配置區域中,單擊狀態后的日志按鈕。
在實驗日志配置面板中,查看日志詳情。包括以下兩種日志:
nnimanager.log
該日志記錄了與實驗管理相關的信息,包括實驗的啟動、停止和錯誤信息等。
dispatcher.log
該日志記錄與任務調度和資源管理相關的信息,包括Trial的分配、資源的分配等。
查看Trial的日志
進入實驗詳情頁面。具體操作,請參見查看實驗的基本信息。
在Trial列表頁簽,單擊目標Trial操作列下的日志。
在Trial日志配置面板中,查看Trial的日志詳情。
Trial日志包括以下三種日志:
trial.log
該日志記錄了Trail的詳細執行過程。
stdout
該日志中記錄了Trial的標準輸出,包括打印語句和輸出內容等,有助于您了解代碼的調試信息和執行結果。
stderr
該日志記錄了Trial的標準錯誤,包括一些異常、錯誤信息和警告等。當Trial任務出現問題時,stderr日志提供了有關錯誤的詳細描述,幫助您進行故障排查和錯誤處理。