離線模型(OfflineModel)相關組件
離線模型(OfflineModel)是存儲在MaxCompute中的一種數(shù)據(jù)結構,基于PAICommand框架的傳統(tǒng)機器學習算法生成的模型會以離線模型格式存儲在對應的MaxComute項目中,您可以使用離線模型相關組件獲取離線模型做離線預測。本文為您介紹離線模型的幾種相關組件。
復制MaxCompute離線模型
在機器學習開發(fā)流程中有一種常規(guī)使用場景,即在開發(fā)環(huán)境中,使用一個工作流來構建模型。在生產(chǎn)環(huán)境中的工作流,讀取該模型做周期性的預測任務。因此我們需要在模型構建完成后,使用復制MaxCompute離線模型組件,將模型持久化存儲到預測任務可以讀取的環(huán)境下。
您可以在構建模型工作流的下游,連接復制MaxCompute離線模型組件,將模型固定輸出為指定名稱,具體如下圖所示。您可以在該組件的參數(shù)設置頁簽,配置以下參數(shù)。其中:
目標MaxCompute Project名:如果不配置該參數(shù),則默認為當前工作空間的MaxCompute Project。
是否覆蓋與目標模型同名的模型:如果選中該參數(shù),則在執(zhí)行時會先刪除歷史模型,再執(zhí)行創(chuàng)建新模型。
讀MaxCompute離線模型
在機器學習開發(fā)流程中有一種常規(guī)使用場景,即在開發(fā)環(huán)境中,使用一個工作流來構建模型,在生產(chǎn)環(huán)境中的工作流,使用讀MaxCompute離線模型組件直接讀取模型,做周期性的預測任務。您只需在該組件的字段設置頁簽配置模型名即可。
通用模型導出
您可以使用通用模型導出組件,將離線模型導出到指定的OSS路徑。您可以在該組件的參數(shù)設置頁簽,配置以下參數(shù)。
其中:
是否覆蓋:選中該參數(shù),生成的模型文件會覆蓋指定OSS路徑中的同名模型文件。
導出模型格式:支持按照original(MaxCompute離線模型格式)導出,或?qū)С?b data-tag="uicontrol" id="uicontrol-w85-tm2-n1g" class="uicontrol">pmml格式的模型文件。