本文中含有需要您注意的重要提示信息,忽略該信息可能對您的業務造成影響,請務必仔細閱讀。
本文介紹如何基于PAI-Rec平臺把引擎服務部署到PAI-EAS平臺上。
前提條件
已獲取阿里云賬號的鑒權AccessKey ID和AccessKey Secret,為避免安全風險,建議您使用RAM賬號的AccessKey。詳情請參見獲取AccessKey。
創建引擎配置單
在啟動PAI-Rec引擎前,需先創建并成功發布配置單至預發和生產環境。引擎將依據配置單中的設置進行初始化。若后續對配置進行了調整,可直接發布更新后的配置,引擎能夠實時讀取新配置并實現熱更新,無需重啟服務。
登錄PAI-Rec管理控制臺,在左側導航欄選擇系統配置>引擎配置。
在預發環境,單擊創建配置單,系統會提供默認設置,可直接創建。
單擊克隆,可從預發環境的配置克隆生成生產環境的配置單。
在生產環境,單擊目標配置單右側的詳情,進行發布。
創建服務
登錄PAI-Rec管理控制臺,在左側導航欄選擇系統配置>服務管理。
單擊創建服務,按照如下說明配置相關參數。
基礎配置
參數
描述
服務名稱
部署到PAI-EAS上的服務名稱。
服務描述
服務描述信息。
地域
部署到PAI-EAS的服務地域。
鏡像名稱
如果無需自定義開發代碼,選擇官方鏡像;如果需要自定義開發代碼,選擇用戶自定義鏡像,可參考快速創建項目打包鏡像。
鏡像密鑰
PAI-EAS通過此處設置的鏡像密鑰拉取鏡像。
推薦引擎配置
引擎服務用到的引擎配置名稱。需要先發布預發和生產環境的引擎配置。
EAS配置
配置EAS參數。
參數
描述
EAS資源組
如果沒有私有資源組,默認使用公共資源組即可。
EAS配置文件
包括預發環境配置和正式環境配置,通過該配置,在PAI-EAS分別創建預發服務和生產服務。
在預發環境配置頁簽,單擊復制配置,然后單擊前往EAS控制臺。
選擇對應工作空間后,單擊進入EAS,在模型在線服務(EAS)頁面,單擊部署服務。
選擇JSON獨立部署,將已復制的PAI-Rec預發環境配置粘貼在此處。
說明AccessKey
和AccessSecret
對應的值需要替換為您的阿里云賬號AccessKey ID和AccessKey Secret。為了安全,請務必使用阿里云子賬號的AccessKey。單擊部署。
等待服務狀態變為運行中時,代表預發服務部署成功。您可以單擊服務名稱,查看服務日志等信息。
部署生產服務,操作和預發服務同理。
待預發服務和生產服務部署完成后,單擊下一步。
系統會檢查預發和生產服務是否正常運行。檢查成功后,進入下一步。
預發發布/生產發布
如果使用官方鏡像部署,可跳過此步驟,直接創建。
測試服務
部署服務后,可以測試該服務。具體操作,請參見接口測試。
EAS控制臺測試
登錄PAI-EAS控制臺,單擊服務名稱,在在線調試頁簽,測試服務。接口路徑需要加上
/api/rec/feed
,請求的body設置參數即可。服務請求后,可以根據接口返回的request_id查看日志詳情。
PAI-Rec控制臺測試
登錄PAI-Rec管理控制臺,在左側導航欄選擇排查工具>推薦結果診斷,根據服務、環境和接口等進行測試。
引擎配置概覽
從上述接口中可知,返回了等于入參size
大小的item
數量,并且召回源名稱是mock_recall
。
在RecallConfs
定義了一路模擬的召回mock_recall
,在SceneConfs
中,場景home_feed
下引用了這一路召回。
詳細的引擎配置,請參見引擎配置單。
"RecallConfs": [
{
"Name": "mock_recall",
"RecallType": "MockRecall",
"RecallCount": 200
}
],
"SceneConfs": {
"home_feed": {
"default": {
"RecallNames": [
"mock_recall"
]
}
}
}
服務正式上線時,RecallNames
需要刪除mock_recall
。
引擎配置熱加載
服務部署后,可以按照實際需求調整引擎配置。例如,將上面的mock_recall
的召回數量從200調整到500。
登錄PAI-Rec管理控制臺,在左側導航欄選擇系統配置>引擎配置。
在生產頁簽,單擊目標引擎右側的查看。
單擊創建變更單內容,可以基于已發布的配置,創建變更內容,也可以對未發布的配置進行多次編輯修改。
編輯完成后,單擊發布。
發布成功后,PAI-Rec引擎服務會讀取到相應的配置,進行熱加載,無需重啟服務。
可以在EAS服務日志頁面搜索reload,查看是否成功加載。
加載的版本會和已發布的版本對應起來。
使用上面的方式進行測試,可以看到召回數量已經變化。