本文為您介紹推薦解決方案-etrec召回的實現方法。
數據集
pai_online_project.rec_sln_demo_behavior_table
字段名 | 類型 | 描述 |
request_id | BIGINT | 埋點ID/請求ID |
user_id | BIGINT | 用戶唯一ID |
exp_id | STRING | 實驗ID |
page | STRING | 頁面 |
net_type | STRING | 網絡類型 |
event_time | BIGINT | 行為時間 |
item_id | BIGINT | 內容ID |
event | STRING | 行為類型 |
playtime | DOUBLE | 播放時長/閱讀時長 |
ds | STRING | 分區列名 |
etrec召回
進入Designer頁面
登錄PAI控制臺。
在左側導航欄單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。
在工作空間頁面的左側導航欄選擇模型開發與訓練 > 可視化建模(Designer),進入Designer頁面。
構建工作流
在Designer頁面,單擊預置模板頁簽。
在模板列表的推薦解決方案-etrec召回區域,單擊創建。
在新建工作流對話框,配置參數(可以全部使用默認參數)。
其中:工作流數據存儲配置為OSS Bucket路徑,用于存儲工作流運行中產出的臨時數據和模型。
單擊確定。您需要等待大約十秒鐘,工作流可以創建成功。
在工作流列表,雙擊推薦解決方案-etrec召回工作流,進入工作流。
系統根據預置的模板,自動構建工作流,如下圖所示。
組件編號
描述
1
行為權重。
2
準備Item-to-Item30天的訓練樣本。
3
通過對用戶歷史交互的Item進行加權統計,提高了召回U2I Trigger的準確性。
4
EtrecI2I協同過濾模型訓練。
5
EtrecI2I Score拆分成KKV形式的分區表。
6
關聯U2I Trigger和I2I表,計算U2I2I召回Top500的結果。
運行工作流并查看輸出結果
填寫全局變量
單擊畫布上方的運行。
工作流運行結束后,在DataWorks上查看MaxCompute表rec_sln_demo_etrec_u2i2i_score_v1,具體操作,請參見查看表詳情。