本文為您介紹人群圈選任務的輸入數據和輸出數據說明。
圈選任務輸入數據說明
準備輸入數據
- 當您的訓練數據集和預測數據集完全一致時,即user_id是完全相同的一批數據,您只需按照下方輸入數據格式說明準備人群數據即可。
說明 您無需準備特征數據,系統會從人群圈選任務關聯的策略訓練任務的輸入數據中自動獲取。
- 當您的訓練數據集和預測數據集不完全一致時,您需要為待圈選用戶準備特征數據,即用戶基礎信息(user)、物品基礎信息(item)、用戶行為(behavior)和運營記錄(operation)4張維表數據,具體格式要求,詳情請參見策略訓練任務輸入數據格式說明。
重要 為保證圈選結果的準確性,請您為待圈選用戶準備最新的特征數據。
場景 | 圈選任務輸入數據 |
---|---|
其中5萬條數據同時為訓練數據集和預測數據集。 | 您只需按照輸入數據格式說明準備5萬條包含user_id、item_id和phone字段的人群數據。 |
其中5萬條數據為訓練數據集,100萬條數據為預測數據集。 | 您需要按照策略訓練任務輸入數據格式說明,為100萬條預測數據集準備用戶基礎維表(user)、物品基礎維表(item)、行為維表(behavior)和運營記錄維表(operation)四張維表數據。 |
輸入數據格式說明
人群圈選任務包含以下兩類輸入數據:
- 待圈選人群數據,各字段定義如下表所示。
字段名稱 描述 user_id 待圈選的用戶ID,String類型,不能為空。 item_id 物品ID,String類型,不能為空。 phone 待圈選的用戶的手機號,String類型。 - 當算法類型為回流概率時,輸入數據包含user_id、item_id和phone字段。
- 當算法類型為流失預測時,輸入數據包含user_id和phone字段。
- 待圈選人群特征數據
系統從人群圈選任務關聯的策略訓練任務的輸入數據中自動獲取,請確保每天更新策略訓練任務的輸入數據。
圈選任務輸出數據格式說明
圈選任務圈選完成后,輸出的數據格式說明如下表所示。
列名 | 描述 |
---|---|
user_id | 待圈選的用戶ID,String類型,不能為空。 |
item_id | 物品ID,String類型,不能為空。 |
phone | 待圈選的用戶的手機號,String類型。 |
score | 模型對該user_id的打分。 |