本文為您介紹人群圈選任務的輸入數據和輸出數據說明。

圈選任務輸入數據說明

準備輸入數據

  • 當您的訓練數據集和預測數據集完全一致時,即user_id是完全相同的一批數據,您只需按照下方輸入數據格式說明準備人群數據即可。
    說明 您無需準備特征數據,系統會從人群圈選任務關聯的策略訓練任務的輸入數據中自動獲取。
  • 當您的訓練數據集和預測數據集不完全一致時,您需要為待圈選用戶準備特征數據,即用戶基礎信息(user)、物品基礎信息(item)、用戶行為(behavior)和運營記錄(operation)4張維表數據,具體格式要求,詳情請參見策略訓練任務輸入數據格式說明。
    重要 為保證圈選結果的準確性,請您為待圈選用戶準備最新的特征數據。
例如:您一共有100萬條用戶數據,參考以下兩種場景,準備輸入數據。
場景 圈選任務輸入數據
其中5萬條數據同時為訓練數據集和預測數據集。 您只需按照輸入數據格式說明準備5萬條包含user_iditem_idphone字段的人群數據。
其中5萬條數據為訓練數據集,100萬條數據為預測數據集。 您需要按照策略訓練任務輸入數據格式說明,為100萬條預測數據集準備用戶基礎維表(user)、物品基礎維表(item)、行為維表(behavior)和運營記錄維表(operation)四張維表數據。

輸入數據格式說明

人群圈選任務包含以下兩類輸入數據:
  • 待圈選人群數據,各字段定義如下表所示。
    字段名稱 描述
    user_id 待圈選的用戶ID,String類型,不能為空。
    item_id 物品ID,String類型,不能為空。
    phone 待圈選的用戶的手機號,String類型。
    • 當算法類型為回流概率時,輸入數據包含user_id、item_idphone字段。
    • 當算法類型為流失預測時,輸入數據包含user_idphone字段。
  • 待圈選人群特征數據

    系統從人群圈選任務關聯的策略訓練任務的輸入數據中自動獲取,請確保每天更新策略訓練任務的輸入數據。

圈選任務輸出數據格式說明

圈選任務圈選完成后,輸出的數據格式說明如下表所示。
列名 描述
user_id 待圈選的用戶ID,String類型,不能為空。
item_id 物品ID,String類型,不能為空。
phone 待圈選的用戶的手機號,String類型。
score 模型對該user_id的打分。