本文為您介紹如何通過PAI提供的用戶特征算法,快速構建用戶流失模型。
背景信息
業務發展過程中的重要環節包括開拓新用戶和保留老用戶。通過建立用戶流失預警風控模型,可以預測潛在流失用戶,從而提前通過運營手段防范用戶流失。
對于用戶流失預警監控,主流預警方案均是基于規則實現的,缺少智能化的預測手段和機制,不能準確挖掘潛在流失用戶。
解決方案
PAI提供了一套基于標簽數據的特征編碼、分類模型訓練及模型評估的完整方案,具體要求如下:
人力要求:需要具備基礎建模的背景知識。
開發周期:1~2天。
數據要求:上千條的標簽數據,該數據標記了歷史客戶在哪種特征情況下流失。
數據集
本工作流數據來源于真實的電信領域客戶行為脫敏數據,包含用戶基本信息及用戶流失屬性,共7043條樣本數據。工作流的示例數據如下。特征數據包括如下字段。
參數 | 描述 |
customerid | 用戶ID。 |
gender | 性別。 |
SeniorCitizen | 是否為市民,其中:
|
Partner | 是否有Partner。 |
Dependents | 是否存在從屬關系。 |
tenure | 客戶在該公司的使用時長。 |
PhoneService | 是否提供手機服務。 |
MultipleLine | 是否存在多條線路。 |
InternetService | 互聯網服務商。例如DSL或Fiber optic。 |
OnlineSecurity | 是否存在互聯網在線安全問題。 |
OnlineBackup | 是否提供線上支持。 |
DeviceProtection | 是否提供設備保護。 |
TechSupport | 是否申請過技術支持。 |
StreamingTV | 是否提供流TV。 |
StreamingMovies | 是否提供流電影。 |
Contract | 合同時限。例如Month-to-month或Two year。 |
PaperlessBilling | 是否有電子賬單。 |
PaymentMethod | 付款方式。 |
MonthlyCharges | 月消費。 |
TotalCharges | 總消費。 |
目標數據包括如下字段。
參數 | 描述 |
churn | 用戶是否流失。 |
用戶流失預警風控
進入PAI-Designer頁面。
登錄PAI控制臺。
在左側導航欄單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應工作空間內。
在工作空間頁面的左側導航欄選擇 ,進入Designer頁面。
構建工作流。
在PAI-Designer頁面,單擊預置模板頁簽。
在模板列表的流失用戶監控區域,單擊創建。
在新建工作流對話框,配置參數(可以全部使用默認參數)。
其中:工作流數據存儲配置為OSS Bucket路徑,用于存儲工作流運行中產出的臨時數據和模型。
單擊確定。
您需要等待大約十秒鐘,工作流可以創建成功。
在工作流列表,雙擊流失用戶監控工作流,進入工作流。
系統根據預置的模板,自動構建工作流,如下圖所示。
區域
描述
①
工作流的數據集。
②
通過one-hot編碼組件和SQL腳本實現特征工程建模,將原始字符型特征轉化為數值型。以目標字段churn為例,原始數據為Yes或No,可以通過SQL語句將Yes轉化為1,將No轉化為0,示例如下。
select (case churn when 'Yes' then 1 else 0 end) as churn from ${t1};
③
將數據分為訓練數據集和預測數據集。因為某用戶只有流失與不流失兩種可能性,所以用戶流失預警屬于二分類問題,可以使用二分類算法進行處理。
④
使用二分類評估組件進行模型驗證,可以通過AUC、KS及F1Score等指標評估模型效果。
運行工作流并查看模型效果。
單擊畫布上方的運行。
工作流運行結束后,右鍵單擊畫布中的二分類評估,在快捷菜單,單擊可視化分析。
在二分類評估對話框,單擊指標數據頁簽,即可查看模型評估指標數據。
AUC取值越接近1,表示模型的預測準確率越高。本文中的AUC取值達到0.8以上,即模型的預測準確率較高。