基于圖算法實(shí)現(xiàn)金融風(fēng)控
本文為您介紹如何基于圖算法,實(shí)現(xiàn)金融風(fēng)控。
背景信息
圖算法通常適用于關(guān)系網(wǎng)狀的業(yè)務(wù)場(chǎng)景。與常規(guī)結(jié)構(gòu)化數(shù)據(jù)不同,圖算法將數(shù)據(jù)整理為首尾相連的關(guān)系圖譜,需要考慮邊和點(diǎn)。PAI提供了豐富的圖算法組件,包括K-Core、最大聯(lián)通子圖及標(biāo)簽傳播聚類等。
本實(shí)驗(yàn)以人物通聯(lián)關(guān)系圖(如下圖所示)為例,基于圖算法實(shí)現(xiàn)金融風(fēng)控。兩人之間的連線表示兩人具有一定關(guān)系,可以是同事或親人等。已知Enoch為信用用戶,Evan為欺詐用戶,通過(guò)圖算法可以計(jì)算其它人的信用指數(shù),獲得每個(gè)人為欺詐用戶的概率,從而指導(dǎo)相關(guān)機(jī)構(gòu)進(jìn)行金融風(fēng)控。
數(shù)據(jù)集
本工作流數(shù)據(jù)集的具體字段如下。
字段名 | 含義 | 類型 | 描述 |
start_point | 邊的起始節(jié)點(diǎn) | STRING | 人物。 |
end_point | 邊的結(jié)束節(jié)點(diǎn) | STRING | 人物。 |
count | 關(guān)系緊密度 | DOUBLE | 數(shù)值越大,兩人的關(guān)系越緊密。 |
數(shù)據(jù)的示例如下。
基于圖算法實(shí)現(xiàn)金融風(fēng)控
進(jìn)入Designer頁(yè)面。
登錄PAI控制臺(tái)。
在左側(cè)導(dǎo)航欄單擊工作空間列表,在工作空間列表頁(yè)面中單擊待操作的工作空間名稱,進(jìn)入對(duì)應(yīng)的工作空間。
在工作空間頁(yè)面的左側(cè)導(dǎo)航欄選擇 ,進(jìn)入Designer頁(yè)面。
構(gòu)建工作流。
在Designer頁(yè)面,單擊預(yù)置模板頁(yè)簽。
在模板列表,單擊圖算法-金融風(fēng)控實(shí)驗(yàn)下的創(chuàng)建。
在新建工作流對(duì)話框,配置參數(shù)(可以全部使用默認(rèn)參數(shù))。
其中:工作流數(shù)據(jù)存儲(chǔ)配置為OSS Bucket路徑,用于存儲(chǔ)工作流運(yùn)行中產(chǎn)出的臨時(shí)數(shù)據(jù)和模型。
單擊確定。
您需要等待大約十秒鐘,工作流可以創(chuàng)建成功。
在工作流列表,雙擊圖算法-金融風(fēng)控實(shí)驗(yàn),進(jìn)入工作流。
系統(tǒng)根據(jù)預(yù)置的模板,自動(dòng)構(gòu)建工作流,如下圖所示。
區(qū)域
描述
①
首先通過(guò)最大聯(lián)通子圖組件將數(shù)據(jù)中的群體分為兩部分,并賦予group_id。然后通過(guò)SQL腳本組件和JOIN組件去除圖中的無(wú)關(guān)聯(lián)人員。
最大聯(lián)通子圖組件可以查找具有通聯(lián)關(guān)系的最大集合,從而排除團(tuán)隊(duì)中與風(fēng)控?zé)o關(guān)的人,如下圖所示。
②
探查每個(gè)人的一度人脈及二度人脈等關(guān)系。單源最短路徑組件的輸出結(jié)果中,distance表示Enoch通過(guò)幾個(gè)人可以聯(lián)絡(luò)到目標(biāo)人,如下圖所示。
③
首先通過(guò)讀數(shù)據(jù)表組件導(dǎo)入標(biāo)簽數(shù)據(jù)(weight表示目標(biāo)屬于欺詐用戶的概率,如下圖所示)。然后通過(guò)標(biāo)簽傳播分類組件預(yù)測(cè)未標(biāo)記節(jié)點(diǎn)的標(biāo)簽信息。最后通過(guò)SQL腳本篩選結(jié)果,從而展示每個(gè)人的涉嫌欺詐概率。
標(biāo)簽傳播分類算法為半監(jiān)督的分類算法,其輸入包括人物通聯(lián)圖和標(biāo)簽數(shù)據(jù),通過(guò)已標(biāo)記節(jié)點(diǎn)的標(biāo)簽信息預(yù)測(cè)未標(biāo)記節(jié)點(diǎn)的標(biāo)簽信息。算法執(zhí)行過(guò)程中,每個(gè)節(jié)點(diǎn)的標(biāo)簽根據(jù)相似度傳播給相鄰節(jié)點(diǎn)。
運(yùn)行工作流并查看輸出結(jié)果。
單擊畫布上方的。
工作流運(yùn)行結(jié)束后,右鍵單擊區(qū)域③中的SQL腳本,在快捷菜單,單擊查看數(shù)據(jù),即可查看每個(gè)人的欺詐概率。