創(chuàng)建及管理識別特征
識別特征基于字段的數(shù)據(jù)內(nèi)容、元數(shù)據(jù)屬性,結(jié)合正則表達式、包含、不包含等運算條件對數(shù)據(jù)特征進行表達,從而智能推薦相關(guān)的數(shù)據(jù)分類分級或數(shù)據(jù)標準。Dataphin內(nèi)置了多種識別特征表達式,如手機號、身份證號等。此外,您也可以自定義識別特征。本文為您介紹如何創(chuàng)建及管理識別特征。
前提說明
識別特征可以同時用于智能推薦數(shù)據(jù)標準映射關(guān)系與字段的分類分級打標結(jié)果。特征掃描配置將同時影響標準模塊的落標映射規(guī)則與安全模塊的識別規(guī)則運行,請結(jié)合兩個模塊的使用場景合理配置,以減少語義沖突、資源浪費等問題的產(chǎn)生。
權(quán)限說明
超級管理員、數(shù)據(jù)標準管理員、安全管理員和具有識別特征管理權(quán)限的自定義全局角色支持新建及管理識別特征。
添加識別特征
在Dataphin首頁,在頂部菜單欄選擇治理 > 數(shù)據(jù)安全。
在左側(cè)導(dǎo)航欄選擇通用配置 > 識別特征,在識別特征頁面,單擊新建特征按鈕。
在添加特征對話框中,配置參數(shù)。
參數(shù)
描述
特征名稱
請?zhí)顚懽R別特征的名稱,名稱唯一,最多輸入128字符。
特征條件
支持選擇按內(nèi)容掃描、按字段名稱掃描、按字段描述掃描、按數(shù)據(jù)類型掃描。
按內(nèi)容掃描:根據(jù)采樣讀取目標字段數(shù)據(jù)內(nèi)容進行識別和判斷。
正則(大小兼容):在輸入框中輸入正則表達式。例如,如果您需要匹配所有名稱中帶有test,則正則表達式定義為
.*test.*
,同時進行掃描結(jié)果的大小寫兼容處理。正則表達式:在輸入框中輸入正則表達式。例如,如果您需要匹配所有名稱中帶有test,則正則表達式定義為
.*test.*
。識別閾值:只有內(nèi)容匹配率超過識別閾值,該規(guī)則才會被認為是有效識別,進入該字段的識別結(jié)果中進行比較。
按字段名稱掃描:根據(jù)元數(shù)據(jù)中的字段名稱進行掃描判斷。
正則(大小兼容):在輸入框中輸入正則表達式。例如,如果您需要匹配所有名稱中帶有test,則正則表達式定義為
.*test.*
,同時進行掃描結(jié)果的大小寫兼容處理。正則表達式:在輸入框中輸入正則表達式。例如,如果您需要匹配所有名稱中帶有test,則正則表達式定義為
.*test.*
。包含/不包含:關(guān)鍵詞匹配,如匹配用戶信息表,輸入user_info。
按字段描述掃描:根據(jù)元數(shù)據(jù)中的字段描述進行掃描判斷。
正則(大小兼容):在輸入框中輸入正則表達式。例如,如果您需要匹配所有名稱中帶有test,則正則表達式定義為
.*test.*
,同時進行掃描結(jié)果的大小寫兼容處理。正則表達式:在輸入框中輸入正則表達式。例如您需要匹配所有名稱中帶有test,則正則表達式定義為
.*test.*
。包含/不包含:關(guān)鍵詞匹配,如匹配用戶信息表,輸入user_info。
按數(shù)據(jù)類型掃描:根據(jù)元數(shù)據(jù)中的字段的數(shù)據(jù)類型進行掃描判斷。掃描條件支持等于,可選擇的數(shù)據(jù)類型包括tinyint、smallint、mediumint、int、bigint、decimal、bit、date、datetime、timestamp、varchar、text、json。
說明至少配置一條規(guī)則。如需添加規(guī)則,請單擊+添加規(guī)則按鈕。
最多配置5條規(guī)則,且最多配置2層關(guān)系。
過濾條件之間的關(guān)系可配置為且、或。
單擊確定,完成識別特征添加。
查看識別特征
識別特征添加后,您可以在識別特征頁面查看配置的信息及進行編輯、刪除等操作。
區(qū)域 | 描述 |
①篩選及搜索區(qū) | 您可以根據(jù)識別特征的名稱進行模糊搜索,也可以根據(jù)識別特征來源進行精確篩選。 |
②識別特征列表 | 為您展示識別特征的名稱、類型、最近更新人、最近更新時間信息。同時,您可以對自定義的識別特征執(zhí)行查看、編輯、克隆、刪除操作;系統(tǒng)內(nèi)置識別特征執(zhí)行查看、克隆操作。
|
后續(xù)步驟
識別特征配置完成后,您可以在創(chuàng)建數(shù)據(jù)分類時關(guān)聯(lián)識別特征,用于智能推薦字段分類分級的打標結(jié)果。詳情請參見創(chuàng)建及管理數(shù)據(jù)分類。
在識別規(guī)則掃描及血緣自動繼承掃描過程中根據(jù)定義的特征自動推薦分類分級。詳情請參見創(chuàng)建及管理識別規(guī)則。