DataWorks的數據血緣功能支持可視化展示敏感數據的血緣關系,自動分析字段之間的異常關聯關系、敏感數據識別結果異常的字段,幫助您梳理敏感數據的擴散情況及影響面,提高數據識別效率。本文為您介紹如何查看血緣關系圖。

背景信息

數據血緣為您提供如下功能:
  • 可視化血緣圖譜

    數據保護傘基于敏感字段之間的血緣關系,繪制成敏感數據血緣可視化圖譜,幫助您清晰的了解數據的來龍去脈。

  • 提升數據識別效率

    敏感數據自動識別任務可基于敏感字段血緣關系,將其中敏感字段類型相同的血緣關系進行識別結果擴散,極大提高識別效率。

  • 異常血緣關系分析
    • 關聯關系異常的字段分析

      系統根據敏感字段的血緣關系,自動分析字段之間的異常關聯關系(例如,SELECT_CONCAT、SELECT_SUBSTRING等關系),避免相關人員通過字符拼接、拆解的方式繞過敏感數據的識別和使用審計。

    • 關聯但識別結果不一致的字段分析

      幫助您識別出與查詢字段有血緣關系,但敏感字段類型識別結果不一致的字段。例如,查詢A字段,敏感數據類型為姓名,與其有血緣關系的字段有B(姓名)、C(省份),則識別結果不一致的字段是C。

使用限制

僅DataWorks企業版及以上版本用戶才可以使用數據血緣功能。版本升級詳情請參見DataWorks版本服務計費說明

進入數據血緣

  1. 進入數據保護傘。
    1. 登錄DataWorks控制臺后,進入數據保護傘頁面,操作詳情請參見數據保護傘概述
    2. 單擊開始體驗,默認進入數據保護傘的首頁
  2. 進入數據血緣。
    您可以通過以下兩種方式進入數據血緣頁面。
    • 進入手動修正數據頁面,找到需要查看血緣關系的字段,單擊操作列的血緣分析跳轉至數據血緣頁面。
    • 進入數據保護傘后,在左側導航欄單擊數據血緣。進入數據血緣頁面。

查看血緣關系圖

數據血緣頁面為您可視化展示敏感數據的血緣關系。數據血緣
類別描述
分析場景當前默認分析場景為單個字段的血緣關系,后續會陸續上線其他場景,敬請期待。
篩選在上圖的模塊②區域,支持您輸入要查詢的字段所屬項目所屬表字段名,單擊查詢,頁面將為您展示對應字段的一層血緣關系,查詢的字段會高亮顯示。
過濾條件在上圖模塊③區域,您可以根據需求選擇過濾條件:
  • 關聯但識別結果不一致的字段
    勾選后,將會自動刷新血緣關系圖,為您展示與查詢字段有血緣關系,但敏感字段類型識別結果不一致的字段,并展示字段之間的邊關系。
    說明 邊關系為您創建字段時使用的SQL函數名稱,例如,SELECT、SELECT_LTRIM等。
  • 關聯關系異常字段

    勾選后,將會自動刷新血緣關系圖,為您展示關聯關系異常(例如,SELECT_CONCAT、SELECT_SUBSTRING等關系)的字段,并展示字段之間的邊關系。

  • 同時勾選關聯但識別結果不一致的字段關聯關系異常字段時,將為您展示與選中的查詢字段,關聯關系異常且敏感字段類型識別結果不一致的字段,并展示字段之間的邊關系。
血緣關系圖在上圖模塊④區域,為您展示對應查詢字段的一層血緣關系圖,您可以單擊對應字段或字段中間的邊關系按鈕,查看字段信息和邊信息。
  • 查看字段信息
    單擊字段,將為您打開字段詳情頁面,字段詳情頁面展示當前字段的數據位置信息、敏感字段類型,以及上、下游關聯字段列表、字段之間的關聯關系(例如,SELECT、SELECT_CONCAT、SELECT_REPEAT等關系)等。對于識別結果不準確的數據,您可以通過下圖區域①修改當前字段的敏感字段類型;通過下圖區域②修改上、下游關聯字段的敏感字段類型分類分級等信息。
    說明
    • 當查詢的字段沒有上、下游關聯字段時,列表將顯示暫無數據。
    • 當敏感字段類型為非敏感字段或未識別時,敏感字段類型、分類、分級等信息將展示為空。
    • 修改敏感字段類型后,會同步更新敏感數據概況手動修正數據頁面的數據。
    • 每個字段最多顯示一層上、下游關聯字段信息。
    字段信息
  • 查看邊信息
    單擊兩個字段中間的邊關系按鈕,將在右側彈窗展示邊關系詳情。包括:邊關系邊關系類型SQL詳情上游節點列表下游節點列表。對于識別結果不準確的數據,您可以單擊邊關系類型右側的下拉框修改字段間關聯關系;單擊上下游節點敏感字段類型下拉框修改敏感字段類型。
    說明
    • 當邊關系異常時,在邊關系右側將展示異常關聯標簽,若無異常右側將不展示任何標簽。
    • 異常關聯關系包括SELECT_CONCAT、SELECT_SUBSTRING等關系,即相關人員通過字符拼接、拆解的方式繞過敏感數據識別的情況。
    • 邊關系類型為您創建字段時使用的SQL函數名稱,例如,SELECT、SELECT_LTRIM等。
    • 當敏感字段類型為非敏感字段或未識別時,敏感字段類型將展示為空。
    邊關系

批量修正數據

您可以通過以下兩種方式,對敏感數據識別結果不準確的字段進行批量修正。

  • 通過血緣關系圖查看當前字段的上、下游關聯字段詳情,批量選中字段進行修正。批量修正
  • 進入手動修正數據頁面,批量選中字段進行修正。詳情請參見:手動修正數據