使用數據安全中心 DSC(Data Security Center)的靜態脫敏,對當前賬號下源OSS Bucket中的結構化TXT、CSV、XLSX和XLS格式文件中的敏感數據進行脫敏,然后將脫敏后的文件保存到當前賬號下的目標OSS Bucket,實現數據的安全共享。
方案概覽
脫敏后數據示例:
脫敏前的數據 | 脫敏后的數據 | ||||
姓名 | 手機號 | 身份證號碼 | 姓名 | 手機號 | 身份證號碼 |
張三三 | 13900001234 | 111222190002309000 | 張** | 139****1234 | 111###########9000 |
李四四 | 13900001111 | 150802202207214000 | 李** | 139****1111 | 150###########4000 |
王五五 | 13900002222 | 120105195001066000 | 王** | 139****2222 | 120###########6000 |
要實現以上數據脫敏效果,只需4步:
創建OSS Bucket并上傳文件:創建源OSS Bucket和目標OSS Bucket,并上傳包含敏感數據的表格文件到源OSS Bucket。
將OSS Bucket文件接入DSC:DSC授權接入OSS Bucket,確保DSC能對OSS Bucket進行讀取和寫入操作。
新增脫敏任務:創建脫敏任務,配置源文件中敏感字段的脫敏算法及對應脫敏規則,以及脫敏后文件的存儲位置等。
啟動脫敏任務:啟動任務,對源OSS Bucket中表格文件中的敏感數據進行脫敏,然后將脫敏后的文件保存到目標OSS Bucket。
前提條件
當前賬號已購買數據安全中心實例并授權數據安全中心訪問其他阿里云資源。
因數據安全中心服務僅企業版實例支持數據脫敏功能,所以必須購買數據安全中心的企業版,本示例針對OSS文件數據脫敏,僅需開啟OSS數據管理服務,選擇最低標準的OSS防護容量,對于數據庫管理和增值模塊服務可以全部關閉。
當前賬號已開通對象存儲OSS。
步驟一:創建OSS Bucket并上傳文件
1.1 創建源OSS Bucket和目標OSS Bucket
在對象存儲OSS控制臺的Bucket列表頁面,單擊創建Bucket。
在創建 Bucket面板,配置如下參數,其他參數采用默認配置,然后單擊完成創建。該OSS Bucket作為源OSS Bucket使用。
重復以上操作步驟,再創建一個OSS Bucket作為目標OSS Bucket使用。
1.2 上傳表格文件到源OSS Bucket
在對象存儲OSS控制臺的Bucket列表頁面的Bucket列表,單擊源OSS Bucket名稱。
在文件列表頁面,單擊上傳文件。
單擊掃描文件,選擇本地文件(本文上傳示例文件userdata.csv中包含姓名、手機號和身份證號碼的敏感信息),然后單擊上傳文件,等待文件上傳成功。
步驟二:將OSS Bucket文件接入DSC
在數據安全中心的授權管理頁面,單擊資產授權管理。
在資產授權管理面板的非結構化數據下,選擇OSS,單擊資產同步。
資產同步完成后,選擇源OSS Bucket和目標OSS Bucket,然后單擊批量授權。
批量授權完成后,在資產授權管理頁面,選擇源OSS Bucket和目標OSS Bucket,然后單擊批量連接。
在提示框中,無需選中數據掃描和識別,直接單擊確定。
等待OSS Bucket的連接狀態變為已連接。
步驟三:新增脫敏任務
在數據安全中心的數據脫敏頁面,單擊新增脫敏任務。根據頁面導航,完成數據脫敏任務配置。
3.1 配置脫敏的源文件
輸入任務名稱后,配置脫敏源為源OSS Bucket中敏感文件userdata.csv
,對于csv
類型的文件,需要指定列分隔符為逗號,本文示例文件表格包含標題行。
3.2 配置敏感字段的脫敏規則
在脫敏算法導航頁中自動匹配展示userdata.csv
中標題行字段,本示例對姓名、手機號和身份證號碼進行遮蓋脫敏。
分別打開對應字段的脫敏開關,選擇遮蓋脫敏。
單擊遮蓋脫敏后的參數查看和修改,配置算法規則,單擊保存。本示例配置以下脫敏規則:
姓名:使用
*
遮蓋,保留前1后0。手機號:使用
*
遮蓋,遮蓋自4至7。身份證號碼:使用
#
遮蓋,保留前3后4。
3.3 配置脫敏后文件的存儲位置
OSS數據源不支持添加水印,直接配置脫敏后文件到目標Bucket中存儲,本示例選擇結果集形式保存,文件名可以自定義,文件類型必須為csv
、xls
或txt
。
3.4 配置脫敏任務的觸發方式
目前針對OSS文件脫敏任務,僅支持任務觸發方式生效,其他參數配置均無效。
配置任務觸發方式為僅人工。
單擊提交。
步驟四:啟動脫敏任務
4.1 執行任務
在靜態脫敏頁簽的任務配置頁簽,單擊新創建的脫敏任務操作列的啟動,執行脫敏任務。
在靜態脫敏頁簽,單擊任務狀態子頁簽,等待脫敏任務的執行進度為100%和狀態為執行成功。
4.2 檢驗脫敏結果
前往對象存儲OSS控制臺的Bucket列表頁面,單擊目標Bucket名稱,在文件列表中找到脫敏后的文件,文件名格式為
<目標文件名稱>_<脫敏任務的執行時間>.<文件類型>
。例如usernews_20240808150643.csv
,其中20240808150643
表示任務執行時間為2024年08月08日的15:06:43。您可以單擊下載獲取該文件。下載完成后,打開該文件,可以看到姓名、手機號、身份證號碼已顯示為脫敏后的數據。
總結
對于存儲在OSS Bucket中原始數據,可以脫敏后存儲到目標OSS Bucket再共享使用。數據脫敏后,即使共享數據遭泄露,也不會直接暴露敏感內容,降低了數據濫用和隱私侵犯的風險。脫敏后的數據可以在不泄露個人隱私的前提下,用于數據分析、模型訓練、業務報告分享等場景。
靈活選擇脫敏算法
數據脫敏主要依賴脫敏算法及其規則,DSC支持的脫敏算法包括哈希脫敏、遮蓋脫敏、替換脫敏、變換脫敏、加密脫敏、數據解密和洗牌脫敏,每個脫敏算法都具備多種規則配置方法,在實際業務需求中可以選擇不同脫敏算法應用到不同的業務場景中。
提升脫敏規則配置效率
DSC還支持脫敏模板功能,可以將相同應用場景中使用頻率較高的脫敏算法配置在同一個脫敏模板中,并在配置靜態脫敏規則時使用已有模板,提高配置脫敏規則的效率。
更多內容,請參見配置脫敏模板和算法。
定時脫敏任務
數據脫敏任務支持按照每小時、每天、每月或每周的某個時間點定時觸發,以保障更新的數據能及時被脫敏使用。