對OSS表格文件中的敏感數(shù)據(jù)進行脫敏
使用數(shù)據(jù)安全中心 DSC(Data Security Center)的靜態(tài)脫敏,對當前賬號下源OSS Bucket中的結(jié)構(gòu)化TXT、CSV、XLSX和XLS格式文件中的敏感數(shù)據(jù)進行脫敏,然后將脫敏后的文件保存到當前賬號下的目標OSS Bucket,實現(xiàn)數(shù)據(jù)的安全共享。
方案概覽
脫敏后數(shù)據(jù)示例:
脫敏前的數(shù)據(jù) | 脫敏后的數(shù)據(jù) | ||||
姓名 | 手機號 | 身份證號碼 | 姓名 | 手機號 | 身份證號碼 |
張三三 | 13900001234 | 111222190002309000 | 張** | 139****1234 | 111###########9000 |
李四四 | 13900001111 | 150802202207214000 | 李** | 139****1111 | 150###########4000 |
王五五 | 13900002222 | 120105195001066000 | 王** | 139****2222 | 120###########6000 |
要實現(xiàn)以上數(shù)據(jù)脫敏效果,只需4步:
創(chuàng)建OSS Bucket并上傳文件:創(chuàng)建源OSS Bucket和目標OSS Bucket,并上傳包含敏感數(shù)據(jù)的表格文件到源OSS Bucket。
將OSS Bucket文件接入DSC:DSC授權(quán)接入OSS Bucket,確保DSC能對OSS Bucket進行讀取和寫入操作。
新增脫敏任務(wù):創(chuàng)建脫敏任務(wù),配置源文件中敏感字段的脫敏算法及對應(yīng)脫敏規(guī)則,以及脫敏后文件的存儲位置等。
啟動脫敏任務(wù):啟動任務(wù),對源OSS Bucket中表格文件中的敏感數(shù)據(jù)進行脫敏,然后將脫敏后的文件保存到目標OSS Bucket。
前提條件
當前賬號已購買數(shù)據(jù)安全中心實例并授權(quán)數(shù)據(jù)安全中心訪問其他阿里云資源。
因數(shù)據(jù)安全中心服務(wù)僅企業(yè)版實例支持數(shù)據(jù)脫敏功能,所以必須購買數(shù)據(jù)安全中心的企業(yè)版,本示例針對OSS文件數(shù)據(jù)脫敏,僅需開啟OSS數(shù)據(jù)管理服務(wù),選擇最低標準的OSS防護容量,對于數(shù)據(jù)庫管理和增值模塊服務(wù)可以全部關(guān)閉。
當前賬號已開通對象存儲OSS。
步驟一:創(chuàng)建OSS Bucket并上傳文件
1.1 創(chuàng)建源OSS Bucket和目標OSS Bucket
在對象存儲OSS控制臺的Bucket列表頁面,單擊創(chuàng)建Bucket。
在創(chuàng)建 Bucket面板,配置如下參數(shù),其他參數(shù)采用默認配置,然后單擊完成創(chuàng)建。該OSS Bucket作為源OSS Bucket使用。
重復(fù)以上操作步驟,再創(chuàng)建一個OSS Bucket作為目標OSS Bucket使用。
1.2 上傳表格文件到源OSS Bucket
在對象存儲OSS控制臺的Bucket列表頁面的Bucket列表,單擊源OSS Bucket名稱。
在文件列表頁面,單擊上傳文件。
單擊掃描文件,選擇本地文件(本文上傳示例文件userdata.csv中包含姓名、手機號和身份證號碼的敏感信息),然后單擊上傳文件,等待文件上傳成功。
步驟二:將OSS Bucket文件接入DSC
在數(shù)據(jù)安全中心的授權(quán)管理頁面,單擊資產(chǎn)授權(quán)管理。
在資產(chǎn)授權(quán)管理面板的非結(jié)構(gòu)化數(shù)據(jù)下,選擇OSS,單擊資產(chǎn)同步。
資產(chǎn)同步完成后,選擇源OSS Bucket和目標OSS Bucket,然后單擊批量授權(quán)。
批量授權(quán)完成后,在資產(chǎn)授權(quán)管理頁面,選擇源OSS Bucket和目標OSS Bucket,然后單擊批量連接。
在提示框中,無需選中數(shù)據(jù)掃描和識別,直接單擊確定。
等待OSS Bucket的連接狀態(tài)變?yōu)?b data-tag="uicontrol" id="68bea08104bd8" class="uicontrol">已連接。
步驟三:新增脫敏任務(wù)
在數(shù)據(jù)安全中心的數(shù)據(jù)脫敏頁面,單擊新增脫敏任務(wù)。根據(jù)頁面導(dǎo)航,完成數(shù)據(jù)脫敏任務(wù)配置。
3.1 配置脫敏的源文件
輸入任務(wù)名稱后,配置脫敏源為源OSS Bucket中敏感文件userdata.csv
,對于csv
類型的文件,需要指定列分隔符為逗號,本文示例文件表格包含標題行。
3.2 配置敏感字段的脫敏規(guī)則
在脫敏算法導(dǎo)航頁中自動匹配展示userdata.csv
中標題行字段,本示例對姓名、手機號和身份證號碼進行遮蓋脫敏。
分別打開對應(yīng)字段的脫敏開關(guān),選擇遮蓋脫敏。
單擊遮蓋脫敏后的參數(shù)查看和修改,配置算法規(guī)則,單擊保存。本示例配置以下脫敏規(guī)則:
姓名:使用
*
遮蓋,保留前1后0。手機號:使用
*
遮蓋,遮蓋自4至7。身份證號碼:使用
#
遮蓋,保留前3后4。
3.3 配置脫敏后文件的存儲位置
OSS數(shù)據(jù)源不支持添加水印,直接配置脫敏后文件到目標Bucket中存儲,本示例選擇結(jié)果集形式保存,文件名可以自定義,文件類型必須為csv
、xls
或txt
。
3.4 配置脫敏任務(wù)的觸發(fā)方式
目前針對OSS文件脫敏任務(wù),僅支持任務(wù)觸發(fā)方式生效,其他參數(shù)配置均無效。
配置任務(wù)觸發(fā)方式為僅人工。
單擊提交。
步驟四:啟動脫敏任務(wù)
4.1 執(zhí)行任務(wù)
在靜態(tài)脫敏頁簽的任務(wù)配置頁簽,單擊新創(chuàng)建的脫敏任務(wù)操作列的啟動,執(zhí)行脫敏任務(wù)。
在靜態(tài)脫敏頁簽,單擊任務(wù)狀態(tài)子頁簽,等待脫敏任務(wù)的執(zhí)行進度為100%和狀態(tài)為執(zhí)行成功。
4.2 檢驗脫敏結(jié)果
前往對象存儲OSS控制臺的Bucket列表頁面,單擊目標Bucket名稱,在文件列表中找到脫敏后的文件,文件名格式為
<目標文件名稱>_<脫敏任務(wù)的執(zhí)行時間>.<文件類型>
。例如usernews_20240808150643.csv
,其中20240808150643
表示任務(wù)執(zhí)行時間為2024年08月08日的15:06:43。您可以單擊下載獲取該文件。下載完成后,打開該文件,可以看到姓名、手機號、身份證號碼已顯示為脫敏后的數(shù)據(jù)。
總結(jié)
對于存儲在OSS Bucket中原始數(shù)據(jù),可以脫敏后存儲到目標OSS Bucket再共享使用。數(shù)據(jù)脫敏后,即使共享數(shù)據(jù)遭泄露,也不會直接暴露敏感內(nèi)容,降低了數(shù)據(jù)濫用和隱私侵犯的風(fēng)險。脫敏后的數(shù)據(jù)可以在不泄露個人隱私的前提下,用于數(shù)據(jù)分析、模型訓(xùn)練、業(yè)務(wù)報告分享等場景。
靈活選擇脫敏算法
數(shù)據(jù)脫敏主要依賴脫敏算法及其規(guī)則,DSC支持的脫敏算法包括哈希脫敏、遮蓋脫敏、替換脫敏、變換脫敏、加密脫敏、數(shù)據(jù)解密和洗牌脫敏,每個脫敏算法都具備多種規(guī)則配置方法,在實際業(yè)務(wù)需求中可以選擇不同脫敏算法應(yīng)用到不同的業(yè)務(wù)場景中。
提升脫敏規(guī)則配置效率
DSC還支持脫敏模板功能,可以將相同應(yīng)用場景中使用頻率較高的脫敏算法配置在同一個脫敏模板中,并在配置靜態(tài)脫敏規(guī)則時使用已有模板,提高配置脫敏規(guī)則的效率。
更多內(nèi)容,請參見配置脫敏模板和算法。
定時脫敏任務(wù)
數(shù)據(jù)脫敏任務(wù)支持按照每小時、每天、每月或每周的某個時間點定時觸發(fā),以保障更新的數(shù)據(jù)能及時被脫敏使用。