數據脫敏
敏感數據在使用的過程中,應根據實際使用場景進行一定程度的脫敏,數據脫敏也是滿足數據相關安全法規的一項安全控制措施,在執行數據脫敏的過程中,應注意數據脫敏的程度。從脫敏程度看分為了可逆和不可逆,企業需要結合實際脫敏場景來進行選擇。
常見的可逆脫敏算法和方式如下:
替換脫敏:部分可逆算法,適用于證件號等構成規則固定的字段脫敏。使用替換碼表進行映射替換(可逆Tokenization),或使用隨機區間進行隨機替換(不可逆),實現字段整體或者部分內容的脫敏。
加密脫敏:可逆算法,適用于對需要回源的字段進行加密的場景。支持常見的對稱加密算法。
數據解密:可逆算法,適用于對需要回源的字段進行解密的場景。支持常見的對稱加密算法。
常見的不可逆脫敏算法和方式如下:
哈希脫敏:不可逆算法,適用于密碼或需要通過對比進行敏感數據確認的場景。支持常見的哈希算法,并支持偏移量(加鹽值)配置。
遮蓋脫敏:不可逆算法,適用于前端展示或敏感數據分享的場景。通過使用特殊字符(*或者#),對部分文字進行遮蓋實現敏感數據的脫敏。
洗牌脫敏:不可逆算法,適用于結構化數據列級別的數據脫敏場景。在源數據表抽取數據并確認數值范圍后,對該字段(在范圍內)進行列級別的打散重排和隨機選擇,實現混淆脫敏。
什么情況下需要進行數據脫敏:
生產庫向測試庫轉移生產數據并用于分析、驗證、和測試時;
在面向個人敏感數據對外使用時,如向第三方提供數據,向企業下游供應商提供數據;
在可視化圖表展示的時候,涉及一些敏感數據展示時需要進行脫敏處理;
在面向合規監管處理一些個人敏感數據或企業重要數據時要進行數據脫敏。
最佳實踐
數據脫敏是一項控制措施,但在什么場景和什么環節應用數據脫敏需要結合企業實際情況而定,我們列舉了一些企業常見的數據脫敏實踐供參考:
序號 | 場景 | 脫敏環節 | 數據脫敏方式 |
1 | 面向前端、圖標展示的場景中 | 在敏感數據輸出在圖標、大屏、前端Web頁面環節時脫敏 | Web代碼中對敏感數據進行替換、遮蓋等處理方式,敏感數據仍會在數據傳輸中體現,只是在展示時被替換。 |
2 | 從生產庫轉移到測試庫 | 在數據從生產DB轉移到測試DB時脫敏 | 采用脫敏任務的方式進行脫敏,具體可參考阿里云數據安全中心的靜態脫敏功能:
|
3 | 數據產生并寫入數據庫前進行實時脫敏 | 在數據生產時進行實時脫敏,再寫入數據庫時已經是脫敏后的數據 | 采用動態脫敏的方式,具體可參考阿里云數據安全中心的動態脫敏SDK。 |