基本概念
本文列出了螞蟻隱私計算服務平臺涉及的基本概念,以便于您更好地理解產品。
安全配置
安全配置全稱為授權安全配置,離線樣本被授權到多方安全分析項目后,數據所有方在項目中按照安全級別對數據進行分列、分級的配置。數據的安全性越高,對數據支持的分析靈活度越低。當腳本文件中的邏輯超出了安全配置的限制,引擎將拒絕執行 SQL 腳本文件,任務將會執行失敗。
表結構
表結構定義了數據表中指定的數據字段,以及每組數據字段的數據類型和字段描述。
表結構模板
表結構模板是多個數據表共同遵循的表結構。
保護開關
啟用安全配置的開關。
分組鍵
在模型訓練中參與條件分割的字段。
服務集成
服務集成是當模型發布完成后,在模型服務需求方的節點中,開放服務調用接口的過程。用戶可定義接口的出參、入參、使用的模型以及和模型相關的其他處理邏輯。
服務監控
服務監控是多方安全建模控制臺的一個模塊。在多方安全模型服務運行過程中,模型的調用數、模型分和入模特征的關鍵統計值,可在經過聚合或脫敏后在平臺頁面中進行展示。服務監控支持用戶配置需查看的指標和監控頻率,并生成可視化監控報表。
關聯鍵
在隱私求交中作為 JOIN ON
SQL 語句的字段。
工程
工程又稱為“建模工程”,是進行多方安全建模的研發場所,用戶可基于虛擬寬表進行特征工程、模型研發和模型評估等操作。同時支持以可視化畫布的形態編排建模流程,一個流程中可包含一個或多個組件,組件間以連線的方式表示數據的傳遞關系。
節點
節點的全稱為隱私計算節點,是一臺計算機、一臺虛擬計算機或一個集群,計算方將多方安全計算協議或算法邏輯的軟件執行在節點中。節點均被部署在機構本地,通過節點實現機構原始數據連接及本地計算。
腳本文件
腳本文件是在聯邦建模控制臺或多方安全分析控制臺中,用戶編寫建模代碼的環境。不同控制臺支持的語法不同:
聯邦建模控制臺支持用戶使用 Python 語法定義模型,并且支持
import fascia
框架中的函數。多方安全分析控制臺支持用戶使用 SQL 語法編寫分析邏輯。在一個 SQL 腳本文件中,支持編寫一個或多個 SELECT 語句,語句以(;)進行分割。SQL 腳本文件可以使用當前項目的離線樣本。
離線樣本
離線樣本是螞蟻隱私計算服務平臺各項目中的原始數據,離線樣本被存儲在節點上且只支持在節點本地使用。如果需要在項目中使用樣本數據,需由節點所屬機構的管理員,在管理控制臺中將數據授權到項目內。您可以使用離線樣本,但無法獲取離線樣本。
聯邦表
聯邦表是進行聯邦建模所使用的數據集。一個聯邦表由多個節點的數據構成,各個節點中的數據擁有共同的列、不同的行。使用聯邦表建模時的體驗,類似將多份數據參與執行 UNION ALL
SQL 語句后的操作。
聯邦模型
聯邦模型是聯邦建模過程中使用聯邦算法產出的模型。當有多個節點參與模型訓練時,每個節點都會保存一個聯邦模型的副本。各參與方均可以獨立地使用保存在本地的模型副本,同時也支持各參與方對聯邦模型的副本進行微調。
模型提交
模型提交是多方安全建模控制臺中模型訓練模塊的產品概念。完成開發的模型經過提交后,進入待部署狀態。在提交過程中,支持將模型本身與模型相配的預處理、后處理邏輯打包進行提交。打包后模型、預處理和后處理可作為一個整體提供預測服務。
模型發布
完成模型的入模特征和在線特征匹配,并且發布到對應節點的過程被稱為模型發布。特征匹配支持按特征名同名匹配、按預先定義的模板匹配、自定義匹配等方法。
求交結果
求交結果是隱私求交后產生的交集數據或差集數據。求交結果被存儲在節點本地中。
任務
任務在不同項目類型的控制臺中概念不同,以下是具體說明:
聯邦建模控制臺和多方安全分析控制臺
在腳本文件菜單中,執行一次腳本后會產生一個任務。
多方安全建模控制臺
指向節點提交的具體計算任務。一個任務中可單獨執行一個組件,也可以將多個組件合并到同一個任務中執行。當一個組件被多次執行時,體現為多個任務。
隱私求交控制臺
創建一次隱私求交操作后會生成一個求交任務。
數據表
數據表是多方安全計算中存儲在節點的原始數據,并且只能在節點本地使用。
數據授權
在項目使用機構數據前,由機構管理員將數據表、特征組等數據授權到項目內使用的操作稱為數據授權。
特征
用戶離線樣本的信息維度。
特征服務
提供特征查詢接口的服務,即特征服務。
特征組
特征組包含特征列表和特征服務的配置信息,一個特征組可復用于多個項目的多個模型中。
特征列表
特征列表為某一類特征服務支持的特征字段集合。這些特征服務的服務地址不同,但有相同的協議、出參和入參。
特征映射
將模型訓練中的入模數據表字段與線上的特征服務形成關聯的過程,稱為特征映射。
項目
在隱私計算的數據應用中,以項目的形式對成員、權限、節點或數據等要素進行隔離。根據不同的應用類別,項目分為不同的類型。
虛擬寬表
結合兩組數據特征列并且經過 ID 對齊后,物理層面中不存在的寬表被稱為虛擬寬表。用戶面向虛擬寬表進行模型開發,其操作流程與體驗類似中心化建模。
引擎
引擎的全稱為隱私計算引擎,是在節點中執行隱私計算協議或算法邏輯的軟件。作為已編排的應用,能夠完成機構之間的數據隱私計算。引擎包含分析、訓練、預測和聯邦學習引擎。可以根據您的需求,在一個節點中集成多種不同的引擎。不同類型項目使用節點的引擎不同,下表展示了不同類型項目使用引擎的情況。
項目類型 | 引擎類型 |
聯邦建模 | 聯邦學習 |
多方安全建模 | 訓練和預測 |
多方安全分析 | 分析 |
隱私求交 | 分析 |
隱私求交
隱私求交(Private Set Intersection,簡稱 PSI)是一種隱私計算方法,是將各參與方的樣本數據做求交集處理。該方法可以保證在原始數據不出本地的情況下,對兩份離線樣本進行求交操作,以生成虛擬寬表。
組件
在多方安全建模項目中,組件是可視化建模中用戶可操作的功能模塊。組件中封裝了特定的算法功能,用戶可對組件的輸入、輸出和算法進行配置。
在線特征
指機構所擁有的供安全計算節點訪問的內部特征服務接口,在多方安全模型的在線預測過程中,各方的計算節點需要通過接口獲取各自的在線特征用于模型預測。