數據質量監控模塊為您提供數據表開發的跟蹤管理功能。
數據質量監控的界面如下圖所示,默認顯示當前項目接入的“現場開發”類的全部數據表,可切換顯示項目中“同步專網”或“產品部署”類數據表。其中:
現場開發類表:可選擇顯示總數據表、未完成的數據表、已暫停開發的數據表或質量較差的數據表。
同步專網和產品部署類表:可選擇顯示總數據表或質量較差的數據表;同時顯示產出異常(任務停止和運行失?。┑臄祿頂担赏ㄟ^設置“開發狀態”篩選停止運行或運行失敗的表來查看確認。
界面參數說明如下表所示。
參數名稱 | 參數說明 |
表名 | 數據庫中存儲的物理表名稱。其中,帶星號標志的表為接口返回的“重點關注表”。 點擊表名可查看表詳情。 |
描述 | 物理表的中文描述。 |
開發負責人 | 負責物理表開發的數據開發者。 |
應用領域 | 數據表的應用領域,具體應用領域與您的項目領域相關。 |
存儲數據庫 | 表的存儲數據庫包括:MaxCompute、RDS For MySQL、RDS For PostgreSQL、Datahub Service、Table Store、Hive、Hbase、Hbase Phoenix、Kafka。 可查看各數據表存儲的數據庫。 |
數據質量 | 數據表的數據質量,點擊刷新按鈕,可刷新數據質量。數據質量狀態說明如下:
說明
|
開發狀態 | 數據表的開發狀態,包括:已完成、未完成、暫停。 |
任務狀態 | 同步專網和產品部署類表的任務狀態,包括:任務未配置、未到調度周期、運行成功、運行中、等待運行、任務停止、運行失敗。 |
操作 | 數據表可執行的操作,包括數據表的確認完成/回退開發(僅現場開發類表需要執行)、暫停開發和刪除表。 |
加入原因 | 顯示數據表來源,包括:手工導入、接口導入和血緣追溯。對于接口導入和血緣追溯的表,可點擊查看具體的接口信息或血緣信息。 |
在當前模塊,您可對數據表執行篩選、分配,以及開發確認等操作。
數據表篩選
如下圖所示,當顯示的數據類型及其列表確定后,您可以通過設定“開發負責人”、“應用領域”、“數據質量”以及“開發狀態”等參數篩選數據表,或通過表名搜索定位到具體數據表(支持模糊搜索)。
數據表分配
完成數據表篩選后,點擊界面右上角的分配開發任務按鈕,可為數據表分配開發責任人。
勾選需要分配的數據表。
點擊分配開發任務按鈕。
在顯示的任務分配窗口選擇開發負責人。
數據表開發確認
僅現場開發類數據表需要執行開發確認操作,且只有數據表的開發負責人可執行該操作。
數據表的開發確認操作包括數據表的開發/暫停、確認完成/回退開發以及刪除等操作。
開發:數據表默認處于開發狀態。
暫停:如您需要暫停某張數據表的開發,關閉開發開關,即可暫停該表的開發,此時數據表的“開發狀態”變更為“暫?!薄?/p>
確認完成:如您的數據表已開發完成,點擊操作欄的確認完成按鈕。確認完成后數據表的“開發狀態”變更為“已完成”,表示該表的開發工作已完成,同時啟動該表質量規則的監控,您將會收到相關的質量報警。
回退開發:對于“開發狀態”為“已完成”的數據表,點擊回退開發按鈕,可重新開發此物理表。此時,該數據表的“開發狀態”變回“未完成”,平臺停止對該表質量規則的監控報警。
刪除:點擊刪除按鈕可刪除數據表。
暫停數據表的開發會影響算法產出指標的精準度,建議您僅在確定無法提供某張表的數據時執行暫停操作。
數據表的開發責任人需要維護您負責表的數據質量并及時解決質量問題,避免因表的數據質量影響下游表的產出質量。