數據經采集、集成、加工等流程處理完成后,可以在數據資產模塊進行系統化管理。本文為您介紹數據資產全景的全局、流動和結構化模式。
前提條件
僅智能研發版支持使用資產全景功能。
資產全景介紹
資產全景頁面僅用于展示生產環境中的元數據及加工所得的應用數據,包括以下三種模式:
全局模式
在Dataphin首頁,單擊頂部菜單欄的資產。默認進入目錄頁面。
按照下圖操作指引,進入全局頁面。
依次單擊全景->全局。
在全局頁面,右下角會展示各個業務板塊的名稱、數據量、占總數據量比,以及系統內的總數據表數、總項目數。
總數據量:分布式數據存儲可能有多個副本(取決于計算引擎本身配置),當前展示的存儲量為所有副本存儲的總量。人工智能平臺PAI模型訓練綁定的MaxCompute項目的數據量、外部項目計算源的數據量不納入計算。僅統計生產項目(包括prod和basic項目),T+1更新。
總數據表數:生產環境所有物理表和邏輯表總數,實時更新。
總項目數:生產項目數(包括prod和basic項目),實時更新。
將鼠標懸停旋轉的球體上,可以查看某個業務板塊的計算消耗、存儲量和物理表數信息。
計算消耗:當計算設置為MaxCompute時,支持查看計算消耗信息,但是不包含Hologres的計算消耗。
存儲量:僅統計生產項目(包括prod和basic項目),T+1更新。
物理表數:生產環境所有物理表總數,準實時更新。
流動模式
按照下圖指引,進入流動頁面。
在流動頁面,為您可視化展示數據引入、物理表數和邏輯表數,為您提供數據輸出后的數據查詢及應用功能:
將鼠標懸停在數據引入模塊上,為您展示的數據源個數、數據表接入量Top5和數據表接入量Least5。
數據源:統計昨天有數據同步到計算引擎的數據源數量,按照同步成功的表數量進行匯總排序,T+1更新。
數據表接入量Top5、數據表接入量Least5:基于同步任務和集成任務的實例數據進行匯總統計。
物理表數:生產環境所有物理表總數,準實時更新。
將鼠標懸停在邏輯表數模塊上,會從數據架構和數據模型角度,為您展示各個指標的數量。
數據架構包含業務對象、業務活動、業務限定、原子指標、指標五種指標數量,其中,指標包括派生指標、衍生指標和自定義指標三類指標。
數據模型包含維度邏輯表、事實邏輯表、匯總邏輯表三種指標數量,而維度邏輯表數+事實邏輯表數+匯總邏輯表數之和,即是生產環境所有邏輯表的總數,準實時更新。
結構化模式
按照下圖指引,進入結構頁面。單擊數據結構頁面右上方的目標業務板塊,系統將為您展示該業務板塊的業務對象、業務過程及其關聯關系。
業務對象:業務對象即參與業務的主體和客體,通常情況下業務對象是實際存在、不因事件發生而存在的實體。
業務過程:業務過程是業務活動中不可拆分的事件。
關系是指維度之間的關系:
具有父子關系的維度之間使用圖標連接。
具有關聯關系的維度之間使用圖標連接。
在結構中心的可視化視圖上,查看關聯關系:
單擊某個業務對象,則會高亮顯示與之關聯的實體及業務過程。
單擊某個業務過程,則會高亮顯示與之關聯的維度。
您可以在搜索框中,輸入業務對象或業務活動的名稱進行搜索,同時您也可以單擊搜索后的圖標,在下拉列表中選擇業務對象或業務活動,查看與之關聯的對象。