數倉規劃
使用DataWorks進行數據建模時,數倉架構師或者模型小組成員可以在數倉規劃頁面對數據分層、業務分類、數據域、業務過程、數據集市、主題域進行設計。完成設計后,模型設計師在建模過程中可以依賴數倉規劃中的數據分層、業務分類、數據域、業務過程等對所建模型進行分層化域管理。
數倉分層
您可以結合業務場景、數據場景綜合考慮設計數倉的數據分層,DataWorks為您默認創建業界通用的五層數倉分層:
數據引入層 ODS(Operational Data Store)
明細數據層 DWD(Data Warehouse Detail)
匯總數據層 DWS(Data Warehouse Summary)
應用數據層 ADS(Application Data Service)
公共維度層 DIM(Dimension)
您也可以根據業務需求創建其他分層數據層,創建數據分層的操作請參見創建數倉分層。
分層歸屬
DataWorks為您提供了貼源層、公共層、應用層等分層歸屬,您可以將不同功能作用的分層掛載至相應歸屬,通過層級化結構呈現輸出。下圖以默認的五層數據分層為例,數據分層規劃完成后,后續的表數據存儲可根據規劃分別存儲至不同的數據分層中。
貼源層:用于數據庫、日志、消息等基礎源數據的引入。源數據經過一系列ETL操作進入貼源層,該層級只能掛載貼源表。
公共層:用于加工、整合貼源層輸入的公共數據,建立統一的指標維度,構建可復用面向分析和統計的明細事實數據和匯總數據。該層級可掛載明細表、維度表、匯總表。
應用層:基于實際應用需求,獲取公共層加工整合后的數據,面向具體應用場景或指定產品進行的個性化數據統計。該層級可以掛載應用表、維度表。
業務分類
當企業業務比較復雜,不同類型業務彼此間需要共享數據域,但是又希望能在模型設計和應用過程中快速定位本業務的數據時,您可結合真實業務情況,規劃不同的業務分類,在后續建模的維度表和明細表中,將其關聯到對應的業務分類中。創建業務分類的操作可參見業務分類。
數據域與業務過程
數據域與業務過程通常位于公共層,根據業務類別、數據來源、數據用途等多個維度,對公共層數據進行區域及區域下業務活動進行劃分。
數據集市與主題域
維度管理
維度管理用于標準化定義維度,幫助您對數據建模過程中產生的維度進行統一建設和管理,保證維度唯一,避免重復建設。后續創建維度表時可關聯相應維度,關聯后即可通過不同維度分析呈現不同視角的業務數據狀況。詳情請參見創建概念模型:維度。
建模空間
當您所需要管理多個DataWorks工作空間且需要復用一套數倉規劃時,面對跨多個工作空間的復雜數據體系,可以通過設計空間來共享一套數據建模工具,針對整個數據體系進行統一的數倉規劃、維度建模及指標定義等工作。
DataWorks智能數據建模在進行跨多個工作空間數據的統一建模情況下,為您提供了模型設計工作空間與數據研發工作空間的概念,通過建模空間功能實現模型跨工作空間應用。
建模空間的詳細介紹請參見建模空間。