維度建模
DataWorks的數據建模產品遵循Kimball維度建模理論,使用DataWorks的維度建模功能進行數據倉庫模型設計時,您可根據業務情況設計并創建維度表、明細表、匯總表、應用表,并可將模型快速發布到相應的研發引擎。同時,還可以使用逆向建模,將已有物理表逆向生成模型。
建模視角說明
維度建模支持從公共層、應用層對創建的模型表進行歸類,您可以根據實際需求,選擇合適的層級進行建模,不同層級支持的管理視角不同。
公共層:用于加工、整合貼源層輸入的公共數據,建立統一的指標維度,構建可復用面向分析和統計的明細事實數據和匯總數據。該層級支持使用數據域或業務分類視角管理模型表。
應用層:基于實際應用需求,獲取公共層加工整合后的數據,面向具體應用場景或指定產品進行的個性化數據統計。該層級僅支持使用業務分類視角管理模型表。
未分層:如果已創建的模型表未劃分層級歸屬(即公共層或應用層),則該表會被放置于未分層中。
選擇對應層級后,您只能在相應層級下創建目標表。同時,可以在目錄樹切換該層級支持的管理視角,查看并管理層級下的模型表。
維度表
結合業務的數據域的規劃,提取出各業務數據域中進行數據分析時可能存在的維度,并將維度及其屬性通過維度表的方式存儲下來。例如,在進行電商業務數據分析時,可用的維度及其屬性有:訂單維度(屬性包括訂單ID、訂單創建時間、買家ID、賣家ID等)、用戶維度(性別、出生日期等)、商品維度(包括商品ID、商品名稱、商品上架時間)等,此時您就可以將這些維度和屬性創建為訂單維度表、用戶維度表、商品維度表等,將維度屬性記錄作為維度表的字段。后續您可將這些維度表部署到數倉中,通過ETL將實際維度數據按照維度表定義的方式進行存儲,方便業務人員在后續的數據分析時進行取用。
更多維度表的設計創建詳情可參見創建邏輯模型:維度表。
明細表
結合業務過程的規劃,梳理分析各業務過程中可能產生的實際數據,將這些實際數據字段通過明細表的方式存儲下來。例如下訂單這一業務過程中,您可以創建下訂單這一明細表,用于記錄下單過程可能產生實際數據字段,例如訂單ID、訂單創建時間、商品ID、數量、金額等。后續您可將這些明細表部署到數倉中,通過ETL將真實的數據按照明細表的定義方式進行匯總存儲,便于業務分析時取用。
更多事實表的設計創建詳情可參見創建邏輯模型:明細表。
匯總表
匯總表用于組織一個數據域下相同時間周期、相同維度的多個派生指標的統計數據,是對業務高度抽象后的梳理結果,為后續的業務查詢,OLAP分析,數據分發等提供基礎。更多匯總表的設計創建詳情可參見創建邏輯模型:匯總表。
應用表
應用表是面向具體業務場景,用于組織相同時間周期、相同維度的多個原子指標、派生指標或統計粒度的統計數據,為后續的業務查詢,OLAP分析,數據分發等提供基礎。您可根據業務需求,基于應用場景的需要來設計應用表。更多應用表的設計創建詳情可參見創建邏輯模型:應用表。
逆向建模
逆向建模是將物理表逆向生成邏輯模型,該功能幫助您無需再次執行建模操作即可快速創建模型,節省了大量的時間成本。更多逆向建模的操作詳情可參見逆向建模:物理表反向建模。