離線數倉構建流程
本教程將從前期的資源準備、數倉規劃,到后期的運維補數據、查看運行結果,指導您如何使用Dataphin完成基本的離線數倉構建。以幫助您快速了解Dataphin離線數倉建設的基礎流程。
使用Dataphin進行離線數倉建設的基本流程如下:
主流程 | 描述 | 操作指導 |
準備工作 | 使用Dataphin進行離線數倉建設前您需完成相關云資源的準備。云資源準備包括阿里云賬號資源準備、Dataphin開通與AccessKey配置、MaxCompute計算源的開通與配置、以及數據源的準備。 | |
規劃數倉 | 數倉規劃是數據建設中的藍圖,在您開始數據開發前,需要完成數據倉庫的規劃,數倉規劃配置包括:創建數據板塊和主題域、計算源、數據源、項目及項目中的成員。 | |
數據集成 | 將創建好的數據源集成至項目。 | |
規范定義 | 基于Dataphin數據研發模塊,明確統計指標口徑并完成配置開發,相關的定義包括業務對象、業務活動、原子指標、業務限定和派生指標。 | |
規范建模 | 基于規范定義部分定義好的概念以及Dataphin的規范建模功能圈定來源數據,并完成模型建設。 | |
數據開發 | 基于規范定義明確好的統計指標口徑和規范建模部分定義好的模型完成規范建模數據開發。包括維度邏輯表、事實邏輯表、原子指標、業務限定、派生指標。 | |
運維補數據 | 對任務進行數據回刷,包括管道任務、維度邏輯表、事實邏輯表以及指標。 | |
驗證數據 | 您可以通過即席查詢來驗證數據的正確性。 |