數據板塊是邏輯空間的重要組成部分,是基于業務特征劃分的命名空間。在使用規范建模前,您需要完成數據板塊的創建。本文為您介紹如何新建數據板塊。
前提條件
僅支持智能研發版。若需使用,當前租戶還需開通智能研發模塊。
在開始執行操作前,請確認您已將數據板塊架構師、業務負責人、數據負責人添加至Dataphin成員列表。具體操作請參見添加Dataphin成員。
權限說明
僅支持超級管理員和系統管理員新建數據板塊。
功能概述
為了更好地滿足業務訴求,Dataphin支持創建Dev-Prod模式或Basic模式的數據板塊。
Dev-Prod模式:生成相互隔離的Dev環境和Prod環境,加強保障Prod環境的數據安全。如果您管理訴求較強,數據研發人員較多且能力及分工明確,數據計算存儲預算較高,推薦使用此模式。
Basic模式:生成開發與運維一體化的Prod環境,數據生產過程穩定且便捷。如果您關注數據研發效率,研發人員職能邊界模糊,計算存儲預算有限制,推薦使用此模式。
操作步驟
在Dataphin首頁,單擊頂部菜單欄的規劃。默認進入數據架構頁面。
在數據架構頁面,單擊+新建數據板塊。
在新建數據板塊配置向導頁面,配置數據板塊信息。
步驟一:選擇生產開發類型。
根據您的實際需求,選擇對應生產開發類型。
Dev-Prod 模式:如您管理訴求較強,數據研發人員較多且能力及分工明確,數據計算存儲預算較高,推薦此模式。Dev環境和Prod環境邏輯隔離,可加強對數據研發流程的管控,強控制生產數據的權限,最大化保障數據生產穩定性。但是研發流程靈活及便捷性較低,對研發人員工具使用熟練度要求較高,需要配置雙份計算存儲資源。
Basic 模式:如您關注數據研發效率而非強管控,研發人員職能邊界相對模糊,計算存儲預算有限制,推薦此模式。開發與運維一體化的Prod環境,可敏捷管理數據研發流程,強控制生產數據的寫權限,平衡數據生產穩定性與靈活性。Basic模式存在直接變更生產環境的風險,請謹慎管理項目成員,控制生產數據穩定性。
重要生產開發類型若選擇Basic 模式,數據板塊創建完成后則不支持升級為Dev-Prod 模式。
單擊下一步。
步驟二:配置板塊定義。
參考下方表格,配置數據板塊的基礎信息和業務信息。
參數
描述
基礎信息
板塊英文名
數據板塊英文名。命名規則如下:
只能包含英文字母大小寫、數字和下劃線(_)。
長度不超過64個字符。
完成數據板塊創建后,Dev環境中數據板塊的英文名格式為
LD_{自定義的板塊英文名}_dev
。后續如果數據板塊內已有邏輯表產生,不可編輯英文名,以避免影響數據生產。
板塊名稱
數據板塊名稱。命名規則如下:
只能包含中文、數字、英文字母大小寫、下劃線(_)和短劃線(-)。
長度不超過64個字符。
完成數據板塊創建后,Dev環境中數據板塊的名稱格式為
{自定義的板塊名稱}_開發
。描述信息(非必填)
填寫對數據板塊的簡單描述,長度不超過128個字符。
圖標
數據板塊的圖標便于您進行業務分類,對于后續數據的計算沒有影響。
支持選擇的圖標包括電商(圖標)、金融(圖標)、云計算(圖標)、廣告營銷(圖標)、物流(圖標)、文娛(圖標)、出行(圖標)、健康(圖標)、社交&通信(圖標)、餐飲(圖標)、教育(圖標)和環境(圖標)。
業務信息
板塊架構師
負責板塊信息設置,包括更新基本信息、業務信息等。支持選擇Dataphin成員列表的所有正常使用的成員。
業務負責人
(非必選)
負責板塊數據的穩定性。支持在列表中選擇最多3位成員。
數據負責人(非必選)
負責板塊數據的質量。支持在列表中選擇最多3位成員。
單擊下一步。
步驟三:配置邏輯表命名規范。
新建邏輯表時,系統基于邏輯表命名規范自動預生成推薦的邏輯表名稱,您可以編輯為其他任意名稱。
說明數據板塊創建后,可以在數據板塊的研發規范->表規范->邏輯表命名規范進行編輯。修改表前綴將對同一個邏輯表大類的全部子類型生效。例如,修改維度邏輯表大類,將對普通維度邏輯表、層級維度邏輯表等子類型生效。
默認的命名規范與后綴如下:
邏輯表類型
默認值
維度邏輯表
表前綴:
dim_
。數據時效(后綴):
普通維度邏輯表:
天(T+1):無。
小時(T+h):
_hf
。分鐘(T+m):
_mf
。
層級維度邏輯表:
天(T+1):
層級lvl[n]
。[n]
為層級數。
枚舉維度邏輯表、虛擬維度邏輯表:
天(T+1):無。
事實邏輯表
表前綴:
fct_
。數據時效(后綴):
流程事實邏輯表:
天(T+1):無。
事件事實邏輯表:
天(T+1):
_di
。小時(T+h):
_hi
。分鐘(T+m):
_mi
。
快照事實邏輯表:
天(T+1):
_df
。小時(T+h):
_hf
。分鐘(T+m):
_mf
。
主題域縮寫:默認關閉,開啟將默認補充主題域縮寫。
匯總邏輯表
表前綴:
dws_
。數據時效(后綴):
天(T+1):無。
小時(T+h):
_hh
。分鐘(T+m):
_mm
。
單擊確定,完成數據板塊的創建。
后續步驟
完成數據板塊創建后,需要為數據板塊創建主題域。具體操作請參見創建主題域。