字段標準是對含義相同但字段名稱不同的數據進行統一規范管理的數據準則,字段標準可定義字段的取值范圍、度量單位等內容。當字段標準發生變化時可快速定位或變更對應的表,極大地提升了應用效率和準確率。本文將為您介紹字段標準的創建方法。
背景信息
字段標準又稱為數據字典,可理解為全局字段管理。可將多個表中含義相同但字段名不同的內容進行關聯,并對該字段制定相關的取值范圍、度量單位、標準代碼等內容。后期字段標準發生變化時,可快速定位和變更關聯的表,極大程度提升構建效率、應用效率、準確性和后期治理效果。
相關示例如下:
現有注冊表和登錄表,注冊表中存儲了會員ID,字段名為user_id,登錄表中也存儲了會員ID,字段名為userid。此時兩個表中包含的會員ID均是同一內容,但是使用了兩種不同的字段名進行描述,字段出現了歧義便需要人工介入理解進行確認。
解決方法如下:
我們可通過DataWorks數據建模創建新的字段標準,預先在模型中定義會員ID標準,然后在創建注冊表和登錄表時,將對應會員ID的字段引用該標準。在后期分析中可自動推薦兩張表的關聯關系和關聯字段,極大地提升應用效率和準確性。
注意層級關系
字段標準在創建時需要放在根目錄、目錄或標準集下方,相關說明如下。
根目錄:目錄中最頂級的目錄,所有的目錄、標準集、標準只能放置在根目錄下。
目錄:用于存放標準和標準集,類似操作系統的文件夾目錄。
標準集:和目錄類似,但標準集內只能存放標準。
字段標準之間可存在繼承關系,如買家ID標準和賣家ID標準均可繼承于會員ID標準。
創建目錄與標準集
進入數據標準。
登錄DataWorks控制臺,切換至目標地域后,單擊左側導航欄的 ,在下拉框中選擇對應工作空間后單擊進入數據建模。
在智能數據建模頁面的頂部菜單欄,單擊數據標準,進入數據標準頁面。
在數據標準頁面左側導航欄,單擊字段標準,進入字段標準頁面。
新建根目錄。
在字段標準頁面,單擊圖標,選擇新建根目錄。
在彈出的新建根目錄對話框中,輸入名稱,單擊確定。
根目錄創建成功后,可在左側字段標準區域下方的目錄樹中查看已創建的根目錄。
(可選)新建子目錄。
在左側目錄樹,右鍵單擊已創建的根目錄,選擇新建子目錄。
在彈出的新建子目錄對話框中,輸入名稱,單擊確定。
(可選)新建標準集。
在左側目錄樹,選擇已創建完成的根目錄或子目錄。
右鍵單擊目錄名稱,選擇新建標準集。
在彈出的新建標準集對話框中,輸入名稱,單擊確定。
創建標準
在左側目錄樹,右鍵單擊目標目錄或標準集,選擇新建標準。
在彈出的新建標準對話框中,配置如下內容。
參數項
參數描述
標準編碼
自定義編碼。
英文縮寫
字段標準的英文縮寫。
英文名稱
字段標準的英文名稱。
中文名稱
字段標準的中文名稱。
數據類型
對應字段的數據類型,包括如下:
BIGINT、DOUBLE、DECIMAL、STRING、DATETIME、BOOLEAN。
長度
數據類型關聯參數。
例如,選擇DECIMAL類型,則長度對應DECIMAL(20,4)中的20。
精度
數據類型關聯參數。
例如,選擇DECIMAL類型,則長度對應DECIMAL(20,4)中的4。
非空
引用該標準的字段值是否可以為空。默認為空。
默認值
引用該標準的字段值未填寫時的默認值。最大長度不可超過2048個字符。
業務定義
對業務的定義描述,最大長度不可超過2048個字符。
所屬路徑
標準所屬的目錄,您可從已創建的目錄、子目錄、標準集中選擇。
父級標準
可選擇已創建的標準作為父級標準,選擇后與該標準產生繼承關系,幫助您更好地識別字段的關聯關系。
例如,買家ID和賣家ID均屬于會員ID,則買家ID標準和賣家ID標準的父級標準就是會員ID標準。
引用代碼
您可從已創建的標準代碼中,引用指定標準代碼來約束字段的取值范圍,標準代碼請參見標準代碼。
刪除
刪除標準
說明字段標準如已被引用,則無法刪除,需在對應部分刪除引用。
單擊標準所在的標準集或目錄名稱。
在標準列表頁,單擊對應標準操作列的刪除。
刪除標準集、子目錄、根目錄
在左側目錄樹直接右鍵單擊標準集、子目錄或根目錄的名稱,選擇刪除。
說明不支持跨層級刪除目錄。
后續步驟
創建完成后,您可在數據建模配置事實表與維度表字段時進行關聯,關聯方法請參見發布模型至引擎。