DataWorks數據集成實時ETL支持數據過濾組件使用,可以在來源與去向組件間新增數據過濾組件按配置的過濾規則,按字段對數據進行過濾。
前提條件
已完成數據集成的基本配置與網絡資源配置。
數據集成的同步類型為單表實時。
步驟一:配置數據集成任務
新建數據源,詳情請參見:創建并管理數據源。
新建數據集成任務,詳情請參見:數據集成側同步任務。
說明當數據集成側同步任務的同步類型為單表實時,可在數據來源組件與數據去向組件之間新增數據處理組件。詳情可參見支持的數據源及同步方案。
步驟二:添加數據過濾組件
在實時ETL任務編輯頁DAG畫布中,單擊來源與去向組件之間的按鈕,新增選擇數據過濾組件。
配置過濾規則
字段名:選擇前一個步驟的輸入字段,取值作為條件表達式左值。
判斷:條件運算類型,詳情如下表。
值:條件表達式右值,支持選擇前一個步驟的輸入字段或者輸入常量,選擇輸入常量時,不支持正則,支持Java轉義字符,例如
\t
(制表符)、\n
(換行符)、\u0001
(unicode字符)
添加規則:可以添加多個過濾換規則。
輸出字段:來源數據過濾后的輸出字段名,與輸入字段名和格式一致。
后續操作
完成來源信息、數據過濾以及去向信息的配置后,可單擊右上角的模擬運行,對數據集成任務進行模擬運行,以便查看輸出數據結果,是否符合您的需求。
文檔內容是否對您有幫助?