本文介紹寫數據表算子的使用方法。
用途
寫數據表算子用于將模型上游節點處理之后的出具寫入指定的數據表中。
適用場景
計算鏈路 | 計算引擎 | 是否支持 |
離線 | MaxCompute | 是 |
Hive | 是 | |
HiveStorage | 是 | |
RDS/MySQL | 是 |
使用說明
離線鏈路
輸入節點
查看上游節點輸入到當前節點的字段情況。
數據同步
配置將上游輸出的數據,同步到的目標數據表。
計算資源類型
選擇需要同步到的目標數據源的類型,目前支持的目標數據源類型參見適用場景
目標數據源
選擇同步到的目標數據源。
目標數據表
選擇同步到的目標數據源中的表名。
生命周期(可選)
設置目標表的留存天數,如未設置,默認將保留1天。
說明
生命周期決定了目標表在多長時間之后被自動刪除。
比如設置了生命周期為1天,則表在1天后會被自動刪除。特別注意,并不會精確到24小時的時候刪除,可能會在到期當天的某個時間點刪除。
字段列表
配置輸出到目標表的字段列表。
可在字段列表中對上游的輸出字段的信息進行修改,比如:對字段重命名、修改注釋等。
同步模式
全表同步:先清空目標表里已有數據,然后重新插入新數據。
增量同步:保留目標表中的已有數據,然后追加插入新數據。
分區同步:向目標表的指定分區中重新插入新數據。僅對支持分區的計算資源有效。
說明
同步的目標表在目標計算引擎中如果存在相同名稱的表,如果目標表的結構與已存在表的結構一致,則同步將正常運行。如果不一致則將拋出異常,需要用戶自行處理。
文檔內容是否對您有幫助?