本文中含有需要您注意的重要提示信息,忽略該信息可能對您的業務造成影響,請務必仔細閱讀。
數據傳輸服務DTS(Data Transmission Service)支持兩個PostgreSQL數據庫之間(比如RDS PostgreSQL、自建PostgreSQL)的雙向數據實時同步,RDS PostgreSQL實例間的雙向同步,適用于異地多活(單元化)、數據異地容災等多種應用場景。本文以RDS PostgreSQL實例為例,介紹雙向數據同步的配置步驟,其他數據源的配置流程與本案例類似。
前提條件
已創建源和目標RDS PostgreSQL實例,創建方式,請參見創建RDS PostgreSQL實例。
說明源庫和目標庫支持的版本,請參見同步方案概覽。
已設置源和目標RDS PostgreSQL實例的參數wal_level = logical。設置方式,請參見設置實例參數。
注意事項
類型 | 說明 |
源和目標庫的限制 |
|
其他限制 |
|
特殊情況 |
|
費用說明
同步類型 | 鏈路配置費用 |
庫表結構同步和全量數據同步 | 不收費。 |
增量數據同步 | 收費,詳情請參見計費概述。 |
支持的雙向同步架構
目前DTS僅支持兩個PostgreSQL數據庫之間的雙向同步,暫不支持多個PostgreSQL數據庫之間的雙向同步。
支持的沖突檢測
為保障同步數據的一致性,您需要確保同一個主鍵、業務主鍵或唯一鍵的記錄只在雙向同步的一個節點進行更新。如果同時更新則會按照您在數據同步作業中配置的沖突修復策略進行響應。
DTS通過沖突檢測和修復最大程度地維護雙向同步實例的穩定性。目前DTS支持進行檢測的沖突類型包括:
INSERT導致的唯一性沖突
同步INSERT語句時違背了唯一性約束,例如雙向同步的兩個節點同時或者在極為接近的時間INSERT某個主鍵值相同的記錄,那么同步到對端時,會因為已經存在相同主鍵值的記錄,導致Insert同步失敗。
UPDATE更新的記錄不完全匹配
UPDATE要更新的記錄在同步目標實例中不存在時,DTS會自動轉化為INSERT,此時可能會出現唯一鍵的唯一性沖突。
UPDATE要更新的記錄出現主鍵或唯一鍵沖突。
DELETE對應的記錄不存在
DELETE要刪除的記錄在同步的目標實例中不存在。出現這種沖突時,不論配置何種沖突修復策略,DTS都會自動忽略DELETE操作。
由于數據同步兩端的系統時間可能存在差異、同步存在延時等多種因素,DTS無法完全保證沖突檢測機制能夠完全防止數據的沖突。在使用雙向同步時,您需要在業務層面配合進行相應的改造,保證同一個主鍵、業務主鍵或唯一鍵的記錄只在雙向同步的某個節點進行更新。
對于上述數據同步的沖突,DTS提供了修復策略,您可以在配置雙向同步時選擇。
支持同步的對象
SCHEMA、TABLE
說明包含PRIMARY KEY、UNIQUE KEY、FOREIGN KEY、DATATYPE(內置數據類型)和DEFAULT CONSTRAINT。
VIEW、PROCEDURE(PostgreSQL的版本需為11及以上)、FUNCTION、RULE、SEQUENCE、EXTENSION、TRIGGER、AGGREGATE、INDEX、OPERATOR、DOMAIN
支持同步的SQL操作
操作類型 | SQL操作語句 |
DML | INSERT、UPDATE、DELETE |
DDL |
|
僅正向任務(即源庫同步至目標庫)支持同步DDL,反向任務(即目標庫同步至源庫)不支持同步DDL,將自動過濾DDL操作。
操作步驟
購買雙向數據同步實例,請參見購買數據同步任務。
重要購買時,源實例和目標實例均選擇為PostgreSQL,并選擇同步拓撲為雙向同步。
- 說明
您也可以登錄DMS數據管理服務。在頂部菜單欄中,選擇集成與開發,在左側導航欄選擇 。
在頁面左上方選擇同步的目標實例所屬地域。
定位至已購買的數據同步實例,單擊該實例下第一個同步任務的配置任務。
配置源庫及目標庫信息。
警告選擇源和目標實例后,建議您仔細閱讀頁面上方顯示的使用限制,否則可能會導致任務失敗或數據不一致。
類別
配置
說明
無
任務名稱
DTS會自動生成一個任務名稱,建議配置具有業務意義的名稱(無唯一性要求),便于后續識別。
源庫信息
數據庫類型
選擇PostgreSQL。
接入方式
選擇云實例。
實例地區
購買時選擇的源實例地域,不可變更。
實例ID
選擇源RDS PostgreSQL實例ID。
數據庫名稱
填入源RDS PostgreSQL實例中同步對象所屬數據庫的名稱。
數據庫賬號
填入源RDS PostgreSQL的高權限賬號,且需為所選數據庫的owner(授權賬號)。賬號創建及授權方式,請參見創建賬號和創建數據庫。
數據庫密碼
填入該數據庫賬號對應的密碼。
連接方式
請根據實際情況選擇,本示例選擇非加密連接。
若您需要SSL加密的方式連接數據庫,請選擇SSL安全連接,并根據實際情況上傳CA 證書、客戶端證書、客戶端證書私鑰,輸入客戶端證書私鑰密碼。
說明若自建PostgreSQL數據庫選擇了SSL安全連接,則必須上傳CA 證書。
若您需要使用客戶端證書,則需要同時上傳客戶端證書和客戶端證書私鑰,并輸入客戶端證書私鑰密碼。
RDS PostgreSQL實例的SSL加密功能,請參見SSL鏈路加密。
目標庫信息
數據庫類型
選擇PostgreSQL。
接入方式
選擇云實例。
實例地區
購買時選擇的目標實例地域,不可變更。
實例ID
選擇目標RDS PostgreSQL實例ID。
數據庫名稱
填入目標RDS PostgreSQL實例中同步對象所屬數據庫的名稱。
數據庫賬號
填入目標RDS PostgreSQL,且需為所選數據庫的owner(授權賬號)。賬號創建及授權方式,請參見創建賬號和創建數據庫。
數據庫密碼
填入該數據庫賬號對應的密碼。
連接方式
請根據實際情況選擇,本示例選擇非加密連接。
若您需要SSL加密的方式連接數據庫,請選擇SSL安全連接,并根據實際情況上傳CA 證書、客戶端證書、客戶端證書私鑰,輸入客戶端證書私鑰密碼。
說明若自建PostgreSQL數據庫選擇了SSL安全連接,則必須上傳CA 證書。
若您需要使用客戶端證書,則需要同時上傳客戶端證書和客戶端證書私鑰,并輸入客戶端證書私鑰密碼。
RDS PostgreSQL實例的SSL加密功能,請參見SSL鏈路加密。
配置完成后,在頁面下方單擊測試連接以進行下一步。
說明請確保DTS服務的IP地址段能夠被自動或手動添加至源庫和目標庫的安全設置中,以允許DTS服務器的訪問。更多信息,請參見添加DTS服務器的IP地址段。
若源庫或目標庫為自建數據庫(接入方式不是云實例),則還需要在彈出的DTS服務器訪問授權對話框單擊測試連接。
配置任務對象。
在對象配置頁面,配置待同步的對象。
配置
說明
同步類型
固定選中增量同步。默認情況下,您還需要同時選中庫表結構同步和全量同步。預檢查完成后,DTS會將源實例中待同步對象的全量數據在目標集群中初始化,作為后續增量同步數據的基線數據。
說明若勾選了庫表結構同步,DTS會將源數據庫中待同步表的結構(包含外鍵)同步到目標數據庫。
目標已存在表的處理模式
預檢查并報錯攔截:檢查目標數據庫中是否有同名的表。如果目標數據庫中沒有同名的表,則通過該檢查項目;如果目標數據庫中有同名的表,則在預檢查階段提示錯誤,數據同步任務不會被啟動。
說明如果目標庫中同名的表不方便刪除或重命名,您可以更改該表在目標庫中的名稱,請參見庫表列名映射。
忽略報錯并繼續執行:跳過目標數據庫中是否有同名表的檢查項。
警告選擇為忽略報錯并繼續執行,可能導致數據不一致,給業務帶來風險,例如:
表結構一致的情況下,如在目標庫遇到與源庫主鍵或唯一鍵的值相同的記錄:
全量期間,DTS會保留目標集群中的該條記錄,即源庫中的該條記錄不會同步至目標數據庫中。
增量期間,DTS不會保留目標集群中的該條記錄,即源庫中的該條記錄會覆蓋至目標數據庫中。
表結構不一致的情況下,可能會導致無法初始化數據、只能同步部分列的數據或同步失敗,請謹慎操作。
同步拓撲
選擇雙向同步。
是否開啟Exactly-Once寫入
若待同步的對象中包含不具備主鍵和唯一約束的表,請選擇是。更多信息,請參見同步無主鍵和唯一約束的表。
是否過濾DDL
選擇為是:不同步DDL操作。
選擇為否:同步DDL操作。
重要為保障雙向同步鏈路的穩定性,僅正向任務(即源庫同步至目標庫)支持選擇是否同步DDL,反向任務(即目標庫同步至源庫)將自動過濾DDL操作。
沖突修復策略
如遇到以上沖突類型,根據業務需要,選擇合適的沖突修復策略。
TaskFailed(遇到沖突,任務報錯退出)
當數據同步遇到沖突時,同步任務直接報錯并退出,同步任務進入失敗狀態,需要您介入修復任務。
Ignore(遇到沖突,直接使用目標實例中的沖突記錄)
當數據同步遇到沖突時,直接跳過當前同步語句,繼續往下執行,選擇使用目標庫中的沖突記錄。
Overwrite(遇到沖突,直接覆蓋目標實例中的沖突記錄)
當數據同步遇到沖突時,直接覆蓋目標庫中的沖突記錄。
說明如果同步任務暫停或者重啟后存在延遲,在延遲期間,這些策略均不生效,默認覆蓋目標端數據。
目標庫對象名稱大小寫策略
您可以配置目標實例中同步對象的庫名、表名和列名的英文大小寫策略。默認情況下選擇DTS默認策略,您也可以選擇與源庫、目標庫默認策略保持一致。更多信息,請參見目標庫對象名稱大小寫策略。
源庫對象
在源庫對象框中單擊待同步對象,然后單擊將其移動至已選擇對象框。
說明同步對象的選擇粒度為Schema、表或列。
已選擇對象
如需更改單個同步對象在目標實例中的名稱,請右擊已選擇對象中的同步對象,設置方式,請參見庫表列名單個映射。
如需批量更改同步對象在目標實例中的名稱,請單擊已選擇對象方框右上方的批量編輯,設置方式,請參見庫表列名批量映射。
說明如需按庫或表級別選擇同步的SQL操作,請在已選擇對象中右擊待同步對象,并在彈出的對話框中選擇所需同步的SQL操作。
如需設置WHERE條件過濾數據,請在已選擇對象中右擊待同步的表,在彈出的對話框中設置過濾條件。設置方法請參見設置過濾條件。
如果使用了對象名映射功能,可能會導致依賴這個對象的其他對象同步失敗。
單擊下一步高級配置,進行高級參數配置。
配置
說明
選擇調度該任務的專屬集群
DTS默認將任務調度到共享集群上,您無需選擇。若您希望任務更加穩定,可以購買專屬集群來運行DTS同步任務。更多信息,請參見什么是DTS專屬集群。
源庫、目標庫無法連接后的重試時間
在同步任務啟動后,若源庫或目標庫連接失敗則DTS會報錯,并會立即進行持續的重試連接,默認持續重試時間為720分鐘,您也可以在取值范圍(10~1440分鐘)內自定義重試時間,建議設置30分鐘以上。如果DTS在設置的重試時間內重新連接上源庫、目標庫,同步任務將自動恢復。否則,同步任務將會失敗。
說明針對同源或者同目標的多個DTS實例,如DTS實例A和DTS實例B,設置網絡重試時間時A設置30分鐘,B設置60分鐘,則重試時間以低的30分鐘為準。
由于連接重試期間,DTS將收取任務運行費用,建議您根據業務需要自定義重試時間,或者在源和目標庫實例釋放后盡快釋放DTS實例。
源庫、目標庫出現其他問題后的重試時間
在同步任務啟動后,若源庫或目標庫出現非連接性的其他問題(如DDL或DML執行異常),則DTS會報錯并會立即進行持續的重試操作,默認持續重試時間為10分鐘,您也可以在取值范圍(1~1440分鐘)內自定義重試時間,建議設置10分鐘以上。如果DTS在設置的重試時間內相關操作執行成功,同步任務將自動恢復。否則,同步任務將會失敗。
重要源庫、目標庫出現其他問題后的重試時間的值需要小于源庫、目標庫無法連接后的重試時間的值。
是否限制全量遷移速率
在全量同步階段,DTS將占用源庫和目標庫一定的讀寫資源,可能會導致數據庫的負載上升。您可以根據實際情況,選擇是否對全量同步任務進行限速設置(設置每秒查詢源庫的速率QPS、每秒全量遷移的行數RPS和每秒全量遷移的數據量(MB)BPS),以緩解目標庫的壓力。
說明僅當同步類型選擇了全量同步時才可以配置。
是否限制增量同步速率
您也可以根據實際情況,選擇是否對增量同步任務進行限速設置(設置每秒增量同步的行數RPS和每秒增量同步的數據量(MB)BPS),以緩解目標庫的壓力。
環境標簽
您可以根據實際情況,選擇用于標識實例的環境標簽。本示例無需選擇。
配置ETL功能
選擇是否配置ETL功能。關于ETL的更多信息,請參見什么是ETL。
是:配置ETL功能,并在文本框中填寫數據處理語句,詳情請參見在DTS遷移或同步任務中配置ETL。
否:不配置ETL功能。
監控告警
是否設置告警,當同步失敗或延遲超過閾值后,將通知告警聯系人。
不設置:不設置告警。
設置:設置告警,您還需要設置告警閾值和告警聯系人。更多信息,請參見在配置任務過程中配置監控告警。
單擊下一步數據校驗,進行數據校驗任務配置。
若您需要使用數據校驗功能,配置方法請參見配置數據校驗。
保存任務并進行預檢查。
若您需要查看調用API接口配置該實例時的參數信息,請將鼠標光標移動至下一步保存任務并預檢查按鈕上,然后單擊氣泡中的預覽OpenAPI參數。
若您無需查看或已完成查看API參數,請單擊頁面下方的下一步保存任務并預檢查。
說明在同步作業正式啟動之前,會先進行預檢查。只有預檢查通過后,才能成功啟動同步作業。
如果預檢查失敗,請單擊失敗檢查項后的查看詳情,并根據提示修復后重新進行預檢查。
如果預檢查產生警告:
對于不可以忽略的檢查項,請單擊失敗檢查項后的查看詳情,并根據提示修復后重新進行預檢查。
對于可以忽略無需修復的檢查項,您可以依次單擊點擊確認告警詳情、確認屏蔽、確定、重新進行預檢查,跳過告警檢查項重新進行預檢查。如果選擇屏蔽告警檢查項,可能會導致數據不一致等問題,給業務帶來風險。
當預檢查通過率顯示為100%時,單擊返回列表。
配置反向同步任務。
等待正向同步任務同步初始化完成,直至運行狀態處于運行中。
定位至反向同步任務,單擊配置任務。
- 重要
配置反向同步任務時,您需要選擇正確的源和目標實例。反向同步中源實例為正向同步中的目標實例,目標實例為正向同步中的源實例,并且您還需仔細確認實例信息(如數據庫名稱、賬號、密碼)的一致性。
反向同步任務源和目標庫的實例地區不支持修改,且需要配置的參數比正向同步任務少,請以控制臺界面為準。
反向同步任務的目標已存在表的處理模式配置不檢測正向同步任務同步至目標實例中的表。
反向同步任務不支持同步正向任務已選擇對象中的對象。
反向任務配置時不建議您使用映射功能,否則會存在數據不一致的風險。
反向同步任務配置完成后,等待兩個同步任務的鏈路的運行狀態均處于運行中,即完成雙向數據同步的配置流程。