云數(shù)據(jù)庫MongoDB版(分片集群架構)間的雙向同步
本文中含有需要您注意的重要提示信息,忽略該信息可能對您的業(yè)務造成影響,請務必仔細閱讀。
數(shù)據(jù)傳輸服務DTS(Data Transmission Service)支持云數(shù)據(jù)庫MongoDB版(分片集群架構)間的雙向同步,適用于異地多活(單元化)、數(shù)據(jù)異地容災等多種應用場景。本文介紹雙向數(shù)據(jù)同步的配置步驟。
前提條件
已創(chuàng)建源和目標云數(shù)據(jù)庫MongoDB版分片集群實例,創(chuàng)建方式,請參見創(chuàng)建分片集群實例。
重要源云數(shù)據(jù)庫MongoDB版分片集群實例(含反向任務的源實例)的所有Shard節(jié)點需要申請連接地址,且各Shard的賬號和密碼需保持一致。申請方法,請參見申請Shard或ConfigServer節(jié)點連接地址。
支持的版本,請參見同步方案概覽。
建議目標云數(shù)據(jù)庫MongoDB版實例的存儲空間比源云數(shù)據(jù)庫MongoDB版實例占用的存儲空間大10%。
您需要將源和目標實例的Shard和ConfigServer節(jié)點參數(shù)replication.oplogGlobalIdEnabled設置為true,設置方式,請參見設置數(shù)據(jù)庫參數(shù)。
說明若未設置為true,將會導致實例預檢查失敗或者報錯
two-way mongo must have gid
。您需要根據(jù)業(yè)務需求,在源和目標云數(shù)據(jù)庫MongoDB版實例中創(chuàng)建需要分片的數(shù)據(jù)庫和集合、配置數(shù)據(jù)分片、開啟Balancer(源云數(shù)據(jù)庫MongoDB版實例必須在增量同步期間開啟Balancer)并進行預分片。更多信息,請參見設置數(shù)據(jù)分片以充分利用Shard性能和如何處理分片集群架構的MongoDB數(shù)據(jù)分布不均衡。
說明配置數(shù)據(jù)分片可避免數(shù)據(jù)被同步至同一Shard,導致無法發(fā)揮集群性能;開啟Balancer并進行預分片可以避免數(shù)據(jù)傾斜問題。
本配置場景以先配置后購買DTS任務為例,無需填寫源云數(shù)據(jù)庫MongoDB版(分片集群架構)下的Shard數(shù)量。
如您先購買后配置DTS任務,則需要在購買DTS任務時填寫其正確的Shard數(shù)量。
注意事項
類型 | 說明 |
源和目標庫的限制 |
|
其他限制 |
|
費用說明
同步類型 | 鏈路配置費用 |
庫表結構同步和全量數(shù)據(jù)同步 | 不收費。 |
增量數(shù)據(jù)同步 | 收費,詳情請參見計費概述。 |
支持的雙向同步架構
目前DTS僅支持兩個云數(shù)據(jù)庫MongoDB版實例(分片集群架構)之間的雙向同步,暫不支持多個云數(shù)據(jù)庫MongoDB版實例之間的雙向同步。
支持的沖突檢測
為保障同步數(shù)據(jù)的一致性,您需要確保同一個主鍵、業(yè)務主鍵或唯一鍵的記錄只在雙向同步的一個節(jié)點進行更新。
DTS通過沖突檢測和修復最大程度地維護雙向同步實例的穩(wěn)定性。目前DTS支持進行檢測的沖突類型包括:
INSERT導致的唯一性沖突
INSERT要插入的記錄在目標實例中出現(xiàn)沖突時,DTS會自動忽略INSERT操作。
UPDATE更新的記錄不完全匹配
UPDATE要更新的記錄在目標實例中不存在或出現(xiàn)沖突時,DTS都會自動忽略UPDATE操作。
DELETE對應的記錄不存在
DELETE要刪除的記錄在目標實例中不存在時,DTS會自動忽略DELETE操作。
由于數(shù)據(jù)同步兩端的系統(tǒng)時間可能存在差異、同步存在延時等多種因素,DTS無法完全保證沖突檢測機制能夠完全防止數(shù)據(jù)的沖突。在使用雙向同步時,您需要在業(yè)務層面配合進行相應的改造,保證同一個主鍵、業(yè)務主鍵或唯一鍵的記錄只在雙向同步的某個節(jié)點進行更新。
對于上述數(shù)據(jù)同步的沖突,DTS提供了默認的修復策略(Ignore)且不支持修改。
任務步驟說明
同步類型 | 說明 |
庫表結構同步 | 將源云數(shù)據(jù)庫MongoDB版中同步對象的結構同步到目標云數(shù)據(jù)庫MongoDB版中。 |
全量同步 | 將源云數(shù)據(jù)庫MongoDB版同步對象的存量數(shù)據(jù)全部同步到目標云數(shù)據(jù)庫MongoDB版中。 說明 支持全量同步DATABASE和COLLECTION。 |
增量同步 | 在全量同步的基礎上,將源云數(shù)據(jù)庫MongoDB版的增量更新同步到目標云數(shù)據(jù)庫MongoDB版中。 說明 增量同步不支持在任務開始運行后新建的數(shù)據(jù)庫,支持同步的增量更新如下:
|
操作步驟
本配置場景以先配置后購買DTS任務為例,無需填寫源云數(shù)據(jù)庫MongoDB版(分片集群架構)下的Shard數(shù)量。
如您先購買后配置DTS任務,則需要在購買DTS任務時填寫其正確的Shard數(shù)量。
進入目標地域的同步任務列表頁面(二選一)。
通過DTS控制臺進入
在左側導航欄,單擊數(shù)據(jù)同步。
在頁面左上角,選擇同步實例所屬地域。
通過DMS控制臺進入
說明實際操作可能會因DMS的模式和布局不同,而有所差異。更多信息,請參見極簡模式控制臺和自定義DMS界面布局與樣式。
在頂部菜單欄中,選擇
。在同步任務右側,選擇同步實例所屬地域。
單擊創(chuàng)建任務,進入任務配置頁面。
可選:在頁面右上角,單擊試用新版配置頁。
說明若您已進入新版配置頁(頁面右上角的按鈕為返回舊版配置頁),則無需執(zhí)行此操作。
新版配置頁和舊版配置頁部分參數(shù)有差異,建議使用新版配置頁。
配置源庫及目標庫信息。
警告選擇源和目標實例后,建議您仔細閱讀頁面上方顯示的使用限制,否則可能會導致任務失敗或數(shù)據(jù)不一致。
類別
配置
說明
無
任務名稱
DTS會自動生成一個任務名稱,建議配置具有業(yè)務意義的名稱(無唯一性要求),便于后續(xù)識別。
源庫信息
選擇已有連接信息
您可以按實際需求,選擇是否使用已有數(shù)據(jù)庫實例。
如使用已有實例,下方數(shù)據(jù)庫信息將自動填入,您無需重復輸入。
如不使用已有實例,您需要配置下方的數(shù)據(jù)庫信息。
說明您可以在數(shù)據(jù)連接管理頁面或新版配置頁面,將數(shù)據(jù)庫錄入DTS。更多信息,請參見數(shù)據(jù)連接管理。
DMS控制臺的配置項為選擇DMS數(shù)據(jù)庫實例,您可以單擊新增DMS數(shù)據(jù)庫實例或在控制臺首頁將數(shù)據(jù)庫錄入DMS。更多信息,請參見云數(shù)據(jù)庫錄入和他云/自建數(shù)據(jù)庫錄入。
數(shù)據(jù)庫類型
選擇MongoDB。
接入方式
選擇云實例。
實例地區(qū)
選擇源云數(shù)據(jù)庫MongoDB版所屬地域。
是否跨阿里云賬號
本示例使用當前阿里云賬號下的數(shù)據(jù)庫實例,需選擇不跨賬號。
架構類型
選擇分片集群架構。
遷移方式
選擇Oplog。
實例ID
選擇源云數(shù)據(jù)庫MongoDB版實例ID。
鑒權數(shù)據(jù)庫名稱
填入源云數(shù)據(jù)庫MongoDB版實例數(shù)據(jù)庫賬號所屬的數(shù)據(jù)庫名稱,若未修改過則默認為admin。
數(shù)據(jù)庫賬號
填入源云數(shù)據(jù)庫MongoDB版的數(shù)據(jù)庫賬號,需具備待同步庫、config庫、admin庫和local庫的read權限。
數(shù)據(jù)庫密碼
填入該數(shù)據(jù)庫賬號對應的密碼。
Shard賬號
填入源云數(shù)據(jù)庫MongoDB版的數(shù)據(jù)庫Shard賬號。
Shard密碼
填入源云數(shù)據(jù)庫MongoDB版的數(shù)據(jù)庫Shard密碼。
連接方式
DTS支持非加密連接、SSL安全連接和Mongo Atlas SSL三種連接方式。連接方式的選項與接入方式和架構類型有關,請以控制臺為準。
說明架構類型為分片集群架構,且遷移方式為Oplog的MongoDB數(shù)據(jù)庫,不支持SSL安全連接。
若源庫為自建(接入方式不為云實例)副本集架構的MongoDB數(shù)據(jù)庫,并且選擇了SSL安全連接,DTS還支持上傳CA證書對連接進行校驗。
目標庫信息
選擇已有連接信息
您可以按實際需求,選擇是否使用已有數(shù)據(jù)庫實例。
如使用已有實例,下方數(shù)據(jù)庫信息將自動填入,您無需重復輸入。
如不使用已有實例,您需要配置下方的數(shù)據(jù)庫信息。
說明您可以在數(shù)據(jù)連接管理頁面或新版配置頁面,將數(shù)據(jù)庫錄入DTS。更多信息,請參見數(shù)據(jù)連接管理。
DMS控制臺的配置項為選擇DMS數(shù)據(jù)庫實例,您可以單擊新增DMS數(shù)據(jù)庫實例或在控制臺首頁將數(shù)據(jù)庫錄入DMS。更多信息,請參見云數(shù)據(jù)庫錄入和他云/自建數(shù)據(jù)庫錄入。
數(shù)據(jù)庫類型
選擇MongoDB。
接入方式
選擇云實例。
實例地區(qū)
選擇目標云數(shù)據(jù)庫MongoDB版所屬地域。
是否跨阿里云賬號
本示例使用當前阿里云賬號下的數(shù)據(jù)庫實例,需選擇不跨賬號。
架構類型
選擇分片集群架構。
實例ID
選擇目標云數(shù)據(jù)庫MongoDB版實例ID。
鑒權數(shù)據(jù)庫名稱
填入目標云數(shù)據(jù)庫MongoDB版實例數(shù)據(jù)庫賬號所屬的數(shù)據(jù)庫名稱,若未修改過則默認為admin。
數(shù)據(jù)庫賬號
填入目標云數(shù)據(jù)庫MongoDB版的數(shù)據(jù)庫賬號,需具備dbAdminAnyDatabase權限、目標庫的readWrite權限和local庫的read權限。
數(shù)據(jù)庫密碼
填入該數(shù)據(jù)庫賬號對應的密碼。
連接方式
DTS支持非加密連接、SSL安全連接和Mongo Atlas SSL三種連接方式。連接方式的選項與接入方式和架構類型有關,請以控制臺為準。
說明架構類型為分片集群架構的MongoDB數(shù)據(jù)庫,不支持SSL安全連接。
若目標庫為自建(接入方式不為云實例)副本集架構的MongoDB數(shù)據(jù)庫,并且選擇了SSL安全連接,DTS還支持上傳CA證書對連接進行校驗。
配置完成后,在頁面下方單擊測試連接以進行下一步。
說明請確保DTS服務的IP地址段能夠被自動或手動添加至源庫和目標庫的安全設置中,以允許DTS服務器的訪問。更多信息,請參見添加DTS服務器的IP地址段。
配置任務對象。
在對象配置頁面,配置待同步的對象。
配置
說明
同步類型
固定選中增量同步。默認情況下,您還需要同時選中庫表結構同步和全量同步。預檢查完成后,DTS會將源實例中待同步對象的全量數(shù)據(jù)在目標集群中初始化,作為后續(xù)增量同步數(shù)據(jù)的基線數(shù)據(jù)。
目標已存在表的處理模式
預檢查并報錯攔截:檢查目標數(shù)據(jù)庫中是否有同名的集合。如果目標數(shù)據(jù)庫中沒有同名的集合,則通過該檢查項目;如果目標數(shù)據(jù)庫中有同名的集合,則在預檢查階段提示錯誤,數(shù)據(jù)同步任務不會被啟動。
說明如果目標庫中同名的集合不方便刪除或重命名,您可以更改該集合在目標庫中的名稱,詳情請參見設置同步對象在目標實例中的名稱。
忽略報錯并繼續(xù)執(zhí)行:跳過目標數(shù)據(jù)庫中是否有同名集合的檢查項。
警告選擇為忽略報錯并繼續(xù)執(zhí)行,可能導致數(shù)據(jù)不一致,給業(yè)務帶來風險,例如:
在目標庫遇到與源庫主鍵或唯一鍵的值相同的記錄,則會保留目標庫中的該條記錄,即源庫中的該條記錄不會同步至目標庫中。
可能會導致無法初始化數(shù)據(jù)、只能同步部分的數(shù)據(jù)或同步失敗。
同步拓撲
請選擇雙向同步。
是否過濾DDL
選擇為是:不同步DDL操作。
選擇為否:同步DDL操作。
說明DDL語法同步方向限制 。為保障雙向同步鏈路的穩(wěn)定性,只支持正向同步任務同步DDL,不支持反向同步任務同步DDL。
沖突修復策略
如遇到以上支持的沖突檢測,根據(jù)業(yè)務需要,選擇合適的沖突修復策略。
TaskFailed(遇到?jīng)_突,任務報錯退出)
當數(shù)據(jù)同步遇到?jīng)_突時,同步任務直接報錯并退出,同步任務進入失敗狀態(tài),需要您介入修復任務。
Ignore(遇到?jīng)_突,直接使用目標實例中的沖突記錄)
當數(shù)據(jù)同步遇到?jīng)_突時,直接跳過當前同步語句,繼續(xù)往下執(zhí)行,選擇使用目標庫中的沖突記錄。
Overwrite(遇到?jīng)_突,直接覆蓋目標實例中的沖突記錄)
當數(shù)據(jù)同步遇到?jīng)_突時,直接覆蓋目標庫中的沖突記錄。
說明本場景僅支持Ignore。
源庫對象
在源庫對象框中單擊待同步對象,然后單擊將其移動至已選擇對象框。
說明同步對象的選擇粒度為DATABASE、COLLECTION。
已選擇對象
如需更改同步對象在目標實例中的名稱,請右擊已選擇對象中的同步對象進行修改。設置方式,請參見庫表列名映射。
如需移除已選擇的同步對象,請在已選擇對象框中單擊待同步的對象,然后單擊將其移動到源庫對象框。
說明如需按庫或集合級別選擇增量同步的操作,請在已選擇對象中右擊待同步的對象,并在彈出的對話框中進行選擇。
如需設置條件過濾數(shù)據(jù)(全量同步階段支持條件過濾數(shù)據(jù),增量同步階段不支持),請在已選擇對象中右擊待同步的表,并在彈出的對話框中進行設置。設置方法,請參見設置過濾條件。
如果使用了對象名映射功能(指定用于接收數(shù)據(jù)的數(shù)據(jù)庫或集合),可能會導致依賴這個對象的其他對象同步失敗。
單擊下一步高級配置,進行高級參數(shù)配置。
配置
說明
選擇調(diào)度該任務的專屬集群
DTS默認將任務調(diào)度到共享集群上,您無需選擇。若您希望任務更加穩(wěn)定,可以購買專屬集群來運行DTS同步任務。更多信息,請參見什么是DTS專屬集群。
源庫、目標庫無法連接后的重試時間
在同步任務啟動后,若源庫或目標庫連接失敗則DTS會報錯,并會立即進行持續(xù)的重試連接,默認持續(xù)重試時間為720分鐘,您也可以在取值范圍(10~1440分鐘)內(nèi)自定義重試時間,建議設置30分鐘以上。如果DTS在設置的重試時間內(nèi)重新連接上源庫、目標庫,同步任務將自動恢復。否則,同步任務將會失敗。
說明針對同源或者同目標的多個DTS實例,如DTS實例A和DTS實例B,設置網(wǎng)絡重試時間時A設置30分鐘,B設置60分鐘,則重試時間以低的30分鐘為準。
由于連接重試期間,DTS將收取任務運行費用,建議您根據(jù)業(yè)務需要自定義重試時間,或者在源和目標庫實例釋放后盡快釋放DTS實例。
源庫、目標庫出現(xiàn)其他問題后的重試時間
在同步任務啟動后,若源庫或目標庫出現(xiàn)非連接性的其他問題(如DDL或DML執(zhí)行異常),則DTS會報錯并會立即進行持續(xù)的重試操作,默認持續(xù)重試時間為10分鐘,您也可以在取值范圍(1~1440分鐘)內(nèi)自定義重試時間,建議設置10分鐘以上。如果DTS在設置的重試時間內(nèi)相關操作執(zhí)行成功,同步任務將自動恢復。否則,同步任務將會失敗。
重要源庫、目標庫出現(xiàn)其他問題后的重試時間的值需要小于源庫、目標庫無法連接后的重試時間的值。
是否限制全量遷移速率
在全量同步階段,DTS將占用源庫和目標庫一定的讀寫資源,可能會導致數(shù)據(jù)庫的負載上升。您可以根據(jù)實際情況,選擇是否對全量同步任務進行限速設置(設置每秒查詢源庫的速率QPS、每秒全量遷移的行數(shù)RPS和每秒全量遷移的數(shù)據(jù)量(MB)BPS),以緩解目標庫的壓力。
說明僅當同步類型選擇了全量同步時才可以配置。
同一張表內(nèi)主鍵_id的數(shù)據(jù)類型是否唯一
待同步的數(shù)據(jù)中,同一個集合內(nèi)主鍵
_id
的數(shù)據(jù)類型是否唯一。說明僅當同步類型選擇了全量同步時才可以配置。
是:唯一。在全量同步階段,DTS將不會掃描源庫待同步數(shù)據(jù)中主鍵的數(shù)據(jù)類型。
否:不唯一。在全量同步階段,DTS將掃描源庫待同步數(shù)據(jù)中主鍵的數(shù)據(jù)類型。
是否限制增量同步速率
您也可以根據(jù)實際情況,選擇是否對增量同步任務進行限速設置(設置每秒增量同步的行數(shù)RPS和每秒增量同步的數(shù)據(jù)量(MB)BPS),以緩解目標庫的壓力。
環(huán)境標簽
您可以根據(jù)實際情況,選擇用于標識實例的環(huán)境標簽。本示例無需選擇。
配置ETL功能
選擇是否配置ETL功能。關于ETL的更多信息,請參見什么是ETL。
是:配置ETL功能,并在文本框中填寫數(shù)據(jù)處理語句,詳情請參見在DTS遷移或同步任務中配置ETL。
否:不配置ETL功能。
監(jiān)控告警
是否設置告警,當同步失敗或延遲超過閾值后,將通知告警聯(lián)系人。
不設置:不設置告警。
設置:設置告警,您還需要設置告警閾值和告警聯(lián)系人。更多信息,請參見在配置任務過程中配置監(jiān)控告警。
單擊下一步數(shù)據(jù)校驗,進行數(shù)據(jù)校驗任務配置。
若您需要使用數(shù)據(jù)校驗功能,配置方法請參見配置數(shù)據(jù)校驗。
保存任務并進行預檢查。
若您需要查看調(diào)用API接口配置該實例時的參數(shù)信息,請將鼠標光標移動至下一步保存任務并預檢查按鈕上,然后單擊氣泡中的預覽OpenAPI參數(shù)。
若您無需查看或已完成查看API參數(shù),請單擊頁面下方的下一步保存任務并預檢查。
說明在同步作業(yè)正式啟動之前,會先進行預檢查。只有預檢查通過后,才能成功啟動同步作業(yè)。
如果預檢查失敗,請單擊失敗檢查項后的查看詳情,并根據(jù)提示修復后重新進行預檢查。
如果預檢查產(chǎn)生警告:
對于不可以忽略的檢查項,請單擊失敗檢查項后的查看詳情,并根據(jù)提示修復后重新進行預檢查。
對于可以忽略無需修復的檢查項,您可以依次單擊點擊確認告警詳情、確認屏蔽、確定、重新進行預檢查,跳過告警檢查項重新進行預檢查。如果選擇屏蔽告警檢查項,可能會導致數(shù)據(jù)不一致等問題,給業(yè)務帶來風險。
購買實例。
預檢查通過率顯示為100%時,單擊下一步購買。
在購買頁面,選擇數(shù)據(jù)同步實例的計費方式、鏈路規(guī)格,詳細說明請參見下表。
類別
參數(shù)
說明
信息配置
計費方式
預付費(包年包月):在新建實例時支付費用。適合長期需求,價格比按量付費更實惠,且購買時長越長,折扣越多。
后付費(按量付費):按小時扣費。適合短期需求,用完可立即釋放實例,節(jié)省費用。
資源組配置
實例所屬的資源組,默認為default resource group。更多信息,請參見什么是資源管理。
鏈路規(guī)格
DTS為您提供了不同性能的同步規(guī)格,同步鏈路規(guī)格的不同會影響同步速率,您可以根據(jù)業(yè)務場景進行選擇。更多信息,請參見數(shù)據(jù)同步鏈路規(guī)格說明。
訂購時長
在預付費模式下,選擇包年包月實例的時長和數(shù)量,包月可選擇1~9個月,包年可選擇1年、2年、3年和5年。
說明該選項僅在付費類型為預付費時出現(xiàn)。
配置完成后,閱讀并勾選《數(shù)據(jù)傳輸(按量付費)服務條款》。
單擊購買并啟動,并在彈出的確認對話框,單擊確定。
您可在數(shù)據(jù)同步界面查看具體任務進度。
配置反向同步任務。
等待正向同步任務同步初始化完成,直至運行狀態(tài)處于運行中。
定位至反向同步任務,單擊配置任務。
- 重要
配置反向任務時,您需要選擇正確的源和目標實例。反向同步中源實例為正向同步中的目標實例,目標實例為正向同步中的源實例,并且您還需仔細確認實例信息(如數(shù)據(jù)庫名稱、賬號、密碼)的一致性。
配置反向任務時不建議更改映射名稱,否則可能會導致數(shù)據(jù)不一致。
反向同步任務源和目標庫的實例地區(qū)不支持修改,且需要配置的參數(shù)比正向同步任務少,請以控制臺界面為準。
反向同步任務的目標已存在表的處理模式配置不檢測正向同步任務同步至目標實例中的表。
反向同步任務不支持同步正向任務已選擇對象中的對象。
反向同步任務將自動過濾DDL操作。
預檢查通過率顯示為100%時,單擊返回列表。
第二個同步任務配置完成后,等待兩個同步任務鏈路的運行狀態(tài)均處于運行中,即完成雙向數(shù)據(jù)同步的配置流程。