本文介紹如何使用數據傳輸服務DTS(Data Transmission Service),將ECS上分片集群架構的自建MongoDB數據遷移至阿里云MongoDB實例中。通過DTS的增量遷移功能,可以實現在應用不停服的情況下,平滑完成數據庫的遷移。
本文為舊版DTS遷移操作界面,新版DTS遷移步驟,請參見自建數據庫MongoDB版(分片集群架構)遷移至云數據庫MongoDB版(分片集群架構)。
遷移原理介紹
DTS通過遷移分片集群中的每個Shard節點來實現分片集群數據庫的整體遷移,您需要為每個Shard節點創建一個對應的數據遷移任務。
數據在目標MongoDB實例中的分布取決于您設置的片鍵,詳情請參見設置數據分片以充分利用Shard性能。
前提條件
自建MongoDB數據庫版本為3.0及以上版本。
確保目標分片集群實例中的Shard節點具備充足的存儲空間。
說明例如ECS上的自建數據庫中有三個Shard節點,其中第二個Shard節點占用的存儲空間最多(500GB),那么目標分片集群實例中的每個Shard節點的存儲空間均需要大于500GB。
注意事項
DTS在執行全量數據遷移時將占用源庫和目標庫一定的資源,可能會導致數據庫服務器負載上升。如果數據庫業務量較大或服務器規格較低,可能會加重數據庫壓力,甚至導致數據庫服務不可用。建議您在執行數據遷移前謹慎評估,在業務低峰期執行數據遷移。
MongoDB實例支持的版本與存儲引擎請參見版本及存儲引擎,如需跨版本或跨引擎遷移,請提前確認兼容性。
由于DTS寫入數據的邏輯為并發寫入,所以會導致目標端占用的存儲空間比源端大5%~10%。
請確保目標端MongoDB沒有與源端相同的主鍵(默認為_id),否則會導致數據丟失。若目標端有與源端相同的主鍵,請在不影響業務的前提條件下清空目標端的相關數據(刪掉目標端中與源端相同_id的文檔)。
不支持數據庫admin和local作為源和目標庫。
源MongoDB分片集群實例的Mongos節點的數量不能超過10個。
費用說明
遷移類型 | 鏈路配置費用 | 公網流量費用 |
全量數據遷移 | 不收費。 | 通過公網將數據遷移出阿里云時將收費,詳情請參見DTS產品定價。 |
增量數據遷移 | 收費,詳情請參見DTS產品定價。 |
遷移類型說明
全量數據遷移:將源MongoDB數據庫遷移對象的存量數據全部遷移到目標MongoDB數據庫中。
說明支持database、collection、index的遷移。
增量數據遷移:在全量遷移的基礎上,將源MongoDB數據庫的增量更新數據同步到目標MongoDB數據庫中。
說明支持database、collection、index的新建和刪除操作的同步。
支持document的新增、刪除和更新操作的同步。
數據庫賬號的權限要求
遷移數據源 | 全量數據遷移 | 增量數據遷移 |
ECS上的自建MongoDB數據庫 | 待遷移庫的read權限 | 待遷移庫、admin庫和local庫的read權限 |
阿里云MongoDB實例 | 目標庫的readWrite權限 | 目標庫的readWrite權限 |
數據庫賬號創建及授權方法:
阿里云MongoDB實例請參見使用DMS管理MongoDB數據庫用戶。
自建MongoDB數據庫請參見MongoDB Create User說明。
遷移前準備工作
在正式開始數據遷移之前,您需要關閉源數據庫的均衡器并清理孤立文檔,詳情請參見分片集群架構的數據庫遷移前準備工作。
操作步驟
- 登錄數據傳輸控制臺。
在左側導航欄,單擊數據遷移。
在遷移任務列表頁面頂部,選擇阿里云MongoDB實例所屬的地域。
單擊右上角的創建遷移任務。
配置遷移任務的源庫及目標庫信息。
類別
配置
說明
任務名稱
-
DTS為每個任務自動生成一個任務名稱,該名稱沒有唯一性要求。
您可以修改任務名稱,建議為任務配置具有業務意義的名稱,便于后續的識別。
源庫信息
實例類型
選擇ECS上的自建數據庫。
實例地區
選擇ECS實例所屬的地域。
ECS實例ID
DTS通過依次遷移分片集群中的每個Shard節點來實現整體遷移。此處先選擇第一個Shard節點所屬的ECS實例ID。
稍后創建第二個遷移任務時,此處選擇第二個Shard節點所屬的ECS實例ID。以此類推,直至遷移所有Shard節點。
數據庫類型
選擇MongoDB。
端口
此處先填入第一個Shard節點的服務端口。
稍后創建第二個遷移任務時,此處填入第二個Shard節點的服務端口。以此類推,直至遷移所有Shard節點。
數據庫名稱
填入鑒權數據庫名稱。
數據庫賬號
填入自建MongoDB數據庫的連接賬號,權限要求請參見數據庫賬號的權限要求。
數據庫密碼
填入自建MongoDB數據庫賬號對應的密碼。
說明源庫信息填寫完畢后,您可以單擊數據庫密碼后的測試連接來驗證填入的源庫信息是否正確。源庫信息填寫正確則提示測試通過,如提示測試失敗,單擊測試失敗后的診斷,根據提示調整填寫的源庫信息。
目標庫信息
實例類型
選擇MongoDB實例。
實例地區
選擇目標MongoDB實例所在地域。
MongoDB實例ID
選擇目標MongoDB實例ID。
數據庫名稱
填入鑒權數據庫名稱。
數據庫賬號
填入連接目標MongoDB實例的數據庫賬號,權限要求請參見數據庫賬號的權限要求。
數據庫密碼
填入連接目標MongoDB實例的數據庫賬號對應的密碼。
說明目標庫信息填寫完畢后,您可以單擊數據庫密碼后的測試連接來驗證填入的目標庫信息是否正確。目標庫信息填寫正確則提示測試通過。如提示測試失敗,單擊測試失敗后的診斷,根據提示調整填寫的目標庫信息。
配置完成后,單擊頁面右下角的授權白名單并進入下一步。
說明如果源或目標數據庫是阿里云數據庫實例(例如RDS MySQL、云數據庫MongoDB等)或ECS上的自建數據庫,DTS會自動將對應地區DTS服務的IP地址添加到阿里云數據庫實例的白名單或ECS的安全規則中,您無需手動添加,請參見DTS服務器的IP地址段。
如源或目標數據庫為自建數據庫,且添加DTS服務的公網IP地址段,以允許來自DTS服務器的訪問,則可能存在安全風險,謹慎使用。建議加強賬號密碼防范、限制放行的端口號,或者使用通過內網(專線/VPN網關/智能網關)接入。
DTS任務完成或釋放后,建議您手動刪除添加的DTS服務器IP地址段。
選擇遷移對象及遷移類型。
配置
說明
遷移類型
如果只需要進行全量遷移,則勾選全量數據遷移。
說明為保障數據一致性,全量數據遷移期間請勿在自建MongoDB數據庫中寫入新的數據。
如果需要進行不停機遷移,則同時選擇全量數據遷移和增量數據遷移。
遷移對象
在遷移對象框中單擊待遷移的對象,然后單擊將其移動到已選擇對象框。
說明不支持遷移admin和local數據庫。
config數據庫屬于系統內部數據庫,如無特殊需求,請勿遷移config數據庫。
遷移對象選擇的粒度為database、collection/function。
默認情況下,遷移完成后,遷移對象的名稱保持不變。如果您需要遷移對象在目標數據庫中的名稱不同,那么需要使用DTS提供的對象名映射功能。使用方法請參見庫表列映射。
上述配置完成后,單擊頁面右下角的預檢查并啟動。
說明在遷移任務正式啟動之前,會先進行預檢查。只有預檢查通過后,才能成功啟動遷移任務。
如果預檢查失敗,請單擊失敗檢查項后的查看詳情,并根據提示修復后重新進行預檢查。
如果預檢查產生警告:
對于不可以忽略的檢查項,請單擊失敗檢查項后的查看詳情,并根據提示修復后重新進行預檢查。
對于可以忽略無需修復的檢查項,您可以依次單擊點擊確認告警詳情、確認屏蔽、確定、重新進行預檢查,跳過告警檢查項重新進行預檢查。如果選擇屏蔽告警檢查項,可能會導致數據不一致等問題,給業務帶來風險。
預檢查通過后,單擊下一步。
在購買配置確認頁面,選擇鏈路規格并勾選數據傳輸(按量付費)服務條款。
單擊購買并啟動,遷移任務正式開始。
重復第4步到第11步的操作,為剩余的Shard節點創建遷移任務。
完成遷移任務。
全量數據遷移
請勿手動結束遷移任務,否則可能會導致數據不完整。您只需等待遷移任務完成即可,遷移任務會自動結束。
增量數據遷移
遷移任務不會自動結束,需要手動結束遷移任務。
說明請選擇合適的時間手動結束遷移任務,例如業務低峰期或準備將業務切換至MongoDB實例時。
等待所有Shard節點的遷移任務的進度變更為增量遷移,并顯示為無延遲狀態時,將源庫停寫幾分鐘,此時增量遷移的狀態可能會顯示延遲的時間。
等待所有Shard節點遷移任務的增量遷移再次進入無延遲狀態后,手動結束遷移任務。
將業務切換至阿里云MongoDB實例。