本文中含有需要您注意的重要提示信息,忽略該信息可能對您的業務造成影響,請務必仔細閱讀。
本文介紹如何使用數據傳輸服務DTS(Data Transmission Service),將3.2版本的騰訊云MongoDB副本集實例全量遷移至阿里云。
背景信息
當您因業務調整或需要使用阿里云MongoDB特性功能時,您可以使用DTS工具,通過全量數據遷移方法,將3.2版本的騰訊云MongoDB副本集實例遷移至阿里云MongoDB實例。
前提條件
騰訊云MongoDB副本集實例的數據庫版本為3.2版本。
說明關于3.6版本的騰訊云MongoDB副本集實例的遷移方法,請參見使用DTS將騰訊云MongoDB增量遷移至阿里云。
已創建阿里云MongoDB實例。如果尚未創建,請參見創建副本集實例或創建分片集群實例。
說明建議阿里云MongoDB實例的存儲空間比騰訊云MongoDB副本集實例已使用的存儲空間大10%。如果創建的阿里云MongoDB實例存儲空間過低,您需要升級存儲空間,詳情請參見變更配置方案概覽。
如需遷移至阿里云MongoDB分片集群實例,建議對數據進行分片以更好地發揮性能,詳情請參見設置數據分片。
注意事項
遷移開始前需要停止騰訊云MongoDB數據庫的相關業務,為保障數據一致性,全量數據遷移期間請勿在騰訊云MongoDB數據庫中寫入新的數據。
DTS在執行全量數據遷移時將占用源庫和目標庫一定的資源,可能會導致數據庫服務器負載上升。如果數據庫業務量較大或服務器規格較低,可能會加重數據庫壓力,甚至導致數據庫服務不可用。建議您在執行數據遷移前謹慎評估,在業務低峰期執行數據遷移。
對于遷移失敗的任務,DTS會觸發自動恢復。當您需要將業務切換至目標實例時,請務必先結束或釋放該任務,避免該任務被自動恢復后,導致源端數據覆蓋目標實例的數據。
阿里云MongoDB實例支持的版本與存儲引擎請參見版本及存儲引擎,如需跨版本或跨引擎遷移,請提前確認兼容性。
由于DTS寫入數據的邏輯為并發寫入,所以會導致目標端占用的存儲空間比源端大5%~10%。
請確保目標端MongoDB沒有與源端相同的主鍵(默認為_id),否則會導致數據丟失。若目標端有與源端相同的主鍵,請在不影響業務的前提條件下清空目標端的相關數據(刪掉目標端中與源端相同_id的文檔)。
費用說明
遷移類型 | 鏈路配置費用 | 公網流量費用 |
全量數據遷移 | 不收費 | 不收費 |
遷移類型說明
全量數據遷移:將源MongoDB數據庫遷移對象的存量數據全部遷移到目標MongoDB數據庫中。
支持database、collection、index的遷移。
遷移權限要求
遷移對象 | 權限要求 |
騰訊云MongoDB副本集實例 | 待遷移庫的read權限 |
阿里云MongoDB實例 | 目標庫的readWrite權限 |
遷移前準備工作
由于騰訊云MongoDB實例只有內網連接地址,沒有公網連接地址。此時需要創建一個具有公網地址的騰訊云服務器用作端口數據轉發,以完成數據庫的遷移操作。遷移操作完成后如不再需要,可釋放騰訊云服務器。
創建騰訊云服務器。本案例中創建的騰訊云服務器使用的是Linux操作系統。
說明為保障騰訊云服務器和騰訊云MongoDB副本集實例的正常通信,騰訊云服務器的地域、可用區、私有網絡和子網需配置與騰訊云MongoDB副本集實例一致。
進入騰訊云服務器控制臺,查看騰訊云服務器的內網IP地址與公網IP地址。
進入騰訊云MongoDB控制臺,查看騰訊云MongoDB副本集實例的內網IP地址。
登錄騰訊云服務器,使用如下命令開啟騰訊云服務器的iptables服務。如果已開啟,可跳過本步驟。
service iptables start
設置iptables規則,對27017端口進行映射。
iptables -t nat -A PREROUTING -d <CVM_IP> -p tcp --dport 27017 -j DNAT --to-destination <MongoDB_IP>:27017 iptables -t nat -A POSTROUTING -d <MongoDB_IP> -p tcp --dport 27017 -j SNAT --to-source <CVM_IP>
說明<CVM_IP>:騰訊云服務器的內網IP地址。
<MongoDB_IP>:騰訊云MongoDB副本集實例的內網IP地址。
示例:
iptables -t nat -A PREROUTING -d 10.10.0.5 -p tcp --dport 27017 -j DNAT --to-destination 10.10.0.7:27017 iptables -t nat -A POSTROUTING -d 10.10.0.7 -p tcp --dport 27017 -j SNAT --to-source 10.10.0.5
開啟騰訊云服務器的路由轉發功能。
echo 1 > /proc/sys/net/ipv4/ip_forward
返回騰訊云服務器控制臺,在左側導航欄,單擊安全組。
在入站規則頁簽,單擊添加規則,放通MongoDB數據庫端口27017,允許外網訪問該端口。
進入騰訊云MongoDB控制臺,單擊目標MongoDB實例名。
單擊安全組頁簽,并單擊配置安全組。
在彈出的配置安全組對話框,選擇已放通27017端口的安全組,并單擊確認。
操作步驟(新版控制臺)
進入目標地域的遷移任務列表頁面(二選一)。
通過DTS控制臺進入
登錄數據傳輸服務DTS控制臺。
在左側導航欄,單擊數據遷移。
在頁面左上角,選擇遷移實例所屬地域。
通過DMS控制臺進入
說明實際操作可能會因DMS的模式和布局不同,而有所差異。更多信息。請參見極簡模式控制臺和自定義DMS界面布局與樣式。
登錄DMS數據管理服務。
在頂部菜單欄中,選擇
。在遷移任務右側,選擇遷移實例所屬地域。
單擊創建任務,進入任務配置頁面。
可選:在頁面右上角,單擊試用新版配置頁。
說明若您已進入新版配置頁(頁面右上角的按鈕為返回舊版配置頁),則無需執行此操作。
新版配置頁和舊版配置頁部分參數有差異,建議使用新版配置頁。
配置源庫及目標庫信息。
警告選擇源和目標實例后,建議您仔細閱讀頁面上方顯示的使用限制,否則可能會導致任務失敗或數據不一致。
類別
配置
說明
無
任務名稱
DTS會自動生成一個任務名稱,建議配置具有業務意義的名稱(無唯一性要求),便于后續識別。
源庫信息
選擇已有連接信息
您可以按實際需求,選擇是否使用已有實例。
如使用已有實例,下方數據庫信息將自動填入,您無需重復輸入。
如不使用已有實例,您需要配置下方的數據庫信息。
說明在DMS控制臺,您可以單擊新增DMS數據庫實例錄入數據庫實例。更多信息,請參見云數據庫錄入和他云/自建數據庫錄入。
在DTS控制臺,您可以在數據連接管理頁面或新版配置頁面,將數據庫錄入DTS。更多信息,請參見數據連接管理。
數據庫類型
選擇MongoDB。
接入方式
選擇公網IP。
實例地區
選擇騰訊云MongoDB數據庫所屬地域。
說明若選項中沒有騰訊云MongoDB數據庫所屬的地域,您可以選擇一個該數據庫距離最近的地域。
架構類型
選擇副本集架構。
域名或IP地址
填入騰訊云MongoDB數據庫服務器的公網IP地址。
說明您可以參見遷移前準備工作來配置安全組規則。您也可以在實例地區配置項后,單擊獲取DTS IP段來獲取DTS服務器的IP地址,并將獲取到的IP地址加入至騰訊云MongoDB副本集實例的安全組規則中。
端口
填入騰訊云MongoDB數據庫的端口號,本案例中填入27017。
鑒權數據庫名稱
填入鑒權數據庫名,默認為admin。
數據庫賬號
填入騰訊云MongoDB數據庫的賬號,默認為mongouser。權限要求請參見遷移賬號權限要求。
數據庫密碼
填入騰訊云MongoDB數據庫賬號的密碼。
連接方式
選擇非加密連接。
目標庫信息
選擇已有連接信息
您可以按實際需求,選擇是否使用已有實例。
如使用已有實例,下方數據庫信息將自動填入,您無需重復輸入。
如不使用已有實例,您需要配置下方的數據庫信息。
說明在DMS控制臺,您可以單擊新增DMS數據庫實例錄入數據庫實例。更多信息,請參見云數據庫錄入和他云/自建數據庫錄入。
在DTS控制臺,您可以在數據連接管理頁面或新版配置頁面,將數據庫錄入DTS。更多信息,請參見數據連接管理。
數據庫類型
選擇MongoDB。
接入方式
選擇云實例。
實例地區
選擇目標阿里云MongoDB實例所屬地域。
架構類型
根據您的業務需求選擇架構,取值為:
實例ID
選擇目標阿里云MongoDB實例ID。
鑒權數據庫名稱
填入鑒權數據庫名,默認為admin。
數據庫賬號
填入目標阿里云MongoDB實例的數據庫賬號,權限要求請參見遷移賬號權限要求。
數據庫密碼
填入該數據庫賬號對應的密碼。
配置完成后,單擊頁面下方的測試連接以進行下一步。
如果您的自建數據庫具備白名單安全設置,您需要復制彈跳框中的DTS服務器IP地址,并加入自建數據庫的白名單安全設置中。然后單擊測試連接。
警告DTS自動添加或您手動添加DTS服務的公網IP地址段可能會存在安全風險,一旦使用本產品代表您已理解和確認其中可能存在的安全風險,并且需要您做好基本的安全防護,包括但不限于加強賬號密碼強度防范、限制各網段開放的端口號、內部各API使用鑒權方式通信、定期檢查并限制不需要的網段,或者使用通過內網(專線/VPN網關/智能網關)的方式接入。
配置任務對象。
在對象配置頁面,配置待遷移的對象。
配置
說明
遷移類型
本案例為全量數據遷移,選中全量遷移。
說明保障數據一致性,數據遷移期間請勿在源實例中寫入新的數據。
目標已存在表的處理模式
- 預檢查并報錯攔截:檢查目標數據庫中是否有同名的集合。如果目標數據庫中沒有同名的集合,則通過該檢查項目;如果目標數據庫中有同名的集合,則在預檢查階段提示錯誤,數據同步任務不會被啟動。 說明 如果目標庫中同名的集合不方便刪除或重命名,您可以更改該集合在目標庫中的名稱,詳情請參見設置同步對象在目標實例中的名稱。
- 忽略報錯并繼續執行:跳過目標數據庫中是否有同名集合的檢查項。 警告 選擇為忽略報錯并繼續執行,可能導致數據不一致,給業務帶來風險,例如:
- 在目標庫遇到與源庫主鍵的值相同的記錄,則會保留目標庫中的該條記錄,即源庫中的該條記錄不會同步至目標庫中。
- 可能會導致無法初始化數據、只能同步部分的數據或同步失敗。
目標庫對象名稱大小寫策略
您可以配置目標實例中同步對象的庫名和集合名的英文大小寫策略。默認情況下選擇DTS默認策略,您也可以選擇與源庫或目標庫默認策略保持一致。更多信息,請參見目標庫對象名稱大小寫策略。
源庫對象
在源庫對象框中選擇待遷移對象,然后單擊將其移動至已選擇對象框。
說明不支持遷移admin和local數據庫。
遷移對象選擇的粒度為:database、collection或function。
已選擇對象
如需更改單個遷移對象在目標實例中的名稱,請右擊已選擇對象中的遷移對象,設置方式,請參見庫表列名單個映射。
如需批量更改遷移對象在目標實例中的名稱,請單擊已選擇對象方框右上方的批量編輯,設置方式,請參見庫表列名批量映射。
說明如果使用了對象名映射功能,可能會導致依賴這個對象的其他對象遷移失敗。
如需設置WHERE條件過濾數據,請在已選擇對象中右擊待遷移的對象,在彈出的對話框中設置過濾條件。設置方法請參見設置過濾條件。
- 預檢查并報錯攔截:檢查目標數據庫中是否有同名的集合。如果目標數據庫中沒有同名的集合,則通過該檢查項目;如果目標數據庫中有同名的集合,則在預檢查階段提示錯誤,數據同步任務不會被啟動。
單擊下一步高級配置,進行高級參數配置。
配置
說明
源庫、目標庫無法連接后的重試時間
在遷移任務啟動后,若源庫或目標庫連接失敗則DTS會報錯,并會立即進行持續的重試連接,默認重試720分鐘,您也可以在取值范圍(10~1440分鐘)內自定義重試時間,建議設置30分鐘以上。如果DTS在設置的時間內重新連接上源、目標庫,遷移任務將自動恢復。否則,遷移任務將失敗。
說明針對同源或者同目標的多個DTS實例,網絡重試時間以后創建任務的設置為準。
由于連接重試期間,DTS將收取任務運行費用,建議您根據業務需要自定義重試時間,或者在源和目標庫實例釋放后盡快釋放DTS實例。
源庫、目標庫出現其他問題后的重試時間
在遷移任務啟動后,若源庫或目標庫出現非連接性的其他問題(如DDL或DML執行異常),則DTS會報錯并會立即進行持續的重試操作,默認持續重試時間為10分鐘,您也可以在取值范圍(1~1440分鐘)內自定義重試時間,建議設置10分鐘以上。如果DTS在設置的重試時間內相關操作執行成功,遷移任務將自動恢復。否則,遷移任務將會失敗。
重要源庫、目標庫出現其他問題后的重試時間的值需要小于源庫、目標庫無法連接后的重試時間的值。
是否限制全量遷移速率
在全量遷移階段,DTS將占用源庫和目標庫一定的讀寫資源,可能會導致數據庫的負載上升。您可以根據實際情況,選擇是否對全量遷移任務進行限速設置(設置每秒查詢源庫的速率QPS、每秒全量遷移的行數RPS和每秒全量遷移的數據量(MB)BPS),以緩解目標庫的壓力。
說明僅當遷移類型選擇了全量遷移時才可以配置。
環境標簽
您可以根據實際情況,選擇用于標識實例的環境標簽。本示例無需選擇。
配置ETL功能
選擇是否配置ETL功能。關于ETL的更多信息,請參見什么是ETL。
是:配置ETL功能,并在文本框中填寫數據處理語句,詳情請參見在DTS遷移或同步任務中配置ETL。
否:不配置ETL功能。
監控告警
是否設置告警,當遷移失敗或延遲超過閾值后,將通知告警聯系人。
不設置:不設置告警。
設置:設置告警,您還需要設置告警閾值和告警聯系人。更多信息,請參見在配置任務過程中配置監控告警。
單擊下一步數據校驗,進行數據校驗任務配置。
若您需要使用數據校驗功能,配置方法請參見配置數據校驗。
保存任務并進行預檢查。
若您需要查看調用API接口配置該實例時的參數信息,請將鼠標光標移動至下一步保存任務并預檢查按鈕上,然后單擊氣泡中的預覽OpenAPI參數。
若您無需查看或已完成查看API參數,請單擊頁面下方的下一步保存任務并預檢查。
說明在遷移任務正式啟動之前,會先進行預檢查。只有預檢查通過后,才能成功啟動遷移任務。
如果預檢查失敗,請單擊失敗檢查項后的查看詳情,并根據提示修復后重新進行預檢查。
如果預檢查產生警告:
對于不可以忽略的檢查項,請單擊失敗檢查項后的查看詳情,并根據提示修復后重新進行預檢查。
對于可以忽略無需修復的檢查項,您可以依次單擊點擊確認告警詳情、確認屏蔽、確定、重新進行預檢查,跳過告警檢查項重新進行預檢查。如果選擇屏蔽告警檢查項,可能會導致數據不一致等問題,給業務帶來風險。
預檢查通過率顯示為100%時,單擊下一步購買。
購買實例。
在購買頁面,選擇數據遷移實例的鏈路規格,詳細說明請參見下表。
類別
參數
說明
信息配置
資源組配置
選擇實例所屬的資源組,默認為default resource group。更多信息,請參見什么是資源管理。
鏈路規格
DTS為您提供了不同性能的遷移規格,遷移鏈路規格的不同會影響遷移速率,您可以根據業務場景進行選擇。更多信息,請參見數據遷移鏈路規格說明。
配置完成后,閱讀并選中《數據傳輸(按量付費)服務條款》。
單擊購買并啟動,并在彈出的確認對話框,單擊確定。
您可在數據遷移界面查看具體進度。
數據遷移操作步驟(舊版控制臺)
登錄數據傳輸控制臺。
說明若數據傳輸控制臺自動跳轉至數據管理DMS控制臺,您可以在右下角的中單擊,返回至舊版數據傳輸控制臺。
- 在左側導航欄,單擊數據遷移。
在遷移任務列表頁面頂部,選擇目標MongoDB實例所屬地域。
- 單擊右上角的創建遷移任務。
配置遷移任務的源庫及目標庫信息。
類別
配置
說明
無
任務名稱
DTS會自動生成一個任務名稱,建議配置具有業務意義的名稱(無唯一性要求),便于后續識別。
源庫信息
實例類型
選擇有公網IP的自建數據庫。
實例地區
當實例類型選擇為有公網IP的自建數據庫時,實例地區無需設置。
數據庫類型
選擇MongoDB。
主機名或IP地址
填入騰訊云服務器的公網IP地址。
端口
填入騰訊云MongoDB數據庫的端口號,本案例中填入27017。
數據庫名稱
填入鑒權數據庫名,默認為admin。
數據庫賬號
填入騰訊云MongoDB數據庫的賬號,默認為mongouser。權限要求請參見遷移賬號權限要求。
數據庫密碼
填入騰訊云MongoDB數據庫賬號的密碼。
說明源庫信息填寫完畢后,您可以單擊數據庫密碼后的測試連接來驗證填入的源庫信息是否正確。源庫信息填寫正確則提示測試通過,如提示測試失敗,單擊測試失敗后的診斷,根據提示調整填寫的源庫信息。
連接方式
選擇非加密連接。
說明只有在遷移MongoDB Atlas數據庫時,才能選擇SSL安全連接。
目標庫信息
實例類型
選擇MongoDB實例。
實例地區
選擇阿里云MongoDB實例所在地域。
MongoDB實例ID
選擇阿里云MongoDB實例ID。
數據庫名稱
填入鑒權數據庫名,默認為admin。
數據庫賬號
填入阿里云MongoDB數據庫的賬號,權限要求請參見遷移賬號權限要求。
數據庫密碼
填入阿里云MongoDB數據庫賬號的密碼。
說明目標庫信息填寫完畢后,您可以單擊數據庫密碼后的測試連接來驗證填入的目標庫信息是否正確。目標庫信息填寫正確則提示測試通過,如提示測試失敗,單擊測試失敗后的診斷,根據提示調整填寫的目標庫信息。
配置完成后,單擊頁面右下角的授權白名單并進入下一步。
如果源或目標數據庫是阿里云數據庫實例(例如RDS MySQL、云數據庫MongoDB版等),DTS會自動將對應地區DTS服務的IP地址添加到阿里云數據庫實例的白名單;如果源或目標數據庫是ECS上的自建數據庫,DTS會自動將對應地區DTS服務的IP地址添到ECS的安全規則中,您還需確保自建數據庫沒有限制ECS的訪問(若數據庫是集群部署在多個ECS實例,您需要手動將DTS服務對應地區的IP地址添到其余每個ECS的安全規則中);如果源或目標數據庫是IDC自建數據庫或其他云數據庫,則需要您手動添加對應地區DTS服務的IP地址,以允許來自DTS服務器的訪問。DTS服務的IP地址,請參見DTS服務器的IP地址段。
警告DTS自動添加或您手動添加DTS服務的公網IP地址段可能會存在安全風險,一旦使用本產品代表您已理解和確認其中可能存在的安全風險,并且需要您做好基本的安全防護,包括但不限于加強賬號密碼強度防范、限制各網段開放的端口號、內部各API使用鑒權方式通信、定期檢查并限制不需要的網段,或者使用通過內網(專線/VPN網關/智能網關)的方式接入。
選擇遷移對象和遷移類型。
配置
說明
遷移類型
本案例為全量數據遷移,選中全量數據遷移。
說明為保障數據一致性,數據遷移期間請勿在騰訊云MongoDB數據庫中寫入新的數據。
遷移對象
在遷移對象框中單擊待遷移的對象,然后單擊圖標將其移動到已選擇對象框。
說明不支持遷移admin和local數據庫。
遷移對象選擇的粒度為:database、collection或function。
默認情況下,遷移對象的名稱不變。如果您需要遷移對象在阿里云MongoDB數據庫中名稱不同,需要使用對象名映射功能,詳情請參見庫表列映射。
映射名稱更改
如需更改遷移對象在目標實例中的名稱,請使用對象名映射功能,詳情請參見庫表列映射。
源、目標庫無法連接重試時間
默認重試12小時,您也可以自定義重試時間。如果DTS在設置的時間內重新連接上源、目標庫,遷移任務將自動恢復。否則,遷移任務將失敗。
說明由于連接重試期間,DTS將收取任務運行費用,建議您根據業務需要自定義重試時間,或者在源和目標庫實例釋放后盡快釋放DTS實例。
上述配置完成后,單擊頁面右下角的預檢查并啟動。
說明在遷移任務正式啟動之前,會先進行預檢查。只有預檢查通過后,才能成功啟動遷移任務。
如果預檢查失敗,單擊具體檢查項后的,查看失敗詳情。
您可以根據提示修復后重新進行預檢查。
如無需修復告警檢測項,您也可以選擇確認屏蔽、忽略告警項并重新進行預檢查,跳過告警檢測項重新進行預檢查。
預檢查通過后,單擊下一步。
在購買配置確認頁面,選擇鏈路規格并選中數據傳輸(按量付費)服務條款。
單擊購買并啟動,遷移任務正式開始。
說明請勿手動停止遷移任務,否則可能會導致數據不完整。您只需等待遷移任務完成即可,遷移任務會自動停止。
將業務切換至阿里云MongoDB實例。
后續操作
用于數據遷移的數據庫賬號擁有讀寫權限,為保障數據庫安全性,請在數據遷移完成后,修改騰訊云MongoDB和阿里云MongoDB實例中的數據庫密碼。