RDS MySQL遷移至MaxCompute
本文中含有需要您注意的重要提示信息,忽略該信息可能對您的業(yè)務(wù)造成影響,請務(wù)必仔細(xì)閱讀。
數(shù)據(jù)傳輸服務(wù)DTS(Data Transmission Service)支持將RDS MySQL遷移至云原生大數(shù)據(jù)計(jì)算服務(wù)MaxCompute。
支持的源數(shù)據(jù)庫
MySQL遷移至云原生大數(shù)據(jù)計(jì)算服務(wù)MaxCompute,支持以下類型的MySQL源數(shù)據(jù)庫。
RDS MySQL實(shí)例
MySQL自建數(shù)據(jù)庫:
有公網(wǎng)IP的自建數(shù)據(jù)庫
ECS上的自建數(shù)據(jù)庫
通過數(shù)據(jù)庫網(wǎng)關(guān)接入的自建數(shù)據(jù)庫
通過云企業(yè)網(wǎng)CEN接入的自建數(shù)據(jù)庫
通過專線、VPN網(wǎng)關(guān)或智能網(wǎng)關(guān)接入的自建數(shù)據(jù)庫
本文以RDS MySQL實(shí)例為源數(shù)據(jù)庫介紹配置流程,其他數(shù)據(jù)源配置流程與本案例類似。
前提條件
已創(chuàng)建源RDS MySQL實(shí)例。具體操作,請參見創(chuàng)建RDS MySQL實(shí)例。
已創(chuàng)建存儲空間須大于源RDS MySQL實(shí)例占用的存儲空間的目標(biāo)MaxCompute項(xiàng)目。具體操作,請參見創(chuàng)建MaxCompute項(xiàng)目。
已設(shè)置MaxCompute白名單,允許DTS訪問MaxCompute。具體操作,請參見設(shè)置阿里云產(chǎn)品訪問MaxCompute白名單。
注意事項(xiàng)
DTS不會將源數(shù)據(jù)庫中的外鍵遷移到目標(biāo)數(shù)據(jù)庫,因此源數(shù)據(jù)庫的級聯(lián)、刪除等操作不會遷移到目標(biāo)數(shù)據(jù)庫。
類型 | 說明 |
源庫限制 |
|
其他限制 |
|
特殊情況 |
|
費(fèi)用說明
遷移類型 | 鏈路配置費(fèi)用 | 公網(wǎng)流量費(fèi)用 |
結(jié)構(gòu)遷移和全量數(shù)據(jù)遷移 | 不收費(fèi)。 | 通過公網(wǎng)將數(shù)據(jù)遷移出阿里云時將收費(fèi),詳情請參見計(jì)費(fèi)概述。 |
增量數(shù)據(jù)遷移 | 收費(fèi),詳情請參見計(jì)費(fèi)概述。 |
遷移類型說明
庫表結(jié)構(gòu)遷移
DTS將源庫中待遷移表的結(jié)構(gòu)定義信息遷移至MaxCompute中,初始化時DTS會為表名增加_base后綴。例如源表為customer,那么MaxCompute中的表即為customer_base。
全量遷移
DTS將源庫中待遷移表的存量數(shù)據(jù),全部遷移至MaxCompute中的目標(biāo)表名_base表中(例如從源庫的customer表遷移至MaxCompute的customer_base表),作為后續(xù)增量遷移數(shù)據(jù)的基線數(shù)據(jù)。
說明該表也被稱為全量基線表。
增量遷移
DTS在MaxCompute中創(chuàng)建一個增量日志表,表名為遷移的目標(biāo)表名_log,例如customer_log,然后將源庫產(chǎn)生的增量數(shù)據(jù)實(shí)時遷移到該表中。
說明關(guān)于增量日志表結(jié)構(gòu)的詳細(xì)信息,請參見增量日志表結(jié)構(gòu)定義說明。
支持增量遷移的SQL操作
操作類型 | SQL操作語句 |
DML | INSERT、UPDATE、DELETE |
DDL | ADD COLUMN 說明 不支持遷移包含屬性的加列操作。 |
數(shù)據(jù)庫賬號的權(quán)限要求
數(shù)據(jù)庫 | 庫表結(jié)構(gòu)遷移 | 全量遷移 | 增量遷移 |
RDS MySQL | SELECT權(quán)限 | SELECT權(quán)限 | REPLICATION SLAVE、REPLICATION CLIENT及待遷移對象的SELECT權(quán)限,由DTS自動執(zhí)行授權(quán)。 |
MaxCompute | 讀寫權(quán)限 |
RDS MySQL實(shí)例的數(shù)據(jù)庫賬號創(chuàng)建及授權(quán)方法,請參見創(chuàng)建賬號和修改賬號權(quán)限。
操作步驟
進(jìn)入目標(biāo)地域的遷移任務(wù)列表頁面(二選一)。
通過DTS控制臺進(jìn)入
在左側(cè)導(dǎo)航欄,單擊數(shù)據(jù)遷移。
在頁面左上角,選擇遷移實(shí)例所屬地域。
通過DMS控制臺進(jìn)入
說明實(shí)際操作可能會因DMS的模式和布局不同,而有所差異。更多信息。請參見極簡模式控制臺和自定義DMS界面布局與樣式。
在頂部菜單欄中,選擇
。在遷移任務(wù)右側(cè),選擇遷移實(shí)例所屬地域。
單擊創(chuàng)建任務(wù),進(jìn)入任務(wù)配置頁面。
可選:在頁面右上角,單擊試用新版配置頁。
說明若您已進(jìn)入新版配置頁(頁面右上角的按鈕為返回舊版配置頁),則無需執(zhí)行此操作。
新版配置頁和舊版配置頁部分參數(shù)有差異,建議使用新版配置頁。
配置源庫及目標(biāo)庫信息。
類別
配置
說明
無
任務(wù)名稱
DTS會自動生成一個任務(wù)名稱,建議配置具有業(yè)務(wù)意義的名稱(無唯一性要求),便于后續(xù)識別。
源庫信息
選擇已有連接信息
您可以按實(shí)際需求,選擇是否使用已有數(shù)據(jù)庫實(shí)例。
如使用已有實(shí)例,下方數(shù)據(jù)庫信息將自動填入,您無需重復(fù)輸入。
如不使用已有實(shí)例,您需要配置下方的數(shù)據(jù)庫信息。
說明您可以在數(shù)據(jù)連接管理頁面或新版配置頁面,將數(shù)據(jù)庫錄入DTS。更多信息,請參見數(shù)據(jù)連接管理。
DMS控制臺的配置項(xiàng)為選擇DMS數(shù)據(jù)庫實(shí)例,您可以單擊新增DMS數(shù)據(jù)庫實(shí)例或在控制臺首頁將數(shù)據(jù)庫錄入DMS。更多信息,請參見云數(shù)據(jù)庫錄入和他云/自建數(shù)據(jù)庫錄入。
數(shù)據(jù)庫類型
選擇MySQL。
接入方式
選擇為云實(shí)例。
實(shí)例地區(qū)
選擇源RDS MySQL實(shí)例所屬地域。
是否跨阿里云賬號
本示例使用當(dāng)前阿里云賬號下的數(shù)據(jù)庫實(shí)例,需選擇不跨賬號。
RDS實(shí)例ID
選擇源RDS MySQL實(shí)例ID。
數(shù)據(jù)庫賬號
填入源RDS MySQL實(shí)例的數(shù)據(jù)庫賬號,權(quán)限要求,請參見數(shù)據(jù)庫賬號的權(quán)限要求。
數(shù)據(jù)庫密碼
填入該數(shù)據(jù)庫賬號對應(yīng)的密碼。
連接方式
根據(jù)需求選擇非加密連接或SSL安全連接。如果設(shè)置為SSL安全連接,您需要提前開啟RDS MySQL實(shí)例的SSL加密功能,詳情請參見使用云端證書快速開啟SSL鏈路加密。
目標(biāo)庫信息
選擇已有連接信息
您可以按實(shí)際需求,選擇是否使用已有數(shù)據(jù)庫實(shí)例。
如使用已有實(shí)例,下方數(shù)據(jù)庫信息將自動填入,您無需重復(fù)輸入。
如不使用已有實(shí)例,您需要配置下方的數(shù)據(jù)庫信息。
說明您可以在數(shù)據(jù)連接管理頁面或新版配置頁面,將數(shù)據(jù)庫錄入DTS。更多信息,請參見數(shù)據(jù)連接管理。
DMS控制臺的配置項(xiàng)為選擇DMS數(shù)據(jù)庫實(shí)例,您可以單擊新增DMS數(shù)據(jù)庫實(shí)例或在控制臺首頁將數(shù)據(jù)庫錄入DMS。更多信息,請參見云數(shù)據(jù)庫錄入和他云/自建數(shù)據(jù)庫錄入。
數(shù)據(jù)庫類型
選擇MaxCompute。
接入方式
選擇云實(shí)例。
實(shí)例地區(qū)
選擇目標(biāo)MaxCompute所屬地域。
Project
填入目標(biāo)MaxCompute項(xiàng)目名稱。
主賬號AccessKeyId
填入用于標(biāo)識用戶身份的AccessKey ID,獲取方式請參見創(chuàng)建AccessKey。
主賬號AccessKeySecret
填入用于驗(yàn)證用戶身份的AccessKey Secret,獲取方式請參見創(chuàng)建AccessKey。
配置完成后,單擊頁面下方的測試連接以進(jìn)行下一步。
如果源或目標(biāo)數(shù)據(jù)庫是阿里云數(shù)據(jù)庫實(shí)例(例如RDS MySQL、云數(shù)據(jù)庫MongoDB版等),DTS會自動將對應(yīng)地區(qū)DTS服務(wù)的IP地址添加到阿里云數(shù)據(jù)庫實(shí)例的白名單;如果源或目標(biāo)數(shù)據(jù)庫是ECS上的自建數(shù)據(jù)庫,DTS會自動將對應(yīng)地區(qū)DTS服務(wù)的IP地址添到ECS的安全規(guī)則中,您還需確保自建數(shù)據(jù)庫沒有限制ECS的訪問(若數(shù)據(jù)庫是集群部署在多個ECS實(shí)例,您需要手動將DTS服務(wù)對應(yīng)地區(qū)的IP地址添到其余每個ECS的安全規(guī)則中);如果源或目標(biāo)數(shù)據(jù)庫是IDC自建數(shù)據(jù)庫或其他云數(shù)據(jù)庫,則需要您手動添加對應(yīng)地區(qū)DTS服務(wù)的IP地址,以允許來自DTS服務(wù)器的訪問。DTS服務(wù)的IP地址,請參見DTS服務(wù)器的IP地址段。
警告DTS自動添加或您手動添加DTS服務(wù)的公網(wǎng)IP地址段可能會存在安全風(fēng)險(xiǎn),一旦使用本產(chǎn)品代表您已理解和確認(rèn)其中可能存在的安全風(fēng)險(xiǎn),并且需要您做好基本的安全防護(hù),包括但不限于加強(qiáng)賬號密碼強(qiáng)度防范、限制各網(wǎng)段開放的端口號、內(nèi)部各API使用鑒權(quán)方式通信、定期檢查并限制不需要的網(wǎng)段,或者使用通過內(nèi)網(wǎng)(專線/VPN網(wǎng)關(guān)/智能網(wǎng)關(guān))的方式接入。
單擊確定,完成MaxCompute賬號授權(quán)。
配置任務(wù)對象。
在對象配置頁面,配置待遷移的對象。
配置
說明
遷移類型
如果只需要進(jìn)行全量遷移,請同時選中庫表結(jié)構(gòu)遷移和全量遷移。
如果需要進(jìn)行不停機(jī)遷移,請同時選中庫表結(jié)構(gòu)遷移、全量遷移和增量遷移。
說明如果未選擇增量遷移,為保障數(shù)據(jù)一致性,數(shù)據(jù)遷移期間請勿在源實(shí)例中寫入新的數(shù)據(jù)。
附加列規(guī)則
DTS在將數(shù)據(jù)遷移到MaxCompute時,會在遷移的目標(biāo)表中添加一些附加列。您需要根據(jù)業(yè)務(wù)需求選擇新規(guī)則或舊規(guī)則。
警告在選擇附加列規(guī)則前,您需要評估附加列和目標(biāo)表中已有的列是否會出現(xiàn)名稱沖突,如果出現(xiàn)名稱沖突將會導(dǎo)致數(shù)據(jù)遷移失敗或數(shù)據(jù)丟失。關(guān)于附加列的規(guī)則和定義說明,請參見附加列名稱和定義說明。
增量日志表分區(qū)定義
根據(jù)業(yè)務(wù)需求,選擇分區(qū)名稱。關(guān)于分區(qū)的相關(guān)介紹請參見分區(qū)。
目標(biāo)已存在表的處理模式
預(yù)檢查并報(bào)錯攔截:檢查目標(biāo)數(shù)據(jù)庫中是否有同名的表。如果目標(biāo)數(shù)據(jù)庫中沒有同名的表,則通過該檢查項(xiàng)目;如果目標(biāo)數(shù)據(jù)庫中有同名的表,則在預(yù)檢查階段提示錯誤,數(shù)據(jù)遷移任務(wù)不會被啟動。
說明如果目標(biāo)庫中同名的表不方便刪除或重命名,您可以更改該表在目標(biāo)庫中的名稱,請參見庫表列名映射。
忽略報(bào)錯并繼續(xù)執(zhí)行:跳過目標(biāo)數(shù)據(jù)庫中是否有同名表的檢查項(xiàng)。
警告選擇為忽略報(bào)錯并繼續(xù)執(zhí)行,可能導(dǎo)致數(shù)據(jù)不一致,給業(yè)務(wù)帶來風(fēng)險(xiǎn),例如:
表結(jié)構(gòu)一致的情況下,在目標(biāo)庫遇到與源庫主鍵的值相同的記錄:
全量期間,DTS會保留目標(biāo)集群中的該條記錄,即源庫中的該條記錄不會遷移至目標(biāo)數(shù)據(jù)庫中。
增量期間,DTS不會保留目標(biāo)集群中的該條記錄,即源庫中的該條記錄會覆蓋至目標(biāo)數(shù)據(jù)庫中。
表結(jié)構(gòu)不一致的情況下,可能導(dǎo)致只能遷移部分列的數(shù)據(jù)或遷移失敗,請謹(jǐn)慎操作。
目標(biāo)庫對象名稱大小寫策略
您可以配置目標(biāo)實(shí)例中遷移對象的庫名、表名和列名的英文大小寫策略。默認(rèn)情況下選擇DTS默認(rèn)策略,您也可以選擇與源庫、目標(biāo)庫默認(rèn)策略保持一致。更多信息,請參見目標(biāo)庫對象名稱大小寫策略。
源庫對象
在源庫對象框中選擇待遷移對象,然后單擊將其移動至已選擇對象框。
說明遷移對象選擇的粒度為表。
已選擇對象
如需更改單個遷移對象在目標(biāo)實(shí)例中的名稱,請右擊已選擇對象中的遷移對象,設(shè)置方式,請參見庫表列名單個映射。
如需批量更改遷移對象在目標(biāo)實(shí)例中的名稱,請單擊已選擇對象方框右上方的批量編輯,設(shè)置方式,請參見庫表列名批量映射。
說明如果使用了對象名映射功能,可能會導(dǎo)致依賴這個對象的其他對象遷移失敗。
如需設(shè)置WHERE條件過濾數(shù)據(jù),請?jiān)?b data-tag="uicontrol" id="uicontrol-iew-bxl-ra4" class="uicontrol">已選擇對象中右擊待遷移的表,在彈出的對話框中設(shè)置過濾條件。設(shè)置方法請參見設(shè)置過濾條件。
如需按庫或表級別選擇遷移的SQL操作,請?jiān)?b data-tag="uicontrol" id="uicontrol-fls-c4p-xcy" class="uicontrol">已選擇對象中右擊待遷移對象,并在彈出的對話框中選擇所需遷移的SQL操作。支持的操作請參見支持增量遷移的SQL操作。
單擊下一步高級配置,進(jìn)行高級參數(shù)配置。
配置
說明
選擇調(diào)度該任務(wù)的專屬集群
DTS默認(rèn)將任務(wù)調(diào)度到共享集群上,您無需選擇。若您希望任務(wù)更加穩(wěn)定,可以購買專屬集群來運(yùn)行DTS遷移任務(wù)。更多信息,請參見什么是DTS專屬集群。
源庫、目標(biāo)庫無法連接后的重試時間
在遷移任務(wù)啟動后,若源庫或目標(biāo)庫連接失敗則DTS會報(bào)錯,并會立即進(jìn)行持續(xù)的重試連接,默認(rèn)重試720分鐘,您也可以在取值范圍(10~1440分鐘)內(nèi)自定義重試時間,建議設(shè)置30分鐘以上。如果DTS在設(shè)置的時間內(nèi)重新連接上源、目標(biāo)庫,遷移任務(wù)將自動恢復(fù)。否則,遷移任務(wù)將失敗。
說明針對同源或者同目標(biāo)的多個DTS實(shí)例,網(wǎng)絡(luò)重試時間以后創(chuàng)建任務(wù)的設(shè)置為準(zhǔn)。
由于連接重試期間,DTS將收取任務(wù)運(yùn)行費(fèi)用,建議您根據(jù)業(yè)務(wù)需要自定義重試時間,或者在源和目標(biāo)庫實(shí)例釋放后盡快釋放DTS實(shí)例。
源庫、目標(biāo)庫出現(xiàn)其他問題后的重試時間
在遷移任務(wù)啟動后,若源庫或目標(biāo)庫出現(xiàn)非連接性的其他問題(如DDL或DML執(zhí)行異常),則DTS會報(bào)錯并會立即進(jìn)行持續(xù)的重試操作,默認(rèn)持續(xù)重試時間為10分鐘,您也可以在取值范圍(1~1440分鐘)內(nèi)自定義重試時間,建議設(shè)置10分鐘以上。如果DTS在設(shè)置的重試時間內(nèi)相關(guān)操作執(zhí)行成功,遷移任務(wù)將自動恢復(fù)。否則,遷移任務(wù)將會失敗。
重要源庫、目標(biāo)庫出現(xiàn)其他問題后的重試時間的值需要小于源庫、目標(biāo)庫無法連接后的重試時間的值。
是否限制全量遷移速率
在全量遷移階段,DTS將占用源庫和目標(biāo)庫一定的讀寫資源,可能會導(dǎo)致數(shù)據(jù)庫的負(fù)載上升。您可以根據(jù)實(shí)際情況,選擇是否對全量遷移任務(wù)進(jìn)行限速設(shè)置(設(shè)置每秒查詢源庫的速率QPS、每秒全量遷移的行數(shù)RPS和每秒全量遷移的數(shù)據(jù)量(MB)BPS),以緩解目標(biāo)庫的壓力。
說明僅當(dāng)遷移類型選擇了全量遷移時才可以配置。
是否限制增量遷移速率
您也可以根據(jù)實(shí)際情況,選擇是否對增量遷移任務(wù)進(jìn)行限速設(shè)置(設(shè)置每秒增量遷移的行數(shù)RPS和每秒增量遷移的數(shù)據(jù)量(MB)BPS),以緩解目標(biāo)庫的壓力。
說明僅當(dāng)遷移類型選擇了增量遷移時才可以配置。
是否去除正反向任務(wù)的心跳表sql
根據(jù)業(yè)務(wù)需求選擇是否在DTS實(shí)例運(yùn)行時,在源庫中寫入心跳SQL信息。
是:不在源庫中寫入心跳SQL信息,DTS實(shí)例可能會顯示有延遲。
否:在源庫中寫入心跳SQL信息,可能會影響源庫的物理備份和克隆等功能。
環(huán)境標(biāo)簽
您可以根據(jù)實(shí)際情況,選擇用于標(biāo)識實(shí)例的環(huán)境標(biāo)簽。本示例無需選擇。
配置ETL功能
選擇是否配置ETL功能。關(guān)于ETL的更多信息,請參見什么是ETL。
是:配置ETL功能,并在文本框中填寫數(shù)據(jù)處理語句,詳情請參見在DTS遷移或同步任務(wù)中配置ETL。
否:不配置ETL功能。
監(jiān)控告警
是否設(shè)置告警,當(dāng)遷移失敗或延遲超過閾值后,將通知告警聯(lián)系人。
不設(shè)置:不設(shè)置告警。
設(shè)置:設(shè)置告警,您還需要設(shè)置告警閾值和告警聯(lián)系人。更多信息,請參見在配置任務(wù)過程中配置監(jiān)控告警。
保存任務(wù)并進(jìn)行預(yù)檢查。
若您需要查看調(diào)用API接口配置該實(shí)例時的參數(shù)信息,請將鼠標(biāo)光標(biāo)移動至下一步保存任務(wù)并預(yù)檢查按鈕上,然后單擊氣泡中的預(yù)覽OpenAPI參數(shù)。
若您無需查看或已完成查看API參數(shù),請單擊頁面下方的下一步保存任務(wù)并預(yù)檢查。
說明在遷移任務(wù)正式啟動之前,會先進(jìn)行預(yù)檢查。只有預(yù)檢查通過后,才能成功啟動遷移任務(wù)。
如果預(yù)檢查失敗,請單擊失敗檢查項(xiàng)后的查看詳情,并根據(jù)提示修復(fù)后重新進(jìn)行預(yù)檢查。
如果預(yù)檢查產(chǎn)生警告:
對于不可以忽略的檢查項(xiàng),請單擊失敗檢查項(xiàng)后的查看詳情,并根據(jù)提示修復(fù)后重新進(jìn)行預(yù)檢查。
對于可以忽略無需修復(fù)的檢查項(xiàng),您可以依次單擊點(diǎn)擊確認(rèn)告警詳情、確認(rèn)屏蔽、確定、重新進(jìn)行預(yù)檢查,跳過告警檢查項(xiàng)重新進(jìn)行預(yù)檢查。如果選擇屏蔽告警檢查項(xiàng),可能會導(dǎo)致數(shù)據(jù)不一致等問題,給業(yè)務(wù)帶來風(fēng)險(xiǎn)。
購買實(shí)例。
預(yù)檢查通過率顯示為100%時,單擊下一步購買。
在購買頁面,選擇數(shù)據(jù)遷移實(shí)例的鏈路規(guī)格,詳細(xì)說明請參見下表。
類別
參數(shù)
說明
信息配置
資源組配置
選擇實(shí)例所屬的資源組,默認(rèn)為default resource group。更多信息,請參見什么是資源管理。
鏈路規(guī)格
DTS為您提供了不同性能的遷移規(guī)格,遷移鏈路規(guī)格的不同會影響遷移速率,您可以根據(jù)業(yè)務(wù)場景進(jìn)行選擇。更多信息,請參見數(shù)據(jù)遷移鏈路規(guī)格說明。
配置完成后,閱讀并選中《數(shù)據(jù)傳輸(按量付費(fèi))服務(wù)條款》。
單擊購買并啟動,并在彈出的確認(rèn)對話框,單擊確定。
您可在數(shù)據(jù)遷移界面查看具體進(jìn)度。
增量日志表結(jié)構(gòu)定義說明
你需要在MaxCompute中執(zhí)行set odps.sql.allow.fullscan=true;
,設(shè)置項(xiàng)目空間屬性,允許進(jìn)行全表掃描。
DTS在將MySQL產(chǎn)生的增量數(shù)據(jù)遷移至MaxCompute的增量日志表時,除了存儲增量數(shù)據(jù)和增量日志表分區(qū),還會存儲一些如下表所示的元信息。
字段 | 說明 |
record_id | 增量日志的記錄ID,為該日志唯一標(biāo)識。 說明
|
operation_flag | 操作類型,取值:
|
utc_timestamp | 操作時間戳,即binlog的時間戳(UTC 時間)。 |
before_flag | 所有列的值是否為更新前的值,取值:Y或N。 |
after_flag | 所有列的值是否為更新后的值,取值:Y或N。 |