最佳實(shí)踐
存儲(chǔ)服務(wù)數(shù)據(jù)容災(zāi)最佳實(shí)踐
冗余存儲(chǔ)
阿里云對(duì)象存儲(chǔ)OSS提供本地冗余存儲(chǔ)和同城冗余存儲(chǔ)兩種存儲(chǔ)冗余類型,覆蓋從單可用區(qū)到多可用區(qū)的數(shù)據(jù)冗余機(jī)制,以保證數(shù)據(jù)的持久性和可用性。其中本地冗余存儲(chǔ)采用單可用區(qū)(AZ)內(nèi)的數(shù)據(jù)冗余存儲(chǔ)機(jī)制,將用戶的數(shù)據(jù)冗余存儲(chǔ)在同一個(gè)可用區(qū)內(nèi)多個(gè)設(shè)施的多個(gè)設(shè)備上,本地冗余存儲(chǔ)能確保硬件失效時(shí)的數(shù)據(jù)持久性和可用性。同城冗余存儲(chǔ)采用多可用區(qū)(AZ)內(nèi)的數(shù)據(jù)冗余存儲(chǔ)機(jī)制,將用戶的數(shù)據(jù)冗余存儲(chǔ)在同一地域(Region)的多個(gè)可用區(qū)。當(dāng)某個(gè)可用區(qū)不可用時(shí),同城冗余存儲(chǔ)仍然能夠保障數(shù)據(jù)的正常訪問。
跨區(qū)域復(fù)制
阿里云對(duì)象存儲(chǔ)OSS產(chǎn)品跨區(qū)域復(fù)制(Cross-Region Replication)功能是跨不同OSS數(shù)據(jù)中心(地域)的存儲(chǔ)空間(Bucket)自動(dòng)、異步(近實(shí)時(shí))復(fù)制文件(Object),將Object的創(chuàng)建、更新和刪除等操作從源存儲(chǔ)空間復(fù)制到不同區(qū)域的目標(biāo)存儲(chǔ)空間,實(shí)現(xiàn)跨區(qū)域容災(zāi)。如果用戶對(duì)數(shù)據(jù)的安全性和可用性有極高的要求,對(duì)所有寫入的數(shù)據(jù),都希望在另一個(gè)數(shù)據(jù)中心顯式地維護(hù)一份副本,以備發(fā)生特大災(zāi)難(如地震、海嘯等)導(dǎo)致一個(gè)OSS數(shù)據(jù)中心損毀時(shí),還能啟用另一個(gè)OSS數(shù)據(jù)中心的備份數(shù)據(jù)。 塊存儲(chǔ)云盤具備基于塊存儲(chǔ)數(shù)據(jù)異步復(fù)制能力實(shí)現(xiàn)跨地域或者跨可用區(qū)數(shù)據(jù)保護(hù)的功能。該功能可以將某一塊云盤的數(shù)據(jù),異步復(fù)制到其他地域或者同地域其他可用區(qū)內(nèi)的另一塊云盤中,實(shí)現(xiàn)存儲(chǔ)數(shù)據(jù)的容災(zāi)備份。用戶可以通過該功能建立關(guān)鍵業(yè)務(wù)的容災(zāi)能力,保護(hù)數(shù)據(jù)庫數(shù)據(jù)的同時(shí)提升業(yè)務(wù)的連續(xù)性。
版本控制
版本控制是針對(duì)存儲(chǔ)空間(Bucket)級(jí)別的數(shù)據(jù)保護(hù)功能。開啟版本控制后,針對(duì)數(shù)據(jù)的覆蓋和刪除操作將會(huì)以歷史版本的形式保存下來。用戶在錯(cuò)誤覆蓋或者刪除對(duì)象(Object)后,能夠?qū)ucket中存儲(chǔ)的Object恢復(fù)至任意時(shí)刻的歷史版本。當(dāng)用戶刪除OSS數(shù)據(jù)后想要找回時(shí),可使用版本控制功能,恢復(fù)已刪除的數(shù)據(jù)。
定時(shí)備份
對(duì)象存儲(chǔ)OSS數(shù)據(jù)可以使用OSS的定時(shí)備份功能將存儲(chǔ)空間(Bucket)內(nèi)的文件(Object)定期備份到云備份(Cloud Backup)中,當(dāng)用戶的Object意外丟失時(shí),可通過云備份進(jìn)行恢復(fù)。文件存儲(chǔ)NAS支持與云備份(Cloud Backup)無縫銜接,云備份在備份通用型NAS時(shí)不進(jìn)行文件系統(tǒng)快照,而是基于高效的文件系統(tǒng)掃描機(jī)制。通過配置備份策略生成多個(gè)備份副本數(shù)據(jù),可以在發(fā)生數(shù)據(jù)丟失或受損時(shí)及時(shí)恢復(fù)文件。
一致性復(fù)制數(shù)據(jù)校驗(yàn)
塊存儲(chǔ)云盤一致性復(fù)制組能夠?qū)崿F(xiàn)業(yè)務(wù)系統(tǒng)跨多塊云盤的容災(zāi)場(chǎng)景下,對(duì)多塊云盤的異步復(fù)制做統(tǒng)一管理和操作,同時(shí)可以確保同一復(fù)制組內(nèi)的多塊云盤數(shù)據(jù)能夠恢復(fù)到同一個(gè)時(shí)間點(diǎn),以便實(shí)現(xiàn)容災(zāi)場(chǎng)景下實(shí)例級(jí)別或者多實(shí)例級(jí)別的容災(zāi)保護(hù)。
數(shù)據(jù)庫容災(zāi)最佳實(shí)踐
數(shù)據(jù)庫備份
阿里云數(shù)據(jù)庫具備數(shù)據(jù)庫的備份恢復(fù)能力,除了小部分海量數(shù)據(jù)產(chǎn)品需要手工開啟備份恢復(fù)功能外(如ClickHouse、Lindorm),其余常見數(shù)據(jù)庫產(chǎn)品已默認(rèn)開啟數(shù)據(jù)庫的自動(dòng)備份,在數(shù)據(jù)庫進(jìn)行備份后,可利用現(xiàn)有備份集恢復(fù)數(shù)據(jù)庫實(shí)例的數(shù)據(jù)至相同的地域可用區(qū),或者異地恢復(fù)至其他地域的可用區(qū)。另外阿里云還提供單獨(dú)的數(shù)據(jù)庫備份DBS產(chǎn)品能力,可精細(xì)化管理制定數(shù)據(jù)庫的備份和恢復(fù)策略,滿足數(shù)據(jù)庫容災(zāi)的基本能力要求。
云盤冗余
阿里云云盤版本數(shù)據(jù)庫底層存儲(chǔ)利用了阿里云云盤的存儲(chǔ)能力,通過多副本冗余確保數(shù)據(jù)可靠性,同時(shí)高可用版本的數(shù)據(jù)庫還具備主備節(jié)點(diǎn)的冗余能力。
同城容災(zāi)
除適用于測(cè)試環(huán)境的單節(jié)點(diǎn)基礎(chǔ)版數(shù)據(jù)庫實(shí)例外,阿里云數(shù)據(jù)庫產(chǎn)品具備主備的高可用能力,主備之間通過數(shù)據(jù)復(fù)制實(shí)現(xiàn)實(shí)時(shí)的數(shù)據(jù)同步,后臺(tái)管控通過準(zhǔn)實(shí)時(shí)的節(jié)點(diǎn)探測(cè)及時(shí)發(fā)現(xiàn)節(jié)點(diǎn)異常,并根據(jù)探測(cè)到的異常主動(dòng)觸發(fā)主備高可用切換。用戶可選擇對(duì)應(yīng)產(chǎn)品的多可用區(qū)部署方式實(shí)現(xiàn)數(shù)據(jù)庫產(chǎn)品的同城容災(zāi)能力。
異地容災(zāi)和全球多活
異地容災(zāi)的基礎(chǔ)能力可以通過數(shù)據(jù)庫備份異地恢復(fù)的方式實(shí)現(xiàn),但其時(shí)效性較差,目前遠(yuǎn)距離傳輸?shù)某杀疽呀?jīng)低到足以支持大數(shù)據(jù)量的數(shù)據(jù)實(shí)時(shí)傳輸,所以目前異地容災(zāi)的實(shí)現(xiàn)以實(shí)時(shí)傳輸為主。阿里云數(shù)據(jù)傳輸DTS的數(shù)據(jù)同步產(chǎn)品可以支持主流的關(guān)系型數(shù)據(jù)庫的實(shí)時(shí)同步(如阿里云RDS、PolarDB產(chǎn)品),利用阿里云更低時(shí)延的內(nèi)網(wǎng)高效傳輸實(shí)現(xiàn)不同地域之間的穩(wěn)定數(shù)據(jù)庫容災(zāi)能力,部分產(chǎn)品原生支持雙向數(shù)據(jù)同步功能,結(jié)合業(yè)務(wù)的多寫設(shè)計(jì)可實(shí)現(xiàn)異地容災(zāi)的雙寫或多寫,實(shí)現(xiàn)更低成本的容災(zāi)建設(shè)。數(shù)據(jù)同步產(chǎn)品另外還支持Redis、MongoDB、PolarDB-X等產(chǎn)品,數(shù)據(jù)遷移產(chǎn)品支持更多的其他產(chǎn)品,如DB2、Teradata、HBase等。
此外,PolarDB產(chǎn)品的全球數(shù)據(jù)庫網(wǎng)絡(luò)GDN通過同一國家內(nèi)多個(gè)不同地域的多個(gè)集群,原生實(shí)現(xiàn)了所有集群的數(shù)據(jù)同步,通過GDN可提供異地容災(zāi)能力。
閃回查詢
除了數(shù)據(jù)實(shí)時(shí)同步的容災(zāi)場(chǎng)景外,容災(zāi)建設(shè)中還需要考慮數(shù)據(jù)被誤刪除等人為因素導(dǎo)致的異常處理,傳統(tǒng)方式下往往只能通過備份恢復(fù)到異常操作前進(jìn)行檢查處理,阿里云PolarDB具備閃回查詢能力,可通過開啟閃回查詢,在異常操作后基于時(shí)間點(diǎn)的閃回查詢快速定位異常,并將誤刪的數(shù)據(jù)快速恢復(fù),大大提高故障恢復(fù)效率。