CDN節(jié)點(diǎn)運(yùn)維下線說(shuō)明
問(wèn)題場(chǎng)景
阿里云CDN產(chǎn)品在全球擁有3200+節(jié)點(diǎn),覆蓋70多個(gè)國(guó)家和地區(qū),為了確保這數(shù)量龐大的CDN節(jié)點(diǎn)能夠正常運(yùn)行,以及提供更好的加速服務(wù),阿里云CDN的工程師團(tuán)隊(duì)需要不定期對(duì)部分CDN節(jié)點(diǎn)進(jìn)行運(yùn)維操作,例如:硬件設(shè)備升級(jí)、軟件版本更新、網(wǎng)絡(luò)割接、線路切換等,運(yùn)維操作期間通常會(huì)下線節(jié)點(diǎn)。雖然阿里云CDN會(huì)采取多種措施來(lái)降低節(jié)點(diǎn)下線對(duì)用戶的影響,但是由于本地運(yùn)營(yíng)商以及客戶端均存在DNS緩存,因而部分客戶端可能仍然會(huì)訪問(wèn)到已下線節(jié)點(diǎn),導(dǎo)致訪問(wèn)失敗的現(xiàn)象。
問(wèn)題影響與阿里云的優(yōu)化措施
阿里云CDN產(chǎn)品在全球擁有3200+節(jié)點(diǎn),日常的節(jié)點(diǎn)運(yùn)維操作是一種正常的維護(hù)升級(jí)行為(符合CDN 服務(wù)等級(jí)協(xié)議中的服務(wù)可用性承諾),為了盡可能減少節(jié)點(diǎn)運(yùn)維操作對(duì)客戶端正常訪問(wèn)的影響,阿里云CDN的工程師做了許多的優(yōu)化措施,包括但不限于以下這些:
節(jié)點(diǎn)運(yùn)維并發(fā)數(shù)量:同一時(shí)間進(jìn)行運(yùn)維操作的節(jié)點(diǎn)數(shù)量會(huì)控制在一個(gè)非常小的量級(jí),以盡可能縮小下線節(jié)點(diǎn)潛在的客戶影響面。
節(jié)點(diǎn)運(yùn)維時(shí)間:節(jié)點(diǎn)運(yùn)維操作通常會(huì)避開業(yè)務(wù)高峰時(shí)間段(業(yè)務(wù)高峰時(shí)間段通常在夜間19:00~23:00),大多數(shù)的運(yùn)維操作是在凌晨業(yè)務(wù)低谷時(shí)間段進(jìn)行。
節(jié)點(diǎn)流量調(diào)度:阿里云CDN節(jié)點(diǎn)的運(yùn)維操作有一套規(guī)范的處理流程,對(duì)于需要運(yùn)維的節(jié)點(diǎn),阿里云CDN的調(diào)度系統(tǒng)會(huì)在下線節(jié)點(diǎn)之前把流量調(diào)度到周邊正常運(yùn)行的節(jié)點(diǎn)上。
異常情況監(jiān)測(cè):阿里云CDN節(jié)點(diǎn)也可能會(huì)因?yàn)橐恍┥倭康漠惓G闆r(例如:運(yùn)營(yíng)商線路故障、數(shù)據(jù)中心機(jī)房故障等)而出現(xiàn)計(jì)劃外的下線。對(duì)于這一類問(wèn)題,阿里云CDN產(chǎn)品的調(diào)度系統(tǒng)提供了對(duì)所有節(jié)點(diǎn)的探測(cè)監(jiān)控,一旦發(fā)現(xiàn)節(jié)點(diǎn)異常下線,會(huì)實(shí)時(shí)把對(duì)應(yīng)節(jié)點(diǎn)上的流量調(diào)度到周邊正常運(yùn)行的節(jié)點(diǎn)上。
用戶側(cè)優(yōu)化措施
雖然阿里云CDN采取了多種措施來(lái)降低節(jié)點(diǎn)下線對(duì)用戶的影響,但是由于本地運(yùn)營(yíng)商以及客戶端均存在DNS緩存,因而部分客戶端可能仍然會(huì)訪問(wèn)到已下線節(jié)點(diǎn),導(dǎo)致訪問(wèn)失敗的現(xiàn)象,針對(duì)這一問(wèn)題,用戶側(cè)可以采取以下優(yōu)化措施來(lái)進(jìn)一步降低影響:
優(yōu)化方式 | 詳細(xì)說(shuō)明 |
清理本地運(yùn)營(yíng)商DNS緩存 | 阿里云解析DNS產(chǎn)品聯(lián)合中國(guó)電信推出了“中國(guó)電信DNS緩存刷新”服務(wù),該服務(wù)可以在電信運(yùn)營(yíng)商DNS端即時(shí)的清除本地緩存信息,并獲取最新的解析結(jié)果,從而實(shí)現(xiàn)電信運(yùn)營(yíng)商側(cè)的解析快速生效,具體請(qǐng)參見中國(guó)電信DNS緩存刷新。 |
DNS聯(lián)動(dòng)刷新 | 阿里云解析DNS為了減少解析生效時(shí)間,與阿里云公共DNS配合,發(fā)布了聯(lián)動(dòng)刷新功能,能夠?qū)⒔馕錾r(shí)間顯著減少到5秒以內(nèi),具體請(qǐng)參見DNS聯(lián)動(dòng)刷新功能介紹。 |
清理客戶端DNS緩存 |
|
使用HTTPDNS技術(shù) | 您需要在客戶端上集成HTTPDNS技術(shù),采用HTTPDNS這項(xiàng)技術(shù)可以使客戶端繞開運(yùn)營(yíng)商的本地DNS,直接采用HTTP協(xié)議去訪問(wèn)阿里云CDN的調(diào)度系統(tǒng),請(qǐng)求待訪問(wèn)域名的最優(yōu)接入節(jié)點(diǎn),這樣可以規(guī)避運(yùn)營(yíng)商本地DNS緩存所帶來(lái)的節(jié)點(diǎn)切換時(shí)延問(wèn)題。 |