健康檢查及自動恢復(fù)
更新時(shí)間:
本章將為您介紹托管平臺為您帶來的系統(tǒng)自動的健康檢查及恢復(fù)能力
這里通過一個(gè)case來描述平臺具備的健康檢查能力,假設(shè)我們有一個(gè)停車管理應(yīng)用,他是由3個(gè)節(jié)點(diǎn)組成(tomcat節(jié)點(diǎn)提供Web服務(wù)及業(yè)務(wù)邏輯,mysql節(jié)點(diǎn)用于存儲數(shù)據(jù),redis節(jié)點(diǎn)用于緩存數(shù)據(jù))
應(yīng)用配置的具體操作請參見應(yīng)用配置將這份應(yīng)用配置進(jìn)行部署后,平臺將會提供統(tǒng)一調(diào)度管控層(簡稱master),master將會對部署的節(jié)點(diǎn)進(jìn)行非侵入式的健康檢查。
一旦檢測到節(jié)點(diǎn)異常(往往是內(nèi)存超限、進(jìn)程異常退出等異常場景)將會進(jìn)入自動恢復(fù)過程,master會通過檢查每個(gè)work節(jié)點(diǎn)資源限制情況來動態(tài)調(diào)度恢復(fù)的目標(biāo),可能出現(xiàn)2種調(diào)度場景:1)在原work節(jié)點(diǎn)重啟 2) 跨work節(jié)點(diǎn)重啟。注:由于這種健康檢查及自動恢復(fù)能力的存在,節(jié)點(diǎn)直接寫入容器內(nèi)的磁盤會出現(xiàn)數(shù)據(jù)丟失的情況,您可以通過平臺提供的中間件或者持久化存儲能力來完成數(shù)據(jù)存儲。
文檔內(nèi)容是否對您有幫助?