云數據庫ClickHouse社區兼容版集群的運維事件(例如小版本升級、網絡升級等)除了通過短信、語音、郵件或站內信通知之外,還會在控制臺進行通知。您可以在計劃內事件中,查看具體的集群ID、事件類型、地域、事件原因和業務影響等,也可以手動修改計劃切換時間。
注意事項
云數據庫的待處理事件(如版本升級、網絡升級等)通常至少在執行前的3天通知您,通知方式為短信、語音、郵件、站內信或控制臺等。緊急風險修復類事件由于需要盡快修復,通常會在執行前的3天或更短的時間內發送通知并修復。
為了確保您及時能收到相應的事件通知消息,請確認云數據庫故障或運維通知的通知開關處于開啟狀態并設置了消息接收人(建議設置為數據庫運維人員)。您可以登錄消息中心查看通知開關和設置消息接收人。
操作步驟
在頁面左上角,選擇目標地域。
在左側導航欄,單擊事件管理。
說明強制要求預約時間的運維事件會彈窗提醒,請盡快完成預約。
在計劃內事件頁面,可以查看事件的詳細信息。
例如目標實例ID、地域、事件類型、事件原因、業務影響、計劃切換時間和運行狀態等信息。關于事件的產生原因及對業務的影響,請參見事件的原因與影響。
可選:修改切換時間。
除了系統默認切換時間以外,您可以修改計劃切換時間或配置周期切換時間。系統將按照計劃切換時間 > 周期切換時間 > 系統默認切換時間的優先級執行切換。
切換時間方式及說明
操作步驟
計劃切換時間
可以根據實際需要,提前或推遲目標事件的計劃切換時間。
在計劃內事件列表中,選擇目標事件(一個或多個)。
單擊計劃內事件列表左下方的計劃時間配置。
在計劃時間配置面板,設置計劃切換時間。
若您需要立即執行切換,請選中設置最早執行時間,確定后集群將立即開始執行切換準備,若此時已準備完成,將立即切換。
說明計劃切換時間不能晚于最晚操作時間。
確認需要進行切換的任務是否正確。
是:單擊確定保存。
否:在計劃內事件列表中,選中正確的目標事件,然后重新設置計劃切換時間。
周期切換時間
設置周期切換時間后,會在指定周期切換時間點時,對計劃內所有未執行且未設置計劃切換時間的事件執行切換。
例如設置周期切換時間為周二 00:00:00,計劃內的多個集群將在相同時間執行切換,降低因切換帶來的影響。
單擊計劃內事件列表左上方的周期時間配置。
在周期時間配置面板,您可以根據業務需要按周或月兩個維度設置周期切換時間。
說明您可以在計劃內事件列表右上方查看設置的周期切換時間。如果您設置的周期時間為無,則不展示。
單擊確定保存。
可選:取消切換計劃。
在計劃內事件列表中,選擇目標事件(一個或多個)。
單擊頁面左下方的取消計劃配置。
在取消計劃配置面板,仔細閱讀操作取消風險。
單擊確定。
事件的原因與影響
為了規避已知的內核問題,提升您使用集群的體驗,建議您定期升級集群內核的小版本。小版本升級事件的具體原因,請參見版本發布記錄。
事件原因 | 影響類型 | 影響說明 |
小版本升級(ZooKeeper) |
| 進入計劃切換時間后,整個升級過程大約2~3分鐘。建議您在業務低峰期進行升級,并保證業務有重試機制。具體影響如下: 升級過程中因ZooKeeper節點無法工作,在集群中針對分布式表、ReplicatedMergeTree引擎表的讀寫操作會無法正常進行(包括查詢、插入以及已經創建的通過Kafka引擎同步分布式表等操作)。 |
小版本升級(社區兼容版ClickHouse) |
| 進入計劃切換時間后,整個升級過程大約需要5到8分鐘,具體時間和集群的庫表數量以及數據量有較大關系,庫表數量和數據量較大時,耗時會更久。建議您在業務低峰期進行升級,并保證業務有重試機制。具體影響如下:
|
小版本升級(企業版ClickHouse) | 集群閃斷 | 進入計劃切換時間后,整個升級過程大約需要10到15分鐘,具體時間和集群的庫表數量以及數據量有較大關系,庫表數量和數據量較大時,耗時會更久。建議您在業務低峰期進行升級,并保證業務有重試機制。具體影響如下: 升級過程中會針對Keeper、ClickHouse計算節點進行分批重啟升級,過程中會涉及到請求路由在不同節點中切換的現象,因此集群會有秒級閃斷。 |
網絡升級 | 集群閃斷 | 進入計劃切換時間后,整個升級過程大約1~2分鐘(其中業務影響為秒級)。建議您在業務低峰期進行升級,并保證業務有重試機制。具體影響如下: 升級過程中集群會自動進行網絡模式的切換,可能導致當前已建立的數據庫連接斷開,重新嘗試即可恢復連接。 |