數據傳輸服務DTS(Data Transmission Service)支持運維事件報警功能,當系統檢測到可能會導致DTS實例無法正常運行的風險時會觸發相應的運維事件,并會通過控制臺、短信、郵件或站內消息進行通知。您可以查看運維事件涉及的DTS實例信息、運維事件的時間信息、操作建議等信息,同時也可以在DTS控制臺手動修改運維事件的執行時間。
前提條件
您需要登錄消息中心,確保云數據庫故障或運維通知的通知開關處于開啟狀態并設置消息接收人(推薦設置為數據庫運維人員),否則您將無法收到相應的通知信息。
注意事項
事件等級為嚴重的運維事件需要優先關注。
DTS的運維事件通常在執行前至少1天通知您,部分運維事件需要您配合處理,請在收到相關通知后盡快登錄DTS控制臺查看操作建議并完成相應的變更操作。
建議您設定預約執行時間,讓系統在截止日期前的業務低峰期執行運維事件,并手動完成DTS建議的變更操作(操作建議),以確保DTS實例可以正常運行。否則運維事件默認會在計劃執行時間執行,可能會造成任務中斷等異常,由此造成的損失不在DTS的SLA保障范圍內。
僅事件狀態為計劃中的運維事件支持修改預約時間,且預約時間需要晚于當前時間5分鐘,并早于最晚可預約時間。
操作步驟
事件類型
事件分類 | 事件代碼 | 事件類型 | 云監控事件名稱 | 事件說明 | 處理建議 |
計劃內運維事件 | SystemMaintenance.Shift | 因底層硬件升級騰挪任務 |
| 系統檢測到DTS實例的底層軟件或硬件服務存在可能導致實例無法正常運行的風險,將會切換實例運行的機器,并提前告知您涉及的實例、執行時間、事件狀態、操作建議等信息。 | 設置預約執行時間,選擇業務低峰期自動執行運維事件。系統會在您設置的預約執行時間自動將DTS實例切換到新機器運行,避免業務在高峰期時受到影響。 重要 若運維事件提供了操作建議,請您配合處理。 |
事件等級
按照對實例正常運行的影響程度進行劃分,運維事件分為以下幾個等級:
嚴重:影響重大,需要盡快處理,否則可能導致實例無法使用。
警告:有一定影響,需要您在影響持續期間加以關注。
信息:您可以根據實際情況自行選擇是否關注。
事件狀態
DTS事件狀態 | 說明 |
計劃中 | 計劃執行運維任務,但尚未開始執行,開始執行后會進入執行中狀態。 |
執行中 | 運維任務正在執行中。 |
執行完成 | 運維任務執行成功。 |
已取消 | 系統取消執行運維任務。 |
待處理 | DTS實例運行遇到了阻塞,例如需要添加白名單、更新DTS實例中填寫的數據庫密碼。 |
執行失敗 | 運維任務執行失敗。 說明 運維任務執行失敗不代表對應的DTS實例運行失敗。 |