配置監控告警
阿里云Milvus提供了告警設置功能,通過對重要的監控指標設置報警規則,可以實時了解實例的運行狀況,及時處理潛在風險,保障實例穩定運行。
背景信息
阿里云Milvus的監控報警是通過阿里云云監控產品實現的。通過云監控,您可以設置監控項,在觸發監控項報警規則時,通知報警聯系組中的所有聯系人。您也可以維護報警監控項對應的報警聯系人組,以便發生報警時,能及時通知到相關聯系人。更多信息,請參見什么是云監控。
前提條件
已創建Milvus實例,詳情請參見快速創建Milvus實例。
開啟一鍵告警
進入阿里云Milvus頁面。
登錄阿里云Milvus控制臺。
在左側導航欄,單擊Milvus實例。
在頂部菜單欄處,根據實際情況選擇地域。
在Milvus實例頁面,單擊實例名稱。
單擊監控告警頁簽。
單擊告警設置。
在告警設置頁面,打開一鍵告警開關。
默認規則如下表所示。
規則名稱
監控項
指標采樣周期
報警規則
SystemDefault_acs_milvus_ProcessResidentMemoryUtilization
內存使用率
60秒
連續5個周期平均值 >= 80%,則發出告警。
SystemDefault_acs_milvus_ProcessCPUUtilization
CPU使用率
60秒
連續5個周期平均值 >= 90%,則發出告警。
創建報警規則
進入告警設置頁面。
登錄阿里云Milvus控制臺。
在左側導航欄,單擊Milvus實例。
在頂部菜單欄處,根據實際情況選擇地域。
在Milvus實例頁面,單擊實例名稱。
單擊監控告警頁簽。
在告警設置頁面,單擊報警規則設置。
在報警規則頁面,單擊創建報警規則。
在創建報警規則面板,產品選擇向量檢索服務Milvus版,資源范圍選擇全部資源,設置相應的參數,單擊確認。
以創建向量檢索服務Milvus版的報警規則,詳情請參見創建報警規則。
管理報警規則
在告警設置頁面,單擊報警規則設置,跳轉到云監控的報警規則頁面,您可以對當前的報警規則執行修改、刪除和禁用等操作,詳情請參見管理報警規則。