當某個主機的云監控插件的狀態為已停止時,云監控將不能對該主機進行監控。您需要判斷該主機的云監控插件的停止原因,并恢復其運行狀態。
問題分析
云監控插件默認每3分鐘一次心跳。如果15分鐘沒有心跳,則主機判斷插件已停止運行。云監控插件自動停止的可能原因如下:
云監控插件所在主機無法與云監控服務器通信。
處理方法,請參見配置網絡。
云監控插件進程已退出。
處理方法,請參見如何處理云監控插件進程自動退出問題。
排除以上兩種情況后,如果云監控插件仍沒有心跳,您可以參考以下方案處理。
重新安裝或升級云監控插件
查看插件的運行狀態和日志
您可以通過查看云監控插件的運行狀態和日志來判斷停止原因。如果出現云監控插件進程已退出的情況,則可能是云監控自身缺陷導致,建議您直接提工單,并保留問題。
查看插件日志
Windows
以Administrator用戶登錄待安裝云監控插件的主機。
進入云監控插件日志所在目錄C:\Program Files\Alibaba\cloudmonitor\local_data\logs。
選中日志文件argusagent.log或argusagentd.log,通過記事本或寫字板打開。
argusagentd.log:云監控插件運行時為了守護進程而記錄的日志。日志主要包括監控進程的啟動、停止等信息。
argusagent.log:云監控插件的運行日志。
Linux
以root用戶登錄待安裝云監控插件的主機。
執行以下命令,查看云監控插件日志。
cd /usr/local/cloudmonitor/local_data/logs
cat argusagent.log
cat argusagentd.log
argusagentd.log:云監控插件運行時為了守護進程而記錄的日志。日志主要包括監控進程的啟動、停止等信息。
argusagent.log:云監插件的運行日志。
查看插件運行狀態
Windows
以Administrator用戶登錄云監控插件所在主機。
打開服務頁面。
通過鍵盤快捷鍵Win+R打開運行對話框,輸入命令services.msc,單擊確定。
查看服務argusagent service的狀態。
Linux
以root用戶登錄云監控插件所在主機。
執行以下命令,查看云監控插件狀態。
ps aux | grep argusagent | grep -v grep