如何處理云監(jiān)控插件進程自動退出問題?
云監(jiān)控出于對您資源的保護,當(dāng)您的資源消耗超過某個閾值時,云監(jiān)控插件進程自動退出。本文為您介紹在Windows和Linux操作系統(tǒng)中,云監(jiān)控插件進程自動退出的處理方法。
云監(jiān)控僅支持通過管理員賬號權(quán)限(Linux操作系統(tǒng)使用root用戶,Windows操作系統(tǒng)使用Administrator用戶)操作云監(jiān)控插件。使用管理員賬號具有一定風(fēng)險,如果操作不當(dāng)可能導(dǎo)致系統(tǒng)穩(wěn)定性問題或數(shù)據(jù)安全問題,請謹慎操作。
Windows
以Administrator用戶登錄云監(jiān)控插件所在服務(wù)器。
進入云監(jiān)控插件日志所在目錄C:\Program Files\Alibaba\cloudmonitor\local_data\logs,查看文件argusagent.log中的日志。
如果文件argusagent.log中的日志出現(xiàn)
exceeds the maxValue
字樣,則說明資源消耗超過閾值,例如:[WARN ]2022-12-07 23:54:55.805854 [4148] self_monitor.cpp(line:85):the agent's cpu usage(52.55%) exceeds the maxValue(50.00%)
[WARN ]2022-12-07 23:54:55.805861 [4148] self_monitor.cpp(line:109):the agent will exit, as the agent cpu-usage exceeds the maxValue 4 times
進入云監(jiān)控插件所在目錄C:\Program Files\Alibaba\cloudmonitor/local_data,修改文件agent.properties中資源限制相關(guān)參數(shù)。
請您根據(jù)實際資源占用情況設(shè)置資源限制參數(shù),以下數(shù)據(jù)僅做參考:
#內(nèi)存限制,單位為MB。 agent.resource.memory.limit=200 #打開文件數(shù)目限制。這里的數(shù)值僅供參考,需要考慮系統(tǒng)最大打開文件數(shù)。 agent.resource.fd.limit=100 #CPU限制為單核10%。 agent.resource.cpu.limit=0.1
進入云監(jiān)控插件所在目錄C:\Program Files\Alibaba\cloudmonitor,刪除文件agent.status。
雙擊stop.bat,停止云監(jiān)控插件。
雙擊start.bat,啟動云監(jiān)控插件。
Linux
以root用戶登錄云監(jiān)控插件所在服務(wù)器。
執(zhí)行以下命令,在云監(jiān)控插件日志所在目錄/usr/local/cloudmonitor/local_data/logs中,查看文件argusagent.log中的日志級別。
cd /usr/local/cloudmonitor/local_data/logs
cat argusagent.log
如果文件argusagent.log中的日志出現(xiàn)
exceeds the maxValue
字樣,則說明資源消耗超過閾值,例如:[WARN ]2022-12-07 23:54:55.805854 [4148] self_monitor.cpp(line:85):the agent's cpu usage(52.55%) exceeds the maxValue(50.00%)
[WARN ]2022-12-07 23:54:55.805861 [4148] self_monitor.cpp(line:109):the agent will exit, as the agent cpu-usage exceeds the maxValue 4 times
在云監(jiān)控插件所在目錄/usr/local/cloudmonitor/local_data中,修改文件agent.properties中資源限制相關(guān)參數(shù)。
執(zhí)行以下命令,修改目錄/usr/local/cloudmonitor/local_data中的文件agent.properties。
cd /usr/local/cloudmonitor/local_data
vi agent.properties
請您根據(jù)實際資源占用情況設(shè)置資源限制參數(shù),以下數(shù)據(jù)僅做參考:
#內(nèi)存限制,單位為MB。 agent.resource.memory.limit=200 #打開文件數(shù)目限制。這里的數(shù)值僅供參考,需要考慮系統(tǒng)最大打開文件數(shù)。 agent.resource.fd.limit=100 #CPU限制為單核10%。 agent.resource.cpu.limit=0.1
按Esc鍵,輸入:wq,再按Enter鍵,保存并退出文件agent.properties。
執(zhí)行以下命令,刪除云監(jiān)控插件所在目錄/usr/local/cloudmonitor中的文件agent.status。
rm /usr/local/cloudmonitor/agent.status
執(zhí)行以下命令,重啟云監(jiān)控插件。
./cloudmonitorCtl.sh restart