進(jìn)程監(jiān)控
云監(jiān)控通過安裝在阿里云主機(jī)(ECS實(shí)例)和非阿里云主機(jī)上的云監(jiān)控插件,為您采集最近一段時(shí)間內(nèi)活躍進(jìn)程的CPU使用率、內(nèi)存使用率和文件打開數(shù)。您還可以添加進(jìn)程監(jiān)控,查看其進(jìn)程數(shù),并為這些進(jìn)程設(shè)置報(bào)警規(guī)則,及時(shí)關(guān)注進(jìn)程數(shù)的變化,確保其正常運(yùn)行。
前提條件
請(qǐng)確保您已為阿里云主機(jī)(ECS實(shí)例)和非阿里云主機(jī)安裝云監(jiān)控插件。具體操作,請(qǐng)參見安裝云監(jiān)控插件。
背景信息
云監(jiān)控每分鐘統(tǒng)計(jì)一次CPU消耗Top5的進(jìn)程,記錄這些進(jìn)程的CPU使用率、內(nèi)存使用率和打開文件數(shù)。
進(jìn)程的CPU使用率與內(nèi)存使用率。
您可以參考Linux中的top命令理解這兩個(gè)監(jiān)控項(xiàng)的含義。
進(jìn)程的打開文件數(shù)。
您可以參考Linux中的lsof命令理解這個(gè)監(jiān)控項(xiàng)的含義。
云監(jiān)控采集CPU消耗Top5進(jìn)程的CPU使用率,可能存在以下問題:
如果您的進(jìn)程占用多個(gè)CPU,則會(huì)出現(xiàn)CPU使用率超過100%的情況,因?yàn)椴杉Y(jié)果為多核CPU的總使用率。
如果您查詢的時(shí)間范圍內(nèi),CPU消耗Top5的進(jìn)程不固定,進(jìn)程列表會(huì)顯示該時(shí)間范圍內(nèi)全部進(jìn)入過Top5的進(jìn)程,列表中的時(shí)間表示該進(jìn)程最后一次進(jìn)入Top5的時(shí)間。
云監(jiān)控只采集CPU消耗Top5進(jìn)程的CPU使用率、內(nèi)存使用率和打開文件數(shù)。如果進(jìn)程在查詢的時(shí)間范圍內(nèi)未持續(xù)進(jìn)入Top5,則監(jiān)控圖表中會(huì)出現(xiàn)數(shù)據(jù)點(diǎn)不連續(xù)的情況,數(shù)據(jù)點(diǎn)的密集程度表明了該進(jìn)程在主機(jī)上的活躍程度。示例如下:
Wrapper進(jìn)程未持續(xù)進(jìn)入主機(jī)CPU消耗Top5,監(jiān)控圖表中的數(shù)據(jù)點(diǎn)稀疏,且不連續(xù),表示有數(shù)據(jù)點(diǎn)的時(shí)間該進(jìn)程進(jìn)入Top5。
Java進(jìn)程在監(jiān)控圖表中的數(shù)據(jù)點(diǎn)非常密集,且連續(xù),表示該進(jìn)程已持續(xù)進(jìn)入CPU消耗Top5。
添加進(jìn)程監(jiān)控
您可以通過監(jiān)控主機(jī)的進(jìn)程數(shù),采集關(guān)鍵進(jìn)程的數(shù)量,及時(shí)獲取關(guān)鍵進(jìn)程的存活狀態(tài)。
假設(shè)您的主機(jī)運(yùn)行了如下進(jìn)程:
/usr/bin/java -Xmx2300m -Xms2300m org.apache.catalina.startup.Bootstrap
/usr/bin/ruby
nginx -c /etc/nginx/nginx.conf
您添加了6個(gè)進(jìn)程關(guān)鍵字,采集結(jié)果如下:
進(jìn)程關(guān)鍵字為
ruby
,采集進(jìn)程數(shù)為1,命中進(jìn)程名稱。進(jìn)程關(guān)鍵字為
nginx
,采集進(jìn)程數(shù)為1,命中進(jìn)程名稱與參數(shù)。進(jìn)程關(guān)鍵字為
/usr/bin
,采集進(jìn)程數(shù)為2,命中路徑(2個(gè)進(jìn)程包含該路徑)。進(jìn)程關(guān)鍵字為
apache.catalina
,采集進(jìn)程數(shù)為1,命中部分參數(shù)。進(jìn)程關(guān)鍵字為
nginx.conf
,采集進(jìn)程數(shù)為1,命中部分參數(shù)。進(jìn)程關(guān)鍵字為
-c
,采集進(jìn)程數(shù)為1,命中部分參數(shù)。
在左側(cè)導(dǎo)航欄,選擇
。在主機(jī)監(jiān)控頁面,單擊目標(biāo)主機(jī)的實(shí)例名稱鏈接,或單擊目標(biāo)主機(jī)對(duì)應(yīng)操作列的監(jiān)控圖表。
單擊進(jìn)程監(jiān)控頁簽。
先單擊進(jìn)程數(shù)監(jiān)控區(qū)域,然后單擊右上角的添加進(jìn)程監(jiān)控。
在添加進(jìn)程監(jiān)控面板,先輸入進(jìn)程名稱,再單擊增加,然后單擊右上角的圖標(biāo)。
說明添加進(jìn)程監(jiān)控后,請(qǐng)您稍等幾分鐘,才能看到進(jìn)程數(shù)的監(jiān)控?cái)?shù)據(jù)。
為進(jìn)程設(shè)置報(bào)警規(guī)則
您添加進(jìn)程后,可以為該進(jìn)程設(shè)置報(bào)警規(guī)則。當(dāng)進(jìn)程數(shù)發(fā)生變化時(shí),您可以收到報(bào)警通知。
在左側(cè)導(dǎo)航欄,選擇
。在主機(jī)監(jiān)控頁面,單擊目標(biāo)主機(jī)的實(shí)例名稱鏈接,或單擊目標(biāo)主機(jī)對(duì)應(yīng)操作列的監(jiān)控圖表。
單擊進(jìn)程監(jiān)控頁簽。
先單擊進(jìn)程數(shù)監(jiān)控區(qū)域,然后單擊右上角的圖標(biāo)。
在設(shè)置規(guī)則描述面板,先設(shè)置規(guī)則名稱,再設(shè)置進(jìn)程監(jiān)控指標(biāo)(Agent)process.count_processname的閾值和報(bào)警級(jí)別,然后單擊確定。
在創(chuàng)建報(bào)警規(guī)則面板,先設(shè)置報(bào)警規(guī)則的相關(guān)參數(shù),再單擊確認(rèn)。
關(guān)于如何設(shè)置報(bào)警規(guī)則中的相關(guān)參數(shù),請(qǐng)參見創(chuàng)建報(bào)警規(guī)則。
查看進(jìn)程報(bào)警規(guī)則。
在左側(cè)導(dǎo)航欄,選擇
。在報(bào)警規(guī)則頁面,您可以查看報(bào)警規(guī)則列進(jìn)程維度的報(bào)警規(guī)則。
刪除進(jìn)程監(jiān)控
通過應(yīng)用分組菜單的組進(jìn)程監(jiān)控添加的進(jìn)程,只能在組進(jìn)程監(jiān)控中刪除。
在左側(cè)導(dǎo)航欄,選擇
。在主機(jī)監(jiān)控頁面,單擊目標(biāo)主機(jī)的實(shí)例名稱鏈接,或單擊目標(biāo)主機(jī)對(duì)應(yīng)操作列的監(jiān)控圖表。
單擊進(jìn)程監(jiān)控頁簽。
先單擊進(jìn)程數(shù)監(jiān)控區(qū)域,然后單擊右上角的添加進(jìn)程監(jiān)控。
在添加進(jìn)程監(jiān)控面板,單擊目標(biāo)進(jìn)程對(duì)應(yīng)操作列的刪除。
在刪除確認(rèn)對(duì)話框,單擊確定。
單擊右上角的圖標(biāo)。