日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

系統(tǒng)運(yùn)維工具集SysAK使用說明

更新時(shí)間:
重要

本文中含有需要您注意的重要提示信息,忽略該信息可能對(duì)您的業(yè)務(wù)造成影響,請(qǐng)務(wù)必仔細(xì)閱讀。

SysAK(System Analyse Kit)是阿里云操作系統(tǒng)提供的一個(gè)全方位的系統(tǒng)運(yùn)維工具集,可以覆蓋系統(tǒng)的日常監(jiān)控、線上問題診斷和系統(tǒng)故障修復(fù)等常見運(yùn)維場(chǎng)景。本文為您介紹SysAK的安裝部署和使用方法。

運(yùn)維場(chǎng)景

阿里云通過對(duì)百萬服務(wù)器運(yùn)維經(jīng)驗(yàn)進(jìn)行抽象總結(jié),進(jìn)而打造出系統(tǒng)運(yùn)維工具集SysAK,該工具集可以覆蓋以下常見運(yùn)維場(chǎng)景:

  • 日常監(jiān)控:針對(duì)各種系統(tǒng)資源更精細(xì)化的資源監(jiān)控,幫助業(yè)務(wù)運(yùn)維實(shí)現(xiàn)細(xì)粒度的運(yùn)維調(diào)度和資源控制。除此之外,還實(shí)現(xiàn)了許多增強(qiáng)的系統(tǒng)指標(biāo),實(shí)時(shí)監(jiān)控系統(tǒng)的干擾和抖動(dòng)等情況。

  • 問題診斷:針對(duì)負(fù)載異常、網(wǎng)絡(luò)抖動(dòng)、內(nèi)存泄露、IO夯、性能異常等情況提供線上診斷功能。 同時(shí)減少工具的專業(yè)性,可操作性強(qiáng)。

  • 故障修復(fù):對(duì)于非整機(jī)異常的問題(例如死鎖、夯機(jī)等), 該工具提供介入能力對(duì)系統(tǒng)進(jìn)行恢復(fù)或故障隔離。

工具本身不會(huì)為系統(tǒng)帶來更大的負(fù)載開銷,避免引起網(wǎng)絡(luò)抖動(dòng)問題。SysAK通過技術(shù)手段保證所有工具同時(shí)運(yùn)行時(shí)不超過3%的系統(tǒng)消耗,單個(gè)工具不超過1%的系統(tǒng)消耗。

安裝SysAK

環(huán)境要求

  • 操作系統(tǒng):Alibaba Cloud Linux 2/3、Anolis OS 8.4 ANCK、CentOS 7及其他內(nèi)核版本大于3.10的Linux系統(tǒng)

    說明

    您可以運(yùn)行uname -a命令查看實(shí)例的內(nèi)核版本。

  • 硬件:x86_64

安裝部署

操作系統(tǒng)

安裝方法

Alibaba Cloud Linux 2

  • 通過yum源安裝

    1. 遠(yuǎn)程連接ECS實(shí)例。具體操作,請(qǐng)參見通過密碼或密鑰認(rèn)證登錄Linux實(shí)例

    2. 執(zhí)行以下命令,查看SysAK所發(fā)布的版本。

      yum search sysak
    3. 執(zhí)行以下命令,安裝SysAK,默認(rèn)下載SysAK最新版本。

      yum install sysak
  • 如果無法訪問aliyun的yum源

    1. 遠(yuǎn)程連接ECS實(shí)例。具體操作,請(qǐng)參見通過密碼或密鑰認(rèn)證登錄Linux實(shí)例

    2. 下載對(duì)應(yīng)內(nèi)核最新版本的SysAK rpm包。

      例如:

      wget https://mirrors.openanolis.cn/sysak/packages/sysak-1.3.0-2.x86_64.rpm
      說明

      您可以訪問鏡像源地址,查看對(duì)應(yīng)內(nèi)核最新版本的SysAK rpm包。

    3. 執(zhí)行以下命令,安裝SysAK。

      rpm -ivh --nodeps <SysAK rpm包安裝路徑>

      例如,使用wget命令默認(rèn)安裝在root路徑,執(zhí)行命令如下:

      rpm -ivh --nodeps sysak-1.3.0-2.x86_64.rpm

Anolis OS 8.4 ANCK

  1. 遠(yuǎn)程連接ECS實(shí)例。具體操作,請(qǐng)參見通過密碼或密鑰認(rèn)證登錄Linux實(shí)例

  2. 下載對(duì)應(yīng)內(nèi)核最新版本的SysAK rpm包。

    例如:

    wget https://mirrors.openanolis.cn/sysak/packages/sysak-1.3.0-2.x86_64.rpm
    說明

    您可以訪問sysak rpm地址,查看對(duì)應(yīng)內(nèi)核最新版本的SysAK rpm包。

  3. 執(zhí)行以下命令,安裝SysAK。

    rpm -ivh --nodeps <SysAK rpm包安裝路徑>

    例如,使用wget命令默認(rèn)安裝在root路徑,執(zhí)行命令如下:

    rpm -ivh --nodeps sysak-1.3.0-2.x86_64.rpm

CentOS 7及其他內(nèi)核版本大于3.10的Linux系統(tǒng)

僅支持開源版本自定義編譯安裝,可能存在兼容性問題。直接訪問SysAK開源地址進(jìn)行安裝。

使用SysAK

警告

SysAK系統(tǒng)在運(yùn)行診斷和監(jiān)控功能時(shí),會(huì)在內(nèi)核中hook一些函數(shù),可能會(huì)導(dǎo)致系統(tǒng)無法正常運(yùn)行。請(qǐng)您選擇合適的窗口期執(zhí)行診斷和監(jiān)控命令。

使用方法

常用命令

說明

sysak help

查看SysAK。

Usage: sysak [ cmd ] [ subcmd [ cmdargs ] ]

  • cmd:為SysAK管理工具相關(guān)命令,包括list、help。

  • subcmd:為SysAK各種工具子功能相關(guān)命令。

  • cmdargs: 各個(gè)子工具的命令參數(shù)。

sysak list -a

查看支持的所有子功能。

sysak [subcmd] -h

查看每個(gè)子功能的具體用法。

SysAK的兩種模式

SysAK目前支持監(jiān)控模式和診斷模式。監(jiān)控模式下SysAK常駐后臺(tái),為運(yùn)維人員提供系統(tǒng)的各項(xiàng)指標(biāo)。診斷模式隨用隨啟,主要用于分析系統(tǒng)現(xiàn)象根因。更多信息,請(qǐng)參見SysAK系統(tǒng)監(jiān)控功能SysAK診斷功能

SysAK系統(tǒng)監(jiān)控功能

啟動(dòng)監(jiān)控

您可以通過以下兩種方式,使用SysAK自動(dòng)監(jiān)控系統(tǒng)各項(xiàng)指標(biāo)。

  • 執(zhí)行以下命令,直接啟動(dòng)監(jiān)控。

    sysak mservice -S
  • 依次執(zhí)行以下命令,將SysAK監(jiān)控加入到系統(tǒng)常駐服務(wù)中,下次開機(jī)自啟動(dòng)。

    systemctl enable sysak
    systemctl start sysak

監(jiān)控指標(biāo)

說明

增強(qiáng)特性特指SysAK自身實(shí)現(xiàn)的特色功能(指標(biāo)項(xiàng))或者SysAK通過Alibaba Cloud Linux、Anolis OS的內(nèi)核增強(qiáng)特性實(shí)現(xiàn)的功能(指標(biāo)項(xiàng))。

  • 系統(tǒng)資源

    指標(biāo)分類

    類別說明

    具體指標(biāo)項(xiàng)

    增強(qiáng)特性

    計(jì)算資源

    CPU

    user

    用戶態(tài)CPU使用率

    sys

    系統(tǒng)態(tài)CPU使用率

    hirq

    中斷CPU使用率

    sirq

    軟中斷CPU使用率

    LOAD

    load*

    1秒、5秒、15秒負(fù)載

    內(nèi)存資源

    內(nèi)存

    free

    內(nèi)存余量

    used

    內(nèi)存使用量

    buffer

    內(nèi)存buffer使用量

    cache

    內(nèi)存cache使用量

    total

    內(nèi)存總量

    mem.util

    內(nèi)存使用率

    swap

    swpin

    swap換入的page數(shù)

    swapout

    swap換出的page數(shù)

    total

    swap的page總量

    swap.util

    swap使用率

    IO資源

    IO訪問

    rrqms

    每秒向設(shè)備發(fā)出的合并讀取請(qǐng)求數(shù)

    wrqms

    每秒向設(shè)備發(fā)出的合并寫入請(qǐng)求數(shù)

    rs

    每秒向設(shè)備發(fā)出的讀取請(qǐng)求數(shù)

    ws

    每秒向設(shè)備發(fā)出的寫入請(qǐng)求數(shù)

    rsecs

    每秒從設(shè)備讀取的扇區(qū)數(shù)

    wsecs

    每秒寫入設(shè)備的扇區(qū)數(shù)

    rqsize

    向設(shè)備發(fā)出的請(qǐng)求的平均大小

    qusize

    向設(shè)備發(fā)出的請(qǐng)求的平均隊(duì)列長(zhǎng)度

    svctm

    向設(shè)備發(fā)出的I/O請(qǐng)求的平均服務(wù)時(shí)間

    io.util

    I/O請(qǐng)求的CPU時(shí)間百分比

    磁盤空間

    bfree

    剩余數(shù)據(jù)塊數(shù)量

    bused

    已用數(shù)據(jù)塊數(shù)量

    btotl

    數(shù)據(jù)塊總量

    patition.util

    數(shù)據(jù)庫(kù)使用率

    ifree

    剩余文件節(jié)點(diǎn)數(shù)量

    itotl

    文件節(jié)點(diǎn)總量

    iutil

    文件節(jié)點(diǎn)使用率

    網(wǎng)絡(luò)資源

    網(wǎng)絡(luò)流量

    bytin

    網(wǎng)絡(luò)接收流量數(shù)Byte

    bytout

    網(wǎng)絡(luò)發(fā)出流量數(shù)Byte

    pktin

    網(wǎng)絡(luò)收包總量

    pktout

    網(wǎng)絡(luò)發(fā)包總量

    TCP

    active

    tcp主動(dòng)建連數(shù)

    pasive

    tcp被動(dòng)建連數(shù)

    iseg

    tcp收包數(shù)

    outseg

    tcp發(fā)包數(shù)

    UDP

    idgm

    udp收包數(shù)

    odgm

    udp發(fā)包數(shù)

  • 系統(tǒng)瓶頸

    指標(biāo)分類

    類別說明

    具體指標(biāo)項(xiàng)

    增強(qiáng)特性

    IO瓶頸

    讀寫延遲

    await

    IO的平均等待時(shí)間

    rawait

    IO讀的平均等待時(shí)間

    wawait

    IO寫的平均等待時(shí)間

    內(nèi)存瓶頸

    cache回收與碎片整理

    kswapd

    kswapd回收次數(shù)

    pg_kr

    異步回收page數(shù)

    pg_dr

    直接回收page數(shù)

    kcompd

    kcompactd規(guī)整次數(shù)

    dc_all

    內(nèi)存直接規(guī)整次數(shù)

    dc_fin

    內(nèi)存直接規(guī)整完成次數(shù)

    oom

    發(fā)生oom次數(shù)

    網(wǎng)絡(luò)瓶頸

    網(wǎng)絡(luò)傳輸

    pkterr

    系統(tǒng)錯(cuò)誤包數(shù)量

    pktdrp

    系統(tǒng)丟包數(shù)量

    EstReset

    ESTABLISHED狀態(tài)發(fā)生reset次數(shù)

    AtmpFail

    tcp connection嘗試失敗次數(shù)

    retran

    tcp重傳率

    noport

    udp目的端口/地址不存在次數(shù)

    idmerr

    udp無效包個(gè)數(shù)

    CPU瓶頸

    多任務(wù)并發(fā)

    cswch

    系統(tǒng)的上下文切換數(shù)

    proc

    系統(tǒng)fork次數(shù)

    就緒隊(duì)列長(zhǎng)時(shí)排隊(duì)

    rqslow.dltnum

    就緒隊(duì)列等待超過閾值的次數(shù)

    SysAK

    rqslow.dlttm

    就緒隊(duì)列等待超過閾值的總延時(shí)

    SysAK

    系統(tǒng)軟件瓶頸

    內(nèi)核臨界資源訪問

    noschd.dltnum

    CPU在sys態(tài)駐留超過閾值次數(shù)

    SysAK

    noschd.dlttm

    CPU在sys態(tài)駐留超過閾值總延時(shí)

    SysAK

  • 系統(tǒng)干擾

    指標(biāo)分類

    類別說明

    具體指標(biāo)項(xiàng)

    增強(qiáng)特性

    系統(tǒng)干擾

    長(zhǎng)時(shí)間關(guān)中斷延遲

    irqoff.dltnum

    系統(tǒng)關(guān)中斷超過閾值次數(shù)

    SysAK

    irqoff.dlttm

    系統(tǒng)關(guān)中斷超過閾值總延時(shí)

    SysAK

  • 容器場(chǎng)景(每個(gè)容器的指標(biāo))

    指標(biāo)分類

    類別說明

    具體指標(biāo)項(xiàng)

    增強(qiáng)特性

    計(jì)算資源

    CPU資源

    usr/sys/hriq/sirq

    容器用戶態(tài)/系統(tǒng)/中斷/軟中斷CPU使用率

    負(fù)載信息

    nrun

    容器中就緒狀態(tài)的任務(wù)數(shù)

    Alibaba Cloud Linux、Anolis OS

    nunint

    容器中D阻塞狀態(tài)任務(wù)數(shù)

    load*

    容器中1秒、5秒、10秒的負(fù)載情況

    內(nèi)存資源

    MEMROY資源

    total/free/used/cache/buffer

    容器中內(nèi)存的總量、剩余、使用、cache、buffer量

    內(nèi)存瓶頸

    pgfault

    容器中缺頁(yè)異常次數(shù)

    pgmajfault

    容器磁盤交換或者文件映射缺頁(yè)的次數(shù)

    mfailcnt

    容器發(fā)生內(nèi)存申請(qǐng)失敗的次數(shù)

    drgl*

    全局內(nèi)存回收的延遲時(shí)間分布

    Alibaba Cloud Linux、Anolis OS

    drml*

    容器中內(nèi)存回收延遲時(shí)間分布

    dcl*

    容器內(nèi)存壓縮的延遲時(shí)間分布

    IO資源

    IO指標(biāo)

    riops

    容器中讀IO個(gè)數(shù)

    wiops

    容器中讀寫IO個(gè)數(shù)

    rbps

    容器中的讀字節(jié)數(shù)

    wbps

    容器中的寫字節(jié)數(shù)

    rwait

    容器中讀等待時(shí)間

    Alibaba Cloud Linux、Anolis OS

    wwait

    容器中的寫等待時(shí)間

    rsrv

    容器中讀服務(wù)時(shí)間

    wsrv

    容器中寫服務(wù)時(shí)間

    rioq

    容器中讀排隊(duì)IO個(gè)數(shù)

    wioq

    容器中寫排隊(duì)IO個(gè)數(shù)

    rioqsz

    容器中讀排隊(duì)的IO字節(jié)數(shù)

    wioqsz

    容器中寫排隊(duì)的IO字節(jié)數(shù)

    rarqsz

    容器中讀IO的平均字節(jié)數(shù)

    warqsz

    容器中寫IO的平均字節(jié)數(shù)

    硬件資源

    資源瓶頸

    llcref

    容器LLC訪問次數(shù)

    llcmis

    容器LLC miss次數(shù)

    CPI

    容器CPI (cycles per instruction)

服務(wù)配置

SysAK監(jiān)控服務(wù)支持對(duì)采集的指標(biāo)項(xiàng)通過配置文件進(jìn)行配置。配置文件存放在/usr/local/sysak/sysakmon.conf路徑下,修改配置后,需要執(zhí)行systemctl restart sysak命令重啟mservice服務(wù)。

配置項(xiàng)說明:

  • server_mode http|local:監(jiān)控服務(wù)的監(jiān)控模式。HTTP模式表示以HTTP服務(wù)模式監(jiān)控;local模式是將數(shù)據(jù)存放在本地,在本地查看監(jiān)控?cái)?shù)據(jù)。

  • cron_period 60:local模式下監(jiān)控服務(wù)的采樣周期,默認(rèn)60秒;HTTP模式不涉及。

  • output_file_path:local模式下監(jiān)控服務(wù)存放日志的路徑,默認(rèn)路徑為/usr/local/sysak/log/tsar.data;HTTP模式不涉及。

  • mod_xxx on:on表示開啟該監(jiān)控項(xiàng),off表示關(guān)閉該監(jiān)控項(xiàng)。

數(shù)據(jù)查看

模式

監(jiān)控結(jié)果查看命令

說明

HTTP模式

curl http://127.0.0.1:9200/metrics/raw/

說明

請(qǐng)您根據(jù)實(shí)際情況替換為實(shí)際ECS實(shí)例的IP地址。

獲取系統(tǒng)所有的監(jiān)控信息。

curl http://127.0.0.1:9200/metrics/cgroup/raw

說明

請(qǐng)您根據(jù)實(shí)際情況替換為實(shí)際ECS實(shí)例的IP地址。

獲取cgroup資源組的監(jiān)控信息。

curl http://127.0.0.1:9200/metrics/cgroup/$cgroupid/raw

說明

請(qǐng)您根據(jù)實(shí)際情況替換為實(shí)際ECS實(shí)例的IP地址。

獲取指定資源組$cgroupid的監(jiān)控信息。

local模式

sysak mservice -l

交互式地顯示監(jiān)控信息。

SysAK診斷功能

用戶場(chǎng)景診斷

命令類別

功能

命令及說明

ossre_client

自動(dòng)掃描當(dāng)前系統(tǒng)可能存在的問題。

sysak ossre_client [ -a ] [ -p ] [ -i ]

  • -a:全系統(tǒng)掃描。

  • -p:只掃描系統(tǒng)panic事件。

  • -i:只掃描已知問題。

其他還有一些功能參數(shù)可配合ossre服務(wù)端進(jìn)行使用。

loadtask

診斷系統(tǒng)load情況,輸出load高的原因及負(fù)載貢獻(xiàn)最多的進(jìn)程。

sysak loadtask [ -m maxload ] [ -i interval ] [ -f outfile ] [ -d ] [ -s ]

  • -m:設(shè)置要監(jiān)控的load值,大于這個(gè)值時(shí)自動(dòng)開啟診斷。如果不設(shè)置,則立即對(duì)當(dāng)前系統(tǒng)進(jìn)行診斷。

  • -i:監(jiān)控load時(shí),每次掃描的間隔時(shí)長(zhǎng),單位秒。

  • -f:輸出信息的存放文件,默認(rèn)是/var/log/sysak/loadtask.log

  • -d:后臺(tái)運(yùn)行,所有大于maxload的信息都會(huì)進(jìn)行保存。

  • -s:在控制臺(tái)顯示摘要信息。

  • -g:同時(shí)生成全系統(tǒng)火焰圖。

iosdiag

io診斷工具。

sysak iosdiag [ options ] subcmd [ cmdargs ]

  • options

    • -u url:指定URL,將會(huì)通過curl命令把診斷日志文件打包上傳到該URL,不指定URL不上傳。

    • -s latency/hangdetect:停止診斷。

  • subcmd

    • latency:執(zhí)行io延遲診斷功能。

    • hangdetect:執(zhí)行io夯診斷功能。

  • cmdargs

    -h,跟在子命令之后顯示功能支持參數(shù)。

更多信息,請(qǐng)參見iosdiag功能說明

系統(tǒng)底層專項(xiàng)診斷

  • 調(diào)度

    命令類別

    功能

    命令及說明

    nosched

    檢測(cè)系統(tǒng)中內(nèi)核態(tài)長(zhǎng)時(shí)間占住CPU,導(dǎo)致CPU上的任務(wù)無法及時(shí)調(diào)度運(yùn)行的問題。

    sysak nosched [--help] [-t THRESH(ms)] [-f LOGFILE] [-s duration(s)]

    • -t THRESH:內(nèi)核不調(diào)度的門限時(shí)間,超過門限就會(huì)進(jìn)行記錄,單位ms。可選,默認(rèn)10 ms。

    • -f LOGFILE:將log記錄到指定文件。可選,默認(rèn)記錄在/var/log/sysak/nosched/nosched.log

    • -s durations:設(shè)置該程序運(yùn)行多長(zhǎng)時(shí)間,單位s。可選,默認(rèn)一直運(yùn)行。

    更多信息,請(qǐng)參見nosched功能說明

    irqoff

    檢測(cè)系統(tǒng)中長(zhǎng)時(shí)間關(guān)閉中斷的異常狀態(tài)。

    sysak irqoff [--help] [-t THRESH(ms)] [-f LOGFILE] [duration(s)]

    • -t THRESH:關(guān)中斷的門限時(shí)間,超過門限就會(huì)記錄,單位ms。可選,默認(rèn)10 ms。

    • -f LOGFILE:將log記錄到指定文件。可選,默認(rèn)記錄在/var/log/sysak/irqoff/irqoff.log

    • durations:設(shè)置該程序運(yùn)行多長(zhǎng)時(shí)間,單位s。可選,默認(rèn)一直運(yùn)行。

    更多信息,請(qǐng)參見irqoff功能說明

    runqslower

    檢測(cè)系統(tǒng)中任務(wù)調(diào)度延遲大的異常情況。

    sysak runqslower [-s SPAN] [-t TID] [-f LOGFILE] [-P] [THRESH]

    • -s SPAN:設(shè)置該程序運(yùn)行多長(zhǎng)時(shí)間,單位s。可選,默認(rèn)一直運(yùn)行。

    • THRESH:任務(wù)被搶占的門限時(shí)間,超過門限就記錄,單位ms。可選,默認(rèn)20 ms。

    • -f LOGFILE:將log記錄到指定文件。可選,默認(rèn)記錄在/var/log/sysak/runqslow/runqslow.log

    • -t TID:過濾選項(xiàng),指定被監(jiān)控的現(xiàn)場(chǎng)ID。可選,默認(rèn)監(jiān)控所有的線程。

    • -P:記錄prev任務(wù)的name和TID。可選,默認(rèn)不記錄。

    更多信息,請(qǐng)參見runqslower功能說明

  • 內(nèi)存

    命令類別

    功能

    命令及說明

    memleak

    診斷內(nèi)核內(nèi)存泄露情況,包括slab、vmalloc、buddy內(nèi)存的泄露情況,找到泄露點(diǎn)。

    sysak memleak [-t type] [-i internal] [-c]

    • -t:內(nèi)存泄露類型。

      • slab:slab分配內(nèi)存泄露檢測(cè)。

      • vmalloc:vmalloc分配內(nèi)存泄露檢測(cè)。

      • page:伙伴系統(tǒng)內(nèi)存分配泄露檢測(cè)。

    • -i:指定檢測(cè)時(shí)間,默認(rèn)300 s。

    • -c:指定此參數(shù)后,只會(huì)做快速檢測(cè),判斷內(nèi)存是否泄露,不進(jìn)行泄露點(diǎn)的診斷。

    mmaptrace

    抓取用戶態(tài)內(nèi)存泄露點(diǎn),提供用戶態(tài)內(nèi)存申請(qǐng)調(diào)用棧。

    sysak mmaptrace [ option ] [ args ]

    • -p <pid>: 監(jiān)控指定pid用戶態(tài)申請(qǐng)內(nèi)存情況。

    • -l:設(shè)置監(jiān)控malloc/mmap申請(qǐng)的大小。

    • -s:顯示申請(qǐng)內(nèi)存的用戶態(tài)調(diào)用棧。

    memgraph

    內(nèi)存大圖工具。

    sysak memgraph [ option ]

    • -g:顯示內(nèi)存使用大圖。

    • -f:顯示頁(yè)緩存詳細(xì)信息。

    • -a:顯示匿名內(nèi)存詳細(xì)信息。

    • -k:內(nèi)存泄露檢測(cè)。

    • -l:顯示系統(tǒng)線程內(nèi)存使用情況。

    • -c:顯示系統(tǒng)cgroup內(nèi)存使用情況。

  • IO

    命令類別

    功能

    命令及說明

    iofsstat

    實(shí)現(xiàn)從進(jìn)程和文件級(jí)別統(tǒng)計(jì)IO信息。

    sysak iofsstat [-h] [-T TIMEOUT] [-t TOP] [-u UTIL_THRESH] [-b BW_THRESH] [-i IOPS_THRESH] [-c CYCLE] [-d DEVICE] [-p PID] [-j] [-f]

    • -T TIMEOUT:指定命令運(yùn)行的時(shí)長(zhǎng)(secs)。

    • -t TOP:報(bào)告的top N的最大IO資源使用情況。

    • -u UTIL_THRESH:指定util-thresh作為過濾條件 ,該參數(shù)可以過濾util低于此閾值的信息。

    • -b BW_THRESH:指定BW-thresh作為過濾條件。該參數(shù)可以過濾bw低于此閾值的信息。

    • -i IOPS_THRESH:指定IOPS-thresh作為過濾條件。該參數(shù)可以過濾iops低于此閾值的信息。

    • -c CYCLE:指定刷新頻率(secs)。

    • -d DEVICE:指定監(jiān)控的disk盤名稱。

    • -p PID:指定關(guān)注的任務(wù)pid。

    • -j,--json:以json-format格式輸出。

    • -f,--fs:監(jiān)控報(bào)告指定分區(qū)的信息。

  • 網(wǎng)絡(luò)

    命令類別

    功能

    命令及說明

    pingtrace

    網(wǎng)絡(luò)延遲探測(cè)定界工具。

    sysak pingtrace [ options ]

    • -v,--version:顯示版本號(hào)。

    • -h,--help:幫助信息。

    • -s,--server:以server模式運(yùn)行。

    • -c,--client ip:以client模式運(yùn)行。

    • -C:--count UINT:探測(cè)報(bào)文數(shù)量,默認(rèn)不限。

    • -i <interval_us>:以u(píng)s為單位,報(bào)文發(fā)送間隔時(shí)間。

    • -t < UINT >:以s為單位,程序運(yùn)行時(shí)間。

    • -m,--maxdelay us:ping延時(shí)的閾值,只有超過該值的報(bào)文數(shù)據(jù)才會(huì)被記錄下來,默認(rèn)為0。

    • -b <INT=556 >:發(fā)送探測(cè)報(bào)文的大小,至少144字節(jié)。

    • --log TEXT=./pingtrace.log:日志文件名稱。

    • --logsize INT:日志文件最大占用磁盤空間。

    • --logbackup INT=3:日志文件最多備份數(shù)量。

    • --mode auto/pingpong/compact:PingTrace運(yùn)行模式。

    • -o,--output image/json/log/imagelog:PingTrace數(shù)據(jù)輸出格式。

    • -n,--namespace:探測(cè)與net namespace相關(guān)的信息。

    • --nslocal:在探測(cè)net namespace相關(guān)信息時(shí),告知PingTrace client和server運(yùn)行在同一host上,以避免獲取到冗余數(shù)據(jù)。

    • --userid UINT:在探測(cè)net namespace相關(guān)信息時(shí),為不同host指定不同userid,以幫助PingTrace識(shí)別和修正不同host上時(shí)間不同步問題。

    • --debug:打印相關(guān)debug信息,主要為libbpf信息。

    skcheck

    tcp和socket泄露檢測(cè)工具。

    sysak skcheck [ options ] [ cmdargs ]

    • -s:?jiǎn)?dòng)泄露檢測(cè)。

    • -i:設(shè)置開啟的socket閾值,默認(rèn)是2000。

    • -l:設(shè)置關(guān)閉的socket閾值,默認(rèn)是500。

  • 性能

    命令類別

    功能

    命令及說明

    numa_access

    顯示指定pid、cpu numa信息。

    sysak numa_access [ options ] [ cmdargs ]

    • -p <pid>:指定pid。

    • -c <cpu>:指定CPU。

    • -i <time>:設(shè)置顯示間隔時(shí)間。

    hw_event

    docker的硬件事件信息。

    sysak hw_event [ options ] [ cmdargs ]

    • -c <name>:指定docker的名字,默認(rèn)是所有docker。

    • -s <time>:設(shè)置運(yùn)行時(shí)間,默認(rèn)5 s。

  • 虛擬化

    命令類別

    功能

    命令及說明

    kvmexittime

    跟蹤診斷虛擬機(jī)Vmexit事件。

    sysak kvmexittime [--help] [-p PID] [-t TID] [interval]

    • -p <PID>:指定pid。

    • -t <TID>:指定tid。

    • interval:跟蹤診斷的時(shí)間。

    • --help:輸出當(dāng)前命令幫助信息。

  • Generic

    命令類別

    功能

    命令及說明

    syscall_slow

    用于系統(tǒng)調(diào)用慢的原因自動(dòng)分析應(yīng)用線程鎖競(jìng)爭(zhēng)問題。

    sysak syscall_slow [-t THRESH(ms)] [-n sys_NR] <[-c COMM] [-p tid]> [-f LOGFILE][duration(s)]

    • -t:當(dāng)系統(tǒng)調(diào)用時(shí)間超過該指定門限時(shí)就記錄,單位ms;可選,默認(rèn)10 ms。

    • -n:檢測(cè)指定的系統(tǒng)調(diào)用。可選,默認(rèn)所有系統(tǒng)調(diào)用。

    • -c/-p:只檢測(cè)指定任務(wù)名字或者線程ID,二選一。必選。

    • -f:將log記錄到指定文件。可選,默認(rèn)記錄在/var/log/sysak/syscall_slow/syscall_slow.log

    • durations:設(shè)置該程序運(yùn)行多長(zhǎng)時(shí)間,單位s。可選,默認(rèn)一直運(yùn)行。

    更多信息,請(qǐng)參見syscall_slow功能說明

    ulockcheck

    自動(dòng)分析應(yīng)用線程鎖競(jìng)爭(zhēng)問題。

    sysak ulockcheck -p <pid> | -s <thread pid>| -a | -t <0|1> | -d

    • -p:開始監(jiān)控指定進(jìn)程線程鎖競(jìng)爭(zhēng)情況。

    • -a:顯示當(dāng)前鎖owner及請(qǐng)鎖次數(shù)top 5。

    • -s:顯示監(jiān)控線程的鎖競(jìng)爭(zhēng)情況。

    • -t:開啟打印開關(guān)。如果等鎖超過100 ms,會(huì)打印線程鎖的用戶態(tài)調(diào)用棧。

    • -d:停止監(jiān)控。

    cpuirq

    輸出CPU上的中斷綁定和運(yùn)行情況。

    sysak cpuirq [-c cpu -b ] [ -t [ -i interval ] ]

    • -c:指定要查看的CPU。

    • -b:輸出指定CPU的中斷綁定信息。

    • -t:查看一定時(shí)間內(nèi)產(chǎn)生最多的中斷。

    • -i:指定時(shí)間間隔softirq。

    softirq

    統(tǒng)計(jì)系統(tǒng)軟中斷的運(yùn)行情況(數(shù)量、速率等)。

    sysak softirq [ option ] [ args ]

    • -s:指定初始數(shù)據(jù)源文件。

    • -r:輸出到指定文件。