服務等級定義SLA(Service Level Agreement)是判定壓測是否異常的重要依據。壓測過程中,通過監控核心服務狀態的SLA指標數據,可以更直觀地了解壓測業務的狀態。
背景信息
PTS制定了一些行業通用SLA模板,您可以直接在壓測中使用。更多信息,請參見通用SLA模板。
除此之外,您也可以自定義符合業務需要的SLA規則,應用到特定的壓測場景中。具體操作,請參見配置SLA。
名詞解釋
在使用該功能時,請先了解PTS對于SLA相關名詞的說明。
SLA
服務等級定義SLA(Service Level Agreement)是判定壓測是否異常的重要依據。壓測過程中,通過監控核心服務狀態的SLA指標數據,您可以更直觀地了解壓測業務或架構的狀態。
SLA指標
SLA指標是指從哪些指標監控壓測過程數據,主要包括業務質量相關指標、ECS、RDS和SLB監控類指標。PTS將在后續迭代中逐步增加隊列、SQL連接等方面的SLA指標。
SLA規則
SLA規則是在SLA指標的基礎上,添加了判斷條件,以觸發告警或停止壓測。
SLA模板
SLA模板是SLA規則的集合,可包含一個或多個SLA規則。SLA模板與行業類型綁定。
SLA指標
SLA指標是指從哪些指標監控壓測過程數據,詳細指標說明見下表。
SLA指標類型 | SLA指標項 | SLA指標項說明 | 最小監控粒度 |
業務質量相關指標 | RT (Response Time) | 壓測中API的響應時間。 | 1秒 |
RPS (Requests per Second) | 壓測中,每秒發出的壓測請求數量。 | ||
成功率 | 壓測中API的請求成功率。 | ||
ECS基礎監控相關指標 | CPU利用率 | 即CPU使用率,指一段時間內CPU被占用的情況。 | 1分鐘 |
內存利用率 | 一段時間內內存被占用的情況。 | ||
load5 | 5分鐘內系統的平均負荷。 | ||
RDS基礎監控相關指標 | CPU利用率 | 即CPU使用率,指一段時間內CPU被占用的情況。 | 5分鐘 |
連接利用率 | 連接數是指應用程序可以連接到RDS實例的數量。連接利用率即已經使用的連接數百分率。 | ||
SLB基礎監控相關指標 | 丟棄連接數 | 端口丟棄的連接數,從IP:Port維度進行統計。 | 1分鐘 |
異常后端Server | 例如,后端異常ECS實例個數 |