當您需要自定義數據庫監控或者比較不同實例的運行情況時,通過監控大盤,您可以自由選擇監控的實例和指標,實現自定義指標監控、不同實例間的性能對比,以及進行多指標聯動分析,從而全面把握數據庫的健康狀況。
背景信息
數據庫自治服務DAS從2022年5月20日開始逐步為RDS SQL Server提供監控大盤功能。
新增監控大盤
查看監控大盤中目標實例的指標趨勢
登錄RDS管理控制臺。
在左側導航欄中單擊運維與監控 > 性能監測。
在性能監測頁,單擊監控大盤頁簽。
在目標數據庫引擎頁簽,選擇需要查看的監控大盤,并設置查詢時間,即可查看該時間段內監控指標的趨勢圖。
說明選擇時間范圍時,查詢結束時間需晚于查詢開始時間,且查詢開始時間和查詢結束時間的間隔不能超過七天。
通過實例篩選,您可以選擇多個實例,對比查看其監控指標。
打開自動刷新,系統將以5秒為周期,刷新監控指標趨勢圖。
打開聯動圖表,開啟多指標聯動,查看同一時間點中不同監控指標的值。
通過圖表布局,您可以設置每行顯示監控指標趨勢圖的數量。
單擊添加實例和監控指標,修改大盤中的實例或監控指標。
單擊某個監控指標趨勢圖中的詳情,放大該監控指標的趨勢圖,并且可以修改時間查看該監控指標不同時間的變化趨勢。
單擊某個監控指標趨勢圖中的刪除,在監控大盤中刪除該監控指標。
監控指標
參數類型 | 參數 | 說明 |
SQL Server服務進程 | cpu_usage | 實例CPU使用率(占操作系統總數)。 |
db_io | 每秒IO請求次數。 | |
db_io_read | 每秒讀IO請求次數。 | |
db_io_write | 每秒寫IO請求次數。 | |
other_size | 系統空間使用量。 | |
log_size | 日志空間使用量。 | |
tmp_size | 臨時空間使用量。 | |
ins_size | 實例總空間使用量。 | |
data_size | 數據空間使用量。 | |
數據庫指標 | qps | 平均每秒SQL語句執行次數。 |
connection_reset | 每秒從連接池啟動的登錄總次數。 | |
active_temp_tables | 當前活躍臨時表數。 | |
active_session | 當前活躍線程數。 | |
active_cursors | 當前活躍游標數。 | |
sessions | 當前總連接數。 | |
active_transactions | 當前活躍事務數。 | |
transactions | 平均每秒事務數。 | |
write_transactions | 平均每秒寫事務數。 | |
read_kb | 實例平均每秒鐘的輸出流量。 | |
write_kb | 實例平均每秒鐘的輸入流量。 | |
基礎監控 | cache_hit_ratio | 高速緩存命中率。 |
bufferpool | 在緩沖區高速緩存中找到而不需要從磁盤中讀取的頁的百分比。 | |
fullscans | 平均每秒全表掃描次數。 | |
autoparam_attempts_per_sec | 每秒的自動參數化嘗試次數。 | |
forced_parameterizations_per_sec | 每秒成功執行的強制參數化次數。 | |
sql_compilations | 每秒的SQL編譯次數。 | |
unsafe_autoparams_per_sec | 每秒不安全的自動參數化嘗試次數。 | |
failed_autoparams_per_sec | 每秒自動參數化嘗試失敗次數。 | |
safe_autoparams_per_sec | 每秒安全自動參數化嘗試次數。 | |
resqlcompilations | 每秒語句重新編譯的次數。 | |
lazy_writes | 每秒寫入磁盤的次數。 | |
checkpoint | 每秒檢查點寫入Page數。 | |
logout | 每秒登出次數。 | |
logins | 每秒登錄次數。 | |
locktimeout | 每秒超時的鎖請求數,包括對NOWAIT鎖的請求。 | |
deadlock | 每秒死鎖發生的次數。 | |
lock_requests_per_sec | 每秒請求的新鎖和鎖轉換次數。 | |
lockwaits | 每秒調用者等待的鎖請求數。 | |
lock_waits | 等待鎖的進程的統計信息。 | |
latchwaits | 每秒未能立即授予閂鎖請求次數。 | |
lock_wait_time_ms | 平均鎖等待時間。 | |
average_latch_wait_time | 請求閂鎖資源的平均等待時間。 | |
table_lock_escalations_per_sec | 表上的鎖升級到TABLE或HoBT粒度的次數。 | |
average_lock_wait_time | 請求鎖資源的平均等待時間。 | |
total_latch_wait_time | 鎖在最后一秒內的總等待時間。 |
監控指標含義也可以在控制臺的監控大盤中單擊每個指標后的查看。