RDS PostgreSQL提供了豐富的性能監控項,包括操作系統指標和數據庫指標,您可以通過RDS管理控制臺查看這些監控數據。
操作步驟
- 訪問RDS實例列表,在上方選擇地域,然后單擊目標實例ID。
在左側導航欄單擊監控與報警。
選擇增強監控頁簽,單擊指標管理,分別在操作系統指標頁簽和數據庫指標頁簽中選擇需要顯示的指標項,各指標項詳情,請參見參考信息。
說明增強監控頁面中最多能顯示30個指標。
您可以將已選擇顯示的指標項方案應用到當前地域的所有RDS PostgreSQL實例:
如果當前為云盤版實例,將會應用到已存在以及以后創建的RDS PostgreSQL云盤實例。
如果當前為本地盤實例,將會應用到已存在以及以后創建的RDS PostgreSQL本地盤實例。
單擊更新指標后,在增強監控頁即可看到對應的指標項監控數據。
增強監控頁面還提供了多種查詢設置,使您更方便地查看相應的監控數據。
序號
功能
說明
①
查詢時間范圍
支持按照預設的時間范圍和自定義時間范圍查詢。
預設時間范圍支持:30分鐘、1小時、2小時、6小時、1天、7天和30天。
自定義時間范圍:開始時間(YYYY-MM-DD hh:mm:ss) - 結束時間(YYYY-MM-DD hh:mm:ss)
②
聚合方式
支持按照如下聚合方式顯示指標結果。
求平均
求最大
求最小
③
布局
支持按如下分布調整顯示結果的布局。
一列
二列
三列
四列
④
時間粒度
表示顯示圖表中橫坐標的時間粒度。
時間粒度與查詢時間相關聯,對應關系如下:
查詢時間范圍小于等于1小時,時間粒度為5秒
查詢時間范圍大于1小時且小于等于2小時,時間粒度為10秒
查詢時間范圍大于2小時且小于等于6小時,時間粒度為30秒
查詢時間范圍大于6小時且小于等于12小時,時間粒度為1分鐘
查詢時間范圍大于12小時且小于等于1天, 時間粒度為2分鐘
查詢時間范圍大于1天且小于等于5天, 時間粒度為10分鐘
查詢時間范圍大于5天且小于等于15天,時間粒度為30分鐘
查詢時間范圍大于15天且小于等于30天,時間粒度為1小時
⑤
光標聯動
支持打開光標聯動開關,當光標懸浮在圖表的某一時間點時,其他圖表聯動顯示對應時間點的指標數據。
⑥
刷新
支持通過手動刷新來更新圖表數據。
參考信息
操作系統指標和數據庫指標的詳細信息如下。
指標分類 | 指標名稱 | 指標含義 | 指標單位 | 本地盤實例 | 云盤版實例 |
網絡流量 |
| 網絡輸入流量 | MB/s | ? | ?? |
| 網絡輸出流量 | MB/s | ? | ?? | |
CPU使用率 |
| sys cpu使用率,sys cpu使用量 / cpu總量 | % | ?? | ?? |
| user cpu使用率,user cpu使用量 / cpu總量 | % | ?? | ?? | |
| cpu使用率,(sys + user) cpu使用量 / cpu總量 | % | ?? | ?? | |
CPU按照進程堆疊 |
| backend cpu使用量(1cpu=100%,2cpu=200%,以次類推) | % | ?? | ?? |
| bgwriter cpu使用量(1cpu=100%,2cpu=200%,以次類推) | % | ?? | ?? | |
| checkpoint cpu使用量(1cpu=100%,2cpu=200%,以次類推) | % | ?? | ?? | |
| logger cpu使用量(1cpu=100%,2cpu=200%,以次類推) | % | ?? | ?? | |
| pgstat cpu使用量(1cpu=100%,2cpu=200%,以次類推) | % | ?? | ?? | |
| walwriter cpu使用量(1cpu=100%,2cpu=200%,以次類推) | % | ?? | ?? | |
| autovacuum cpu使用量(1cpu=100%,2cpu=200%,以次類推) | % | ?? | ?? | |
| walsender cpu使用量(1cpu=100%,2cpu=200%,以次類推) | % | ?? | ?? | |
| postmaster cpu使用量(1cpu=100%,2cpu=200%,以次類推) | % | ?? | ?? | |
內存詳情 |
| 規格內存大小 | MB | ?? | ?? |
| 內存使用量 | MB | ?? | ?? | |
| page cache內存使用量 | MB | ?? | ?? | |
| 共享內存使用量 | MB | ?? | ?? | |
| rss內存使用量 | MB | ?? | ?? | |
| 2M大頁使用量(MB) | MB | ?? | ?? | |
內存按照進程堆疊 |
| 后臺進程內存使用量 | MB | ?? | ?? |
| bgwriter進程內存使用量 | MB | ?? | ?? | |
| checkpoint進程內存使用量 | MB | ?? | ?? | |
| logger進程內存使用量 | MB | ?? | ?? | |
| pgstat進程內存使用量 | MB | ?? | ?? | |
| walwriter進程內存使用量 | MB | ?? | ?? | |
| autovacuum進程內存使用量 | MB | ?? | ?? | |
| walsender進程內存使用量 | MB | ?? | ?? | |
| postmaster進程內存使用量 | MB | ?? | ?? | |
內存使用率 |
| 內存使用率 | % | ?? | ?? |
IOPS |
| 磁盤讀寫IOPS | Counts/s | ? | ?? |
| 磁盤讀IOPS | Counts/s | ? | ?? | |
| 磁盤寫IOPS | Counts/s | ? | ?? | |
| 本地數據盤IOPS | Counts/s | ?? | ? | |
| 本地日志盤IOPS | Counts/s | ?? | ? | |
IO吞吐 |
| 磁盤讀寫吞吐量 | MB/s | ? | ?? |
| 磁盤讀吞吐量 | MB/s | ? | ?? | |
| 磁盤寫吞吐量 | MB/s | ? | ?? | |
| 本地數據盤吞吐 | MB/s | ?? | ? | |
| 本地日志盤吞吐 | MB/s | ?? | ? | |
磁盤使用率 |
| 磁盤使用率 | % | ? | ?? |
磁盤空間 |
| 磁盤已用空間 | MB | ? | ?? |
| 磁盤總空間 | MB | ? | ?? | |
| 日志文件大小(包含審計日志、錯誤日志、慢SQL日志) | MB | ?? | ?? | |
| wal文件大小 | MB | ?? | ?? | |
| 數據文件大小(不包含日志和wal) | MB | ?? | ?? |
下表中監控指標的更多解釋,請參見PostgreSQL官方文檔。
指標分類 | 指標名稱 | 指標含義 | 指標單位 | 本地盤實例 | 云盤版實例 |
連接 |
| 活躍連接數 | Counts | ?? | ?? |
| 等待連接數 | Counts | ?? | ?? | |
| 空閑連接數 | Counts | ?? | ?? | |
| 連接數 | Counts | ?? | ?? | |
| 規格連接數 | Counts | ?? | ?? | |
SQL |
| 每秒返回行數 | Tuples/s | ?? | ?? |
| 每秒讀取行數 | Tuples/s | ?? | ?? | |
| 每秒插入行數 | Tuples/s | ?? | ?? | |
| 每秒刪除行數 | Tuples/s | ?? | ?? | |
| 每秒更新行數 | Tuples/s | ?? | ?? | |
慢SQL |
| 已執行1s的SQL數 | Counts | ?? | ?? |
| 已執行3s的SQL數 | Counts | ?? | ?? | |
| 已執行5s的SQL數 | Counts | ?? | ?? | |
長事務 |
| 已執行1s的事務數 | Counts | ?? | ?? |
| 已執行3s的事務數 | Counts | ?? | ?? | |
| 已空閑1s的事務數 | Counts | ?? | ?? | |
| 已空閑3s的事務數 | Counts | ?? | ?? | |
| 已空閑5s的事務數 | Counts | ?? | ?? | |
| 已執行1s的兩階段事務 | Counts | ?? | ?? | |
| 已執行3s的兩階段事務 | Counts | ?? | ?? | |
| 已執行5s的兩階段事務 | Counts | ?? | ?? | |
臨時文件數 |
| 每秒臨時文件生成個數 | Counts/s | ?? | ?? |
臨時文件大小 |
| 每秒臨時文件數據生成大小 | Bytes/s | ?? | ?? |
數據庫最大年齡 |
| 數據庫最大年齡 | xids | ?? | ?? |
只讀同步延遲 |
| 只讀實例replay延遲時間 | s | ?? | ?? |
| 只讀實例write延遲時間 | s | ?? | ?? | |
| 只讀實例flush延遲時間 | s | ?? | ?? | |
數據庫內存分布 |
| 規格內存大小 | MB | ?? | ?? |
| shared_buffer內存使用量 說明 第一級數據緩存,增長到最高25%內存后保持不變。 | MB | ?? | ?? | |
| rss內存使用量 說明 表示PostgreSQL進程的malloc內存,與連接數量、運行的SQL相關,與
| MB | ?? | ?? | |
| 空閑內存 說明 完全空閑的內存,將會慢慢趨近于0,PostgreSQL會盡可能將空閑內存用于db.mem_size.cache,使實例內存利用率達到100%。 | MB | ?? | ?? | |
| page cache內存使用量 說明 第二級數據緩存,與
| MB | ?? | ?? | |
數據庫可用內存 |
| 數據庫可用內存 說明
| MB | ?? | ?? |
數據庫可用內存率 |
| 數據庫可用內存率 說明
| % | ?? | ?? |
SharedBuffers命中率 |
| shared_buffers命中率 | % | ?? | ?? |
SharedBuffers命中次數 |
| shared_buffers每秒命中數 | Blocks/s | ?? | ?? |
IO |
| backend進程每秒磁盤read次數(OS buffered read) | Counts/s | ?? | ?? |
| backend進程每秒磁盤write次數(OS buffered write) | Counts/s | ?? | ?? | |
| checkpoint進程每秒磁盤write次數(OS buffered write) | Counts/s | ?? | ?? | |
| bgwriter進程每秒磁盤write次數(OS buffered write) | Counts/s | ?? | ?? | |
| backend進程每秒執行磁盤fsync的次數 | Counts/s | ?? | ?? | |
Checkpoint次數 |
| 每秒內核調度的checkpoints數量 | Counts/s | ?? | ?? |
| 每秒外部請求的checkpoints數量 | Counts/s | ?? | ?? | |
事務TPS |
| 每秒寫事務提交數 | Counts/s | ?? | ?? |
| 每秒寫事務回滾數 | Counts/s | ?? | ?? | |
事務狀態 |
| 活躍狀態事務數 | Counts | ?? | ?? |
| 等待狀態事務數 | Counts | ?? | ?? | |
| idle-in-transaction狀態事務數(注意:不合理狀態,需要盡快處理) | Counts | ?? | ?? | |
膨脹點 |
| 膨脹點,最長事務已執行時間 | s | ?? | ?? |
ReplicationSlot延遲 |
| 最大ReplicationSlot wal復制延遲(注意:復制位點之后的wal需要被保留,該值較大時會導致wal堆積,需要盡快處理) | MB | ?? | ?? |
Checkpoint寫時間 |
| checkpoint進程平均每秒磁盤fsync時間 | ms/s | ?? | ?? |
| checkpoint進程平均每秒磁盤write時間(OS buffered write) | ms/s | ?? | ?? | |
PgBouncer連接 |
| 客戶端活躍連接數 說明 只有開啟連接池功能后,才可以在增強監控中查看連接池的相關監控指標。 | Counts | ? | ?? |
| 客戶端等待連接數 | Counts | ? | ?? | |
| 服務端活躍連接數 | Counts | ? | ?? | |
| 服務端空閑連接數 | Counts | ? | ?? | |
| 連接池總連接數 | Counts | ? | ?? | |
| 連接池數量 | Counts | ? | ?? |
相關API
API | 描述 |
查詢性能數據 | |
獲取增強監控指標列表 | |
變更增強監控指標項 | |
查詢實例已開啟的增強指標 |