查看監(jiān)控報(bào)表
通過EMR Serverless StarRocks提供的監(jiān)控報(bào)表功能,您可以實(shí)時(shí)獲取并查看實(shí)例的運(yùn)行狀態(tài)及各項(xiàng)關(guān)鍵性能指標(biāo),從而實(shí)現(xiàn)快速問題定位。
使用限制
僅保存最近30天內(nèi)的報(bào)表數(shù)據(jù),超出此期限的數(shù)據(jù)將不再保留。
操作步驟
進(jìn)入EMR Serverless StarRocks實(shí)例列表頁面。
在左側(cè)導(dǎo)航欄,選擇
。在頂部菜單欄處,根據(jù)實(shí)際情況選擇地域。
單擊目標(biāo)實(shí)例ID。
單擊監(jiān)控告警頁簽。
在監(jiān)控報(bào)表頁簽,您可以根據(jù)資源組和時(shí)間條件進(jìn)行篩選來查看當(dāng)前的指標(biāo)。
支持以下資源組:
default_wg:查詢?nèi)蝿?wù)默認(rèn)資源組。
default_mv_wg:物化視圖默認(rèn)資源組。
查看指標(biāo)。
單擊圖表上方的圖標(biāo),可以查看當(dāng)前指標(biāo)的含義。
實(shí)例指標(biāo)
計(jì)算組指標(biāo)
監(jiān)控指標(biāo)說明
實(shí)例
概況
指標(biāo)名稱
描述
FE可用性
FE節(jié)點(diǎn)的可用性。
FE節(jié)點(diǎn)數(shù)
FE節(jié)點(diǎn)數(shù)量。
FE節(jié)點(diǎn)探測狀態(tài)
平臺通過HTTP調(diào)用探測節(jié)點(diǎn)狀態(tài),On表示探測結(jié)果正常,Off表示探測失敗。
BE/CN可用性
BE或CN節(jié)點(diǎn)的可用性。
BE/CN節(jié)點(diǎn)數(shù)
BE或CN節(jié)點(diǎn)數(shù)量。
BE/CN節(jié)點(diǎn)探測狀態(tài)
平臺通過HTTP調(diào)用探測節(jié)點(diǎn)狀態(tài),On表示探測結(jié)果正常,Off表示探測失敗。
Disk使用率(Avg)
集群所有BE節(jié)點(diǎn)數(shù)據(jù)盤的平均使用量百分比。
Compaction Score(Max)
每個(gè)FE節(jié)點(diǎn)上最高的Compaction Score。
每分鐘查詢數(shù)
FE每分鐘查詢?nèi)蝿?wù)數(shù),僅包括Select查詢?nèi)蝿?wù)。
存儲量
能夠保存的數(shù)據(jù)總量,單位為GiB。
說明僅適用于存算分離場景,數(shù)據(jù)存儲的更新延遲約為1小時(shí)。
Query
指標(biāo)名稱
描述
每分鐘查詢數(shù)
每分鐘查詢?nèi)蝿?wù)數(shù)量。
每分鐘查詢數(shù)(資源組)
按資源組統(tǒng)計(jì)的每分鐘查詢?nèi)蝿?wù)數(shù)量。
查詢延遲
0.99分位的查詢延遲。
查詢延遲(資源組)
按資源組統(tǒng)計(jì)的0.99分位的查詢延遲。
每分鐘查詢錯(cuò)誤數(shù)
每分鐘出現(xiàn)的查詢錯(cuò)誤數(shù)。
FE
指標(biāo)名稱
描述
FE CPU使用率
FE CPU的當(dāng)前使用率。
FE CPU Load 1min
最近1分鐘內(nèi)CPU負(fù)載的平均值。
FE MEM使用率
FE內(nèi)存的當(dāng)前使用率。
FE MEM可用量
FE可用的內(nèi)存容量。
FE連接數(shù)
每個(gè)FE的當(dāng)前連接數(shù)。
FE事務(wù)狀態(tài)統(tǒng)計(jì)
FE每分鐘事務(wù)狀態(tài)統(tǒng)計(jì)。
物化視圖
指標(biāo)名稱
描述
MV狀態(tài)
物化視圖的狀態(tài)。有效值為0(active)和 1(inactive)。
刷新作業(yè)運(yùn)行時(shí)間P99
執(zhí)行成功的物化視圖刷新作業(yè)的持續(xù)時(shí)間。
刷新作業(yè)總數(shù)
物化視圖刷新作業(yè)的總數(shù)。
刷新作業(yè)Success
執(zhí)行成功的物化視圖刷新作業(yè)的數(shù)量。
刷新作業(yè)Failed
執(zhí)行失敗的物化視圖刷新作業(yè)的數(shù)量。
刷新作業(yè)Empty
因刷新數(shù)據(jù)為空而取消的物化視圖刷新作業(yè)的數(shù)量。
刷新作業(yè)Running
物化視圖當(dāng)前正在執(zhí)行的刷新作業(yè)數(shù)量。
刷新作業(yè)Pending
物化視圖當(dāng)前等待執(zhí)行的刷新作業(yè)數(shù)量。
MV改寫次數(shù)
物化視圖改寫查詢的次數(shù)(不包括直接針對物化視圖的查詢)。
MV查詢次數(shù)
物化視圖改寫查詢的次數(shù),包括直接查詢與查詢改寫。
庫表信息
指標(biāo)名稱
描述
庫表數(shù)量分布
實(shí)例各數(shù)據(jù)庫的表數(shù)量分布情況。
Table數(shù)量
實(shí)例的表數(shù)量。
Tablet數(shù)量
實(shí)例的Tablet數(shù)量。
Table掃描數(shù)據(jù)量
非系統(tǒng)表的掃描的總字節(jié)數(shù)。
Table導(dǎo)入數(shù)據(jù)量
非系統(tǒng)表的導(dǎo)入的總字節(jié)數(shù)。
其他
指標(biāo)名稱
描述
【遷移工具】表遷移進(jìn)度
僅適用于遷移集群場景。
計(jì)算組
概況
指標(biāo)名稱
描述
CPU使用率(Avg)
所有BE或CN節(jié)點(diǎn)的平均CPU使用率。
Mem使用率(Avg)
所有BE或CN節(jié)點(diǎn)的平均內(nèi)存使用率。
Disk使用率(Max)
所有BE或CN節(jié)點(diǎn)的多塊數(shù)據(jù)盤的最大使用率。
Compaction Score(Max)
所有節(jié)點(diǎn)的最大Compaction Score,反映當(dāng)前Compaction壓力。
節(jié)點(diǎn)探測狀態(tài)
平臺通過HTTP調(diào)用探測節(jié)點(diǎn)狀態(tài),On表示探測結(jié)果正常,Off表示探測失敗。
Compaction
指標(biāo)名稱
描述
每分鐘Compaction數(shù)據(jù)量
Base Compaction和Cumulative Compaction中合并的總字節(jié)數(shù)。
每分鐘Compaction Rowset數(shù)量
Base Compaction和Cumulative Compaction中合并的Rowset的總數(shù)。
Compaction Score最大值
所有FE節(jié)點(diǎn)上最大的Compaction Score。
Compaction Mem占用量
Compaction使用的內(nèi)存。
BE
指標(biāo)名稱
描述
CPU使用率
CPU使用率。
BE CPU Load 1min
最近1分鐘內(nèi)CPU負(fù)載的平均值。
查詢掃描數(shù)據(jù)量
處理查詢時(shí)讀取字節(jié)數(shù)。
查詢掃描行數(shù)
處理查詢時(shí)讀取行數(shù)。
各類請求統(tǒng)計(jì)
各種請求的總數(shù),包括CREATE TABLE、Publish Version和Tablet Clone等。
失敗請求統(tǒng)計(jì)
BE各種請求失敗的數(shù)量,包括CREATE TABLE、Publish Version和Tablet Clone等。
事務(wù)階段統(tǒng)計(jì)
每分鐘事務(wù)階段統(tǒng)計(jì)。
BE Mem
指標(biāo)名稱
描述
Mem使用率
Mem的使用率。
Process Mem
每個(gè)BE進(jìn)程使用的內(nèi)存。
Mem剩余量
Mem剩余量。
指定節(jié)點(diǎn)Mem餅圖
展示的內(nèi)存項(xiàng)是進(jìn)程內(nèi)存的子集,僅用來粗略觀察各項(xiàng)占比。
指定節(jié)點(diǎn)Mem堆疊圖
BE Disk
指標(biāo)名稱
描述
總使用占比
磁盤中Avail、Cache、Data、Other文件的總使用占比,其中Other包括:Trash、Expired Data等類別。
總使用量
磁盤中Avail、Cache、Data、Other文件的總使用量,其中Other包括:Trash、Expired Data等類別。
指定節(jié)點(diǎn)使用量
指定節(jié)點(diǎn)的各項(xiàng)磁盤空間使用量。
剩余空間
磁盤剩余可用容量。
剩余空間百分比
磁盤剩余可用容量百分比。
使用量(Data)
磁盤中Data文件占用存儲空間情況。
使用率(Data)
磁盤中Data文件占用存儲空間百分比情況。
使用量(Cache)
磁盤中Cache文件占用存儲空間情況。
使用率(Cache)
磁盤中Cache文件占用存儲空間百分比情況。
使用量(Other)
磁盤中Other文件占用的存儲空間情況,其中Other包括:Trash、Expired Data等類別。
使用率(Other)
磁盤中Other文件占用的存儲空間百分比情況,其中Other包括:Trash、Expired Data等類別。
讀流量 (SUM)
所有磁盤每秒讀取流量。
讀IOPS (SUM)
所有磁盤每秒讀取次數(shù)。
讀延遲 (AVG)
所有磁盤平均讀延遲。
寫流量 (SUM)
所有磁盤每秒寫入流量。
寫IOPS (SUM)
所有磁盤每秒寫入次數(shù)。
寫延遲 (AVG)
所有磁盤平均寫入延遲。
BE Net
指標(biāo)名稱
描述
網(wǎng)絡(luò)接收速率
網(wǎng)絡(luò)接收速率。
網(wǎng)絡(luò)發(fā)送速率
網(wǎng)絡(luò)發(fā)送速率。
TCP連接數(shù)
TCP連接數(shù)。
Cache
指標(biāo)名稱
描述
FSLIB Cache命中率
每分鐘的緩存命中率。
FSLIB Cache命中次數(shù)
每分鐘的緩存命中次數(shù)。
全托管存儲
說明以下指標(biāo)僅適用于存算分離全托管存儲場景。
指標(biāo)名稱
描述
存儲量趨勢
全托管數(shù)據(jù)存儲量,單位為GiB。
讀寫流量
全托管存儲讀寫流量。
資源組
指標(biāo)名稱
描述
資源組CPU使用核數(shù)v3.1.x
當(dāng)前資源組正在使用的CPU核數(shù),該值為一個(gè)估計(jì)值。統(tǒng)計(jì)的是兩次獲取Metric時(shí)間間隔內(nèi)的平均值。該指標(biāo)自v3.1.4起支持。
資源組CPU使用占比v2.x
當(dāng)前資源組CPU使用時(shí)間占總CPU時(shí)間的百分比。
資源組Mem使用量
當(dāng)前資源組使用的內(nèi)存。
資源組Running任務(wù)數(shù)
當(dāng)前資源組Running狀態(tài)的查詢?nèi)蝿?wù)數(shù)量。
資源組觸發(fā)并發(fā)限制次數(shù)
當(dāng)前資源組觸發(fā)并發(fā)限制的查詢數(shù)量。
資源組觸發(fā)大查詢限制次數(shù)
當(dāng)前資源組觸發(fā)大查詢限制次數(shù)。
資源組查詢延遲
當(dāng)前資源組查詢?nèi)蝿?wù)0.99分位延遲以及平均延遲時(shí)間。
資源組每分鐘查詢數(shù)
當(dāng)前資源組每分鐘接收的查詢?nèi)蝿?wù)數(shù)。