SLS(Simple Log Service)具備字段分析功能,專注于對text、long和double類型字段的統計分析。此功能涵蓋了字段的基本分布情況、各種統計指標以及TOP5的時間序列圖,為用戶提供了深入的數據洞察和可視化工具,便于理解和挖掘。
前提條件
已開啟對應字段的索引和統計功能。具體操作,請參見創建索引。
例如,訪問日志中存在request_method和request_time字段,可參考如下配置。
使用限制
字段分析的數據范圍,是當前查詢頁面的(滿足時間范圍和查詢條件)的全部日志。當日志數目在1億條以下時,會進行全量分析。當日志數目超過了1億條,會進行采樣分析(采樣規則是將采樣后的數據控制在1億條左右),如果要避免這種采樣,建議您可以縮小時間范圍或者增加過濾條件。
查看字段分析
登錄日志服務控制臺。
在Project列表區域,單擊目標Project。
在控制臺左側,單擊日志存儲,在日志庫列表中單擊目標Logstore。
查看字段分析。
查看單個字段的分析。
在原始日志頁簽的索引字段區域,單擊目標字段的,可以查看目標的分析情況。
字段說明
text字段詳情
基本分布情況
參數 | 說明 |
日志總行數 | 當前查詢頁面設置時間和查詢條件后統計出來的數據總行數。 |
當前列總行數 | 當前查詢條件中包含該字段所在的行統計出來的總行數。 |
缺失值總行數 | 日志總行數 - 當前列總行數。 |
缺失值占比 | 缺失值總行數/日志總行數。 |
Distinct值總數 | 使用approx_distinct函數計算該列中不重復的字段值數量。 |
Distinct值占比 | Distinct值總數/日志總行數。 |
統計指標
參數 | 說明 |
最大長度 | 該字段值所占的最大字符長度。 |
最小長度 | 該字段值所占的最小字符長度。 |
平均長度 | 該字段值的平均字符長度。 |
Top5取值時序圖
先計算出時間范圍內總數前5的取值,然后繪制這些值隨時間的變化趨勢。
單擊Top5取值時序圖最右側的,可以將該時序圖添加到儀表盤。新建儀表盤請參見創建儀表盤。
long、double字段詳情
基本分布情況
參數 | 說明 |
日志總行數 | 當前查詢頁面設置時間和查詢條件后統計出來的數據總行數。 |
當前列總行數 | 當前查詢條件中包含該字段所在的行統計出來的總行數。 |
Distinct值總數 | 使用approx_distinct函數計算該列中不重復的字段值數量。 |
Distinct值占比 | Distinct值總數/日志總行數 |
統計指標
參數 | 說明 |
最大值 | 該字段的最大值。 |
最小值 | 該字段的最小值。 |
平均值 | 該字段的平均值。 |
中位數 | 將數據正序排列后,返回位于中間位置的數據。 |
四分位數Q1 | 將數據正序排列后,返回位于25%位置的數據。 |
四分位數Q3 | 將數據正序排列后,返回位于75%位置的數據。 |
樣本標準差 | 使用stddev_samp函數計算該字段的樣本標準差。 |
總體標準差 | 使用stddev_pop函數計算該字段的總體標準差。 |
峰度 | 統計學概念,表示數據分布的集中程度。 |
偏度 | 統計學概念,表示數據的傾斜程度。 |
數值分布直方圖
將數值分布劃分為10個區間,統計其的近似直方圖。
單擊數值分布直方圖最右側的,可以將該數值分布直方圖添加到儀表盤。新建儀表盤請參見創建儀表盤。