為您介紹數據表詳情中“數據概況”的主要功能。
功能說明
在數據表詳情的數據概況標簽頁,基于對元數據及存儲數據的統計,為您提供了數據表更加詳細的指標信息,比如表存儲大小、表文件總數、DDL最后更新時間、數據最后更新時間、訪問次數、分區存儲大小、分區文件數、分區最后更新時間等信息。如果您開通了數據湖管理功能,還可以查詢到存儲分層分布統計和大小文件分布統計信息。
適用場景
隨著業務逐漸增大,期望能盡快分析出每個表中存儲數據大小,以便更有針對性地進行存儲優化,此時結合表存儲大小可以解決此類場景。
數據越來越多,期望對訪問頻次不高的數據進行冷歸檔,以節省存儲成本,此時結合訪問次數可以快速區分訪問頻次較低的表。
對于長時間未更新數據的表,期望盡快找到并對其進行清理或優化,此時可以結合數據最后更新時間快速定位到相關表。
指標說明
指標名稱 | 指標說明 | 指標來源說明 |
表存儲大小 | 當前表中存儲的所有數據大小 | 如托管Location給DLF,來源于對OSS數據的統計;否則來源于E-MapReduce引擎stats數據。 |
表文件總數 | 當前表中存儲的所有文件數量總和 | 如托管Location給DLF,來源于對OSS數據的統計;否則來源于E-MapReduce引擎stats數據。 |
分區數量 | 當前表中分區總數量 | 從元數據統計所得。 |
DDL最后更新時間 | 表結構DDL最后更新時間 | 來源于對OSS數據的統計,需要托管Location給DLF。 |
最后數據更新時間 | 數據的最后更新時間 | 來源于對OSS數據的統計,需要托管Location給DLF。 |
近1天文件訪問次數 | 該表昨天的訪問次數 | 來源自各計算引擎,目前僅適用于E-MapReduce引擎,適用條件:
|
近7天文件訪問次數 | 該表最近7天的訪問次數 | |
近30天文件訪問次數 | 該表最近30天的訪問次數 |
操作說明
登錄數據湖構建控制臺。
在左側菜單欄,選擇
。單擊數據表頁簽,選擇目標數據目錄和庫名,輸入搜索的表名。
單擊目標數據表的表名,進入表詳情頁。
單擊數據概況頁簽。