日志服務提供的服務日志功能可記錄詳細日志、重要日志和任務運行日志,本文介紹不同日志類型的日志字段。
日志類型
開啟服務日志功能時,您可以選擇服務日志的類型,具體說明如下表所示。
為保證您自定義查詢語句的兼容性,建議您在查詢語句中通過__topic__: XXX
指定特定的日志類型。
日志類型 | 概述 | Logstore名稱 | 日志詳情 | 說明 |
詳細日志 | 包括Project內所有資源的創建、修改、更新、刪除操作日志和數據讀寫日志。 說明 不包括通過JDBC協議訪問產生的日志。 | internal-operation_log | 所有API請求和操作所涉及的詳細日志,包括控制臺、消費組、SDK等所有客戶端發送的請求。 | |
重要日志 | 包括Logstore粒度的消費組消費延時日志、Logtail相關的錯誤、心跳和統計日志。 | internal-diagnostic_log | 消費組的消費延時日志,每2分鐘上報一次。指定查詢消費組延遲日志時,需要在查詢語句中指定 | |
Logtail的錯誤日志。 每30秒記錄一次,30秒內重復出現的錯誤類型只記錄錯誤總和,錯誤Message隨機選擇一條。指定查詢Logtail告警日志時,需要在查詢語句中指定 | ||||
Logtail采集統計信息。 10分鐘記錄一次。查詢Logtail采集日志時,需要在查詢語句中指定 | ||||
Logtail定時上報的狀態日志。 每分鐘記錄一次。指定查詢Logtail狀態日志時,需要在查詢語句中指定 | ||||
任務運行日志 | 記錄指定Project內數據加工(新版)、定時SQL、數據導入、數據投遞(新版)任務的運行指標和運行日志。 | internal-diagnostic_log | 一個定時SQL實例對應一條定時SQL日志,即一個定時SQL實例運行結束后,上報一條日志。 查詢定時SQL運行日志時,需要在查詢語句中指定 | |
每分鐘上報一次日志。任務相關的數據源無數據時,不會上報。 查詢任務運行日志時,需要在查詢語句中指定 |
詳細日志
根據Method字段,詳細日志被分為讀操作、寫操作和資源操作三類日志,具體如下:
分類 | 請求方式 |
讀操作 | 產生讀操作日志的請求方式如下:
|
寫操作 | 產生寫操作日志的請求方式如下:
|
資源操作 | 產生資源操作日志的請求方式如下: CreateProject、DeleteProject等其他接口。 |
詳細日志的公共字段
字段 | 說明 | 示例 |
APIVersion | API版本。 | 0.6.0 |
AccessKeyId | 訪問日志服務時使用的訪問密鑰。 | LTA****TRx |
CallerType | 訪問用戶的類型。 | Subuser |
InvokerUid | 執行操作的阿里云賬號ID。 | 175****532 |
Latency | 請求延時,單位:微秒。 | 123279 |
LogStore | 操作的Logstore名稱。 | logstore-1 |
Method | 產生該日志的請求方式。 | GetLogStoreLogs |
NetOutFlow | 讀取的流量,單位:字節。 | 120 |
NetworkOut | 通過公網入口讀取的流量,單位:字節。 | 10 |
Project | 操作的Project名稱。 | project-1 |
RequestId | 請求ID。 | 8AEADC8B0AF2FA2592C9**** |
SourceIP | 發送請求的客戶端IP地址。 | 47.100.**.** |
Status | 請求響應的狀態碼。 | 200 |
UserAgent | 客戶端用戶代理。 | sls-java-sdk-v-0.6.1 |
讀操作詳細日志特有字段
字段 | 說明 | 示例 |
BeginTime | 請求開始時間,格式為Unix時間戳。 | 1523868463 |
DataStatus | 請求響應數據狀態。包括Complete、OK、Unknown等。 | OK |
EndTime | 請求結束時間,格式為Unix時間戳。 | 1523869363 |
Offset | GetLogs請求偏移行數。 | 20 |
Query | 原始查詢語句。 | UserAgent: [consumer-group-java]* |
RequestLines | 期望返回行數。 | 100 |
ResponseLines | 返回行數。 | 100 |
Reverse | 是否按照日志時間戳逆序返回日志。
| 0 |
TermUnit | 查詢語句經過分詞處理后包含的單詞個數。 | 0 |
Topic | 日志主題。 | topic-1 |
寫操作詳細日志特有字段
字段 | 說明 | 示例 |
InFlow | 原始寫入數據的字節數。 | 200 |
InputLines | 請求寫入的行數。 | 10 |
NetInflow | 壓縮后,寫入數據的字節數。 | 100 |
Shard | 寫入的Shard ID。 | 1 |
Topic | 日志主題。 | topic-1 |
消費組延遲日志
字段 | 說明 | 示例 |
consumer_group | 消費組名稱。 | consumer-group-1 |
fallbehind | 當前消費位置距離最新寫入日志的落后時間,單位:秒。 | 12345 |
logstore | Logstore名稱。 | logstore-1 |
project | Project名稱。 | project-1 |
shard | 消費的Shard ID。 | 1 |
Logtail告警日志
字段 | 說明 | 示例 |
alarm_count | 時間窗口內的告警次數。 | 10 |
alarm_message | 觸發告警的原始日志采樣。 | M_INFO_COL,all_status_monitor,T22380,0,2018-04-17 10:48:25.0,AY66K,AM5,2018-04-17 10:48:25.0,2018-04-17 10:48:30.561,i-23xebl5ni.1569395.715455,901,00789b |
alarm_type | 告警類型。 | REGISTER_INOTIFY_FAIL_ALARM |
logstore | Logstore名稱。 | logstore-1 |
os | 操作系統,如Linux或Windows等。 | Linux |
project | Project名稱。 | project-1 |
source_ip | Logtail所在機器的IP地址。 | 47.100.**.** |
version | Logtail版本號。 | 0.14.2 |
Logtail采集日志
Logtail采集日志可以根據file_name字段分為如下兩類。
針對單個文件的采集統計信息。
針對Logstore的統計信息,即file_name字段值為
logstore_statistics
。
字段說明如下所示:
字段 | 說明 | 示例 |
logstore | Logstore名稱。 | logstore-1 |
config_name | Logtail采集配置名稱。由 | ##1.0##project-1$logstore-1 |
error_line | 引起錯誤的原始日志。 | M_INFO_COL,all_status_monitor,T22380,0,2018-04-17 10:48:25.0,AY66K,AM5,2018-04-17 10:48:25.0,2018-04-17 10:48:30.561,i-23xebl5ni.1569395.715455,901,00789b |
file_dev | 日志文件的device ID。 說明 當 | 1?23 |
file_inode | 日志文件的inode。 說明 當 | 124 |
file_name | 日志文件的完整路徑或者值為 | /abc/file_1 |
file_size | 日志文件大小,單位:字節。 | 12345 |
history_data_failures | 歷史處理失敗次數。 | 0 |
last_read_time | 時間窗口內最近的讀取時間,Unix時間戳。 | 1525346677 |
project | Project名稱。 | project-1 |
logtail_version | Logtail版本。 | 0.14.2 |
os | 操作系統。 | Windows |
parse_failures | 時間窗口內日志解析失敗的行數。 | 12 |
read_avg_delay | 時間窗口內平均每次讀取日志數據時,當前偏移量與文件大小差值的平均值。 | 65 |
read_count | 時間窗口內日志讀取次數。 | 10 |
read_offset | 當前讀取到文件偏移位置,單位:字節。 | 12345 |
regex_match_failures | 正則表達式匹配失敗次數。 | 1 |
send_failures | 時間窗口內發送失敗的次數。 | 12 |
source_ip | Logtail所在機器的IP地址。 | 47.100.**.** |
succeed_lines | 處理成功的日志行數。 | 123 |
time_format_failures | 日志時間匹配失敗次數。 | 122 |
total_bytes | 讀取的總字節數。 | 12345 |
Logstore統計特有日志字段,只有file_name
字段值為logstore_statistics
時才存在,具體說明如下表所示。
字段 | 說明 | 示例 |
send_block_flag | 時間窗口結束時發送隊列是否阻塞。 | false |
send_discard_error | 時間窗口內因數據異常或無權限導致丟棄數據包的個數。 | 0 |
send_network_error | 時間窗口內因網絡錯誤導致發送失敗的數據包個數。 | 12 |
send_queue_size | 時間窗口結束時當前發送隊列中未發送數據包數。 | 3 |
send_quota_error | 時間窗口內因Quota超限導致發送失敗的數據包個數。 | 0 |
send_success_count | 時間窗口內發送成功的數據包個數。 | 12345 |
sender_valid_flag | 時間窗口結束時該Logstore的發送標志位是否正常。
| true |
max_send_success_time | 在時間窗口內最近一次發送數據成功的時間,為Unix時間戳。 | 1525342763 |
max_unsend_time | 在時間窗口內,發送隊列中最近一次數據包發送失敗的時間。Unix時間戳,隊列為空時該值為0。 | 1525342764 |
min_unsend_time | 在時間窗口內,發送隊列中第一次數據包發送失敗的時間。Unix時間戳,隊列為空時該值為0。 | 1525342764 |
Logtail狀態日志
字段 | 說明 | 示例 |
cpu | 進程CPU的負載。 | ?0.001333156 |
hostname | 主機名。 | abc2.**** |
instance_id | 實例ID,隨機值。 | ?05AFE618-0701-11E8-A95B-00163E025256_10.11.12.13_151745**** |
ip | 主機的IP地址。 | ?47.100.**.** |
load | 系統的平均負載。 | ?0.01 0.04 0.05 2/376 5277 |
memory | Logtail進程占用的內存大小,單位:MB。 | 12 |
detail_metric | 各項計量值,JSON格式。更多信息,請參見detail_metric。 | |
os | 操作系統。 | Linux? |
os_cpu | 系統整體的CPU使用率。 | ?0.004120005 |
os_detail | 操作系統詳細信息。 | ?2.6.32-220.23.8.tcp1.34.el6.x86_64 |
user | 用戶名。 | ?user |
user_defined_id | 用戶定義的ID。 | ?aliyun-log-id |
uuid | 機器的UUID。 | ?64F28D10-D100-492C-8FDC-0C62907F**** |
version | Logtail版本號。 | ?0.14.2 |
project | Logtail采集配置所屬的Project。 | my-project |
其中,detail_metric字段包含如下子字段。
字段 | 說明 | 示例 |
config_count | Logtail采集配置的數量。 | ?1 |
config_get_last_time | 上一次獲取Logtail采集配置的時間。 | 2021-07-20 16:19:22 |
config_update_count | Logtail啟動后,Logtail采集配置更新的次數。 | ?1 |
config_update_item_count | Logtail啟動后,Logtail采集配置項更新的總和。 | ?1 |
config_update_last_time | Logtail啟動后,Logtail采集配置最后一次更新的時間。 | 2021-07-20 16:18:42 |
env_config | 是否使用環境變量創建Logtail采集配置。 | false |
event_tps | 事件TPS。 | 1? |
last_read_event_time | 上一次獲取事件的時間。 | 2021-07-20 16:18:42 |
last_send_time | 上一次發送數據的時間。 | 2021-07-20 16:18:42 |
multi_config | 是否開啟多個Logtail采集配置采集相同的文件。 | false |
net_err_stat | 最近1分鐘、5分鐘和15分鐘內網絡發生錯誤的次數。 | 0,0,0 |
open_fd | 目前打開的文件數量。 | ?1 |
plugin_enabled | 是否使用了插件功能。
| false |
poll_modify_size | 監聽修改事件的文件數量。 | ?1 |
polling_dir_cache | 掃描的文件夾數量。 | ?1 |
polling_file_cache | 掃描的文件數量。 | ?1 |
process_bytes_ps | 每秒處理的日志量,單位:字節。 | ?1000 |
process_lines_ps | 每秒處理的日志條數。 | ?1000 |
process_queue_full | 達到最大長度限制的處理隊列個數。 | ?1 |
process_queue_total | 處理隊列數量。 | ?10 |
process_tps | 處理TPS。 | ?0 |
reader_count | 正在處理的文件數。 | ?1 |
region | Logtail所在的地域。 | ?cn-hangzhou |
register_handler | 要監控的文件夾數量。 | ?1 |
send_bytes_ps | 每秒發送的原始日志量(字節)。 | ?11111 |
send_lines_ps | 每秒發送的日志條數。 | 1000? |
send_net_bytes_ps | 每秒發送的網絡數據量(字節)。 | 1000? |
send_queue_full | 達到最大長度限制的發送隊列個數。 | ?1 |
send_queue_total | 發送隊列數量。 | ?12 |
send_request_concurrency | 發送并發上限數。 | 10 |
send_tps | 發送TPS。 | ?0.075 |
sender_invalid | 異常的發送隊列數。 | ?0 |
start_time | 啟動時間。 | 2021-07-20 16:19:22 |
used_sending_concurrency | 當前已使用的發送并發數。 | 0 |
定時SQL任務運行日志
字段 | 說明 | 示例 |
__topic__ | 日志主題,固定為scheduled_sql_alert。 | scheduled_sql_alert。 |
project | 定時SQL任務所在的Project。 | my-project-name |
job_name | 定時SQL任務名稱。 | sql-16xxxxxxx-xxxxxx |
schedule_id | 任務ID。 | 77****ca |
job_type | 定時SQL任務類型,固定為ScheduledSQL。 | ScheduledSQL |
instance_id | 定時SQL任務中實例的標識。 | 7e****dc |
create_time | 實例的創建時間,單位:秒。 | 1652343365 |
schedule_time | 實例的調度時間,單位:秒。 | 1652343360 |
trigger_time | 實例的觸發時間,單位:秒。 | 1652343365 |
status | 實例的執行結果,取值為FAILED、SUCCEEDED。 | FAILED |
error_code | 實例執行失敗時的錯誤原因。 | SQLFailed |
error_message | 實例執行失敗時的錯誤詳情。 | sql syntax error |
fallbehind | 實例的觸發時間和調度時間的間隔,用于表示實例執行的延遲情況。單位:秒。 | 85 |
succeed_lines |
| 100 |
數據加工(新版)、導入和投遞(新版)任務運行日志
字段 | 說明 | 示例 |
__topic__ | 日志主題,固定為etl_metrics。 | etl_metrics |
metric_type | 任務運行日志的類型標識,固定為ConnectorMetrics。 | ConnectorMetrics |
project | 任務所屬的Project。 | my-sls-project |
job_name | 任務名稱。 | job-16****53 |
instance_id | 任務運行的實例ID。 | 10e****b4f6 |
_etl_:connector_meta | 數據源或者目標的任務元信息。更多信息,請參見_etl_:connector_meta。 | 無 |
_etl_:connector_metrics | 數據源或者目標的任務運行指標。更多信息,請參見_etl_:connector_metrics。 | 無 |
_etl_:connector_meta字段包含如下子字段。
字段 | 說明 | 示例 |
action | 任務的操作。
| ingest |
connector | 數據源類型或者目標類型。
| oss |
instance | 數據源實例名稱或目標實例名稱。 | my-oss-bucket |
task_id | 任務ID。 | 1669277 |
task_name | 任務名稱。 | 1652765276578_task_0 |
task_type | 任務類型,固定為CONNECTOR。 | CONNECTOR |
_etl_:connector_metrics字段包含如下子字段。
字段 | 說明 | 示例 |
state | 任務運行狀態。
| 0 |
error | 任務運行的錯誤信息。 無錯誤信息時,日志中不存在該字段。 | fail to pull logs, unauthorized |
lags | 任務運行進度。 只針對數據讀取任務,即action字段值為ingest時,日志中存在lags字段。該字段值與數據源類型(connector字段)相關。
| 0.813 |
desc | 只針對數據讀取任務,即action字段值為ingest時,日志中存在desc字段。該字段值與數據源類型(connector字段)相關。
| s |
events | 時間范圍內處理的數據條目數。 | 13245 |
failed | 時間范圍內處理失敗的數據條目數。 | 3 |
native_bytes | 時間范圍內處理的數據的原始大小。 | 7539125 |
events_bytes | 時間范圍內處理的數據被解析后的大小。 | 13295475 |
pub_net_bytes | 時間范圍內處理的數據的公網流量。 | 45678 |
req_count | 時間范圍內數據源或者目標的請求次數。 | 89 |
req_count | 時間范圍內數據源或者目標的平均請求延遲。 | 38 |
rate_limit_hits | 時間范圍內數據源或者目標請求被限流次數。 | 1 |
extras | 其他相關信息。當字段值存在時,日志中才會展示該字段。 該字段值與數據源類型(connector字段)相關。 | {"events":"898","objectName":"shenzhen/2022/05/18/15/19_1652858350000000000_315eb857efeb9f00.snappy","objectSize":"212792"} |