日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

使用正則模式采集文本日志

Logtail正則解析插件支持通過正則表達式提取日志字段,并將日志解析為鍵值對形式。本文介紹如何通過日志服務控制臺創(chuàng)建正則模式的Logtail配置采集日志。

方案概覽

假設您的原始日志為:

127.0.0.1 - - [16/Aug/2024:14:37:52 +0800] "GET /wp-admin/admin-ajax.php?action=rest-nonce HTTP/1.1" 200 41 "http://www.example.com/wp-admin/post-new.php?post_type=page" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36 Edg/127.0.0.0"

通過正則解析插件處理后效果展示:

image

其中使用的正則表達式為:

(\S+)\s-\s(\S+)\s\[([^]]+)]\s"(\w+)\s(\S+)\s([^"]+)"\s(\d+)\s(\d+)\s"([^"]+)"\s"([^"]+).*

前提條件

1. 選擇Project和Logstore

  1. 登錄日志服務控制臺

  2. 單擊控制臺右側的快速接入數(shù)據(jù)卡片。

    image

  3. 接入數(shù)據(jù)頁面,查找正則 - 文本日志并單擊。image

  4. 選擇目標Project和Logstore,日志會被采集到對應的Logstore。image

2. 機器組配置

Logtail配置會應用到指定的機器組,從而采集服務器上的數(shù)據(jù)。無論是否已有機器組,都必須根據(jù)實際需求正確選擇使用場景和安裝環(huán)境,這將影響后續(xù)的頁面配置。

3. Logtail配置

3.1 全局配置image

全局配置

配置項

說明

配置名稱

Logtail配置名稱,在其所屬Project內(nèi)必須唯一。創(chuàng)建Logtail配置成功后,無法修改其名稱。

日志主題類型

選擇日志主題(Topic)的生成方式。更多信息,請參見日志主題

  • 機器組Topic:設置為機器組的Topic屬性,用于明確區(qū)分不同機器組產(chǎn)生的日志。

  • 文件路徑提取:設置為文件路徑正則,則需要設置自定義正則,用正則表達式從路徑里提取一部分內(nèi)容作為Topic。用于區(qū)分不同源產(chǎn)生的日志。

  • 自定義:自定義日志主題。

高級參數(shù)

其它可選的與配置全局相關的高級功能參數(shù),請參見創(chuàng)建Logtail流水線配置

3.2 輸入配置

  • 文件路徑

  • 最大目錄監(jiān)控深度

image

輸入配置

配置項

說明

文件路徑

根據(jù)日志在主機(例如ECS)上的位置,設置日志目錄和文件名稱。

  • 如果目標主機是Linux系統(tǒng),則日志路徑必須以正斜線(/)開頭,例如/apsara/nuwa/**/app.Log

  • 如果目標主機是Windows系統(tǒng),則日志路徑必須以盤符開頭,例如C:\Program Files\Intel\**\*.Log

目錄名和文件名均支持完整模式和通配符模式,文件名規(guī)則請參見Wildcard matching。其中,日志路徑通配符只支持星號(*)和半角問號(?)。

日志文件查找模式為多層目錄匹配,即符合條件的指定目錄(包含所有層級的目錄)下所有符合條件的文件都會被查找到。例如:

  • /apsara/nuwa/**/*.log表示/apsara/nuwa目錄(包含該目錄的遞歸子目錄)中后綴名為.log的文件。

  • /var/logs/app_*/**/*.log表示/var/logs目錄下所有符合app_*格式的目錄(包含該目錄的遞歸子目錄)中后綴名為.log的文件。

  • /var/log/nginx/**/access*表示/var/log/nginx目錄(包含該目錄的遞歸子目錄)中以access開頭的文件。

最大目錄監(jiān)控深度

設置日志目錄被監(jiān)控的最大深度,即文件路徑中通配符**匹配的最大目錄深度。0代表只監(jiān)控本層目錄。

文件編碼

選擇日志文件的編碼格式。

首次采集大小

配置首次生效時,匹配文件的起始采集位置距離文件結尾的大小。首次采集大小設定值為1024 KB。

  • 首次采集時,如果文件小于1024 KB,則從文件內(nèi)容起始位置開始采集。

  • 首次采集時,如果文件大于1024 KB,則從距離文件末尾1024 KB的位置開始采集。

您可以通過此處修改首次采集大小,取值范圍為0~10485760,單位為KB。

采集黑名單

打開采集黑名單開關后,可進行黑名單配置,即可在采集時忽略指定的目錄或文件。支持完整匹配和通配符匹配目錄和文件名。其中,通配符只支持星號(*)和半角問號(?)。

重要
  • 如果您在配置文件路徑時使用了通配符,但又需要過濾掉其中部分路徑,則需在采集黑名單中填寫對應的完整路徑來保證黑名單配置生效。

    例如您配置文件路徑/home/admin/app*/log/*.log,但要過濾/home/admin/app1*目錄下的所有子目錄,則需選擇目錄黑名單,配置目錄為/home/admin/app1*/**。如果配置為/home/admin/app1*,黑名單不會生效。

  • 匹配黑名單過程存在計算開銷,建議黑名單條目數(shù)控制在10條內(nèi)。

  • 目錄路徑不能以正斜線(/)結尾,例如將設置路徑為/home/admin/dir1/,目錄黑名單不會生效。

支持按照文件路徑黑名單、文件黑名單、目錄黑名單設置,詳細說明如下:

文件路徑黑名單

  • 選擇文件路徑黑名單,配置路徑為/home/admin/private*.log,則表示在采集時忽略/home/admin/目錄下所有以private開頭,以.log結尾的文件。

  • 選擇文件路徑黑名單,配置路徑為/home/admin/private*/*_inner.log,則表示在采集時忽略/home/admin/目錄下以private開頭的目錄內(nèi),以_inner.log結尾的文件。例如/home/admin/private/app_inner.log文件被忽略,/home/admin/private/app.log文件被采集。

文件黑名單

選擇文件黑名單,配置文件名為app_inner.log,則表示采集時忽略所有名為app_inner.log的文件。

目錄黑名單

  • 選擇目錄黑名單,配置目錄為/home/admin/dir1,則表示在采集時忽略/home/admin/dir1目錄下的所有文件。

  • 選擇目錄黑名單,配置目錄為/home/admin/dir*,則表示在采集時忽略/home/admin/目錄下所有以dir開頭的子目錄下的文件。

  • 選擇目錄黑名單,配置目錄為/home/admin/*/dir,則表示在采集時忽略/home/admin/目錄下二級目錄名為dir的子目錄下的所有文件。例如/home/admin/a/dir目錄下的文件被忽略,/home/admin/a/b/dir目錄下的文件被采集。

允許文件多次采集

默認情況下,一個日志文件只能匹配一個Logtail配置。如果文件中的日志需要被采集多份,需要打開允許文件多次采集開關。

高級參數(shù)

其它可選的與文件輸入插件相關的高級功能參數(shù),請參見創(chuàng)建Logtail流水線配置

3.3 處理配置

  1. 日志樣例,支持多條日志;添加日志樣例可協(xié)助您配置日志處理相關參數(shù),降低配置難度,建議添加。

  2. 多行模式,如果日志為多行日志,請使用該選項。

    • 類型,選擇自定義本示例使用的行首正則表達式為:(\S+)\s-.*

    • 切分失敗處理方式,選擇保留單行

  3. 處理模式

    使用正則解析處理插件。對于多行日志,可以打開多行模式開關,然后自動生成正則表達式。

    image

  4. 單擊正則解析可進入處理插件詳細配置頁面,需要在此頁面配置正則表達式,以及根據(jù)提取的value設置key值。image

    配置說明

    參數(shù)名稱

    說明

    原始字段

    解析日志前,用于存放日志內(nèi)容的原始字段,默認值為content。

    正則表達式

    用于匹配日志的正則表達式。

    • 當您配置了日志樣例時,日志服務支持自動生成和手動輸入行首正則表達式。

      • 單擊自動生成正則表達式,然后在日志樣例文本框中,劃選需提取的日志內(nèi)容,單擊生成正則日志服務會根據(jù)您劃選的內(nèi)容,生成正則表達式。

      • 單擊手動輸入正則表達式,輸入正則表達式。配置完成后,單擊驗證即可驗證您輸入的正則表達式是否可以解析、提取目標日志內(nèi)容。更多信息,請參見如何調(diào)試正則表達式

    • 當您未配置日志樣例時,需根據(jù)實際日志輸入正則表達式。

    日志提取字段

    為提取的日志內(nèi)容(Value),設置對應的字段名(Key)。

    解析失敗時保留原始字段

    選中解析失敗時保留原始字段,則解析失敗時,將保留原始字段。

    解析成功時保留原始字段

    選中解析成功時保留原始字段,則解析成功時,將保留原始字段。

    重命名的原始字段

    選中解析失敗時保留原始字段解析成功時保留原始字段后,可重命名原始字段名,用于存放原始的日志內(nèi)容。

處理配置

配置項

說明

日志樣例

待采集日志的樣例,請務必使用實際場景的日志。日志樣例可協(xié)助您配置日志處理相關參數(shù),降低配置難度。支持添加多條樣例,總長度不超過1500個字符。

[2023-10-01T10:30:01,000] [INFO] java.lang.Exception: exception happened
    at TestPrintStackTrace.f(TestPrintStackTrace.java:3)
    at TestPrintStackTrace.g(TestPrintStackTrace.java:7)
    at TestPrintStackTrace.main(TestPrintStackTrace.java:16)

多行模式

  • 多行日志的類型:多行日志是指每條日志分布在連續(xù)的多行中,需要從日志內(nèi)容中區(qū)分出每一條日志。

    • 自定義:通過行首正則表達式區(qū)分每一條日志。

    • 多行JSON:每個JSON對象被展開為多行,例如:

      {
        "name": "John Doe",
        "age": 30,
        "address": {
          "city": "New York",
          "country": "USA"
        }
      }
  • 切分失敗處理方式:

    Exception in thread "main" java.lang.NullPointerException
        at com.example.MyClass.methodA(MyClass.java:12)
        at com.example.MyClass.methodB(MyClass.java:34)
        at com.example.MyClass.main(MyClass.java:?0)

    對于以上日志內(nèi)容,如果日志服務切分失敗:

    • 丟棄:直接丟棄這段日志。

    • 保留單行:將每行日志文本單獨保留為一條日志,保留為一共四條日志。

處理模式

處理插件組合,包括原生插件拓展插件。有關處理插件的更多信息,請參見處理插件概述

重要

處理插件的使用限制,請以控制臺頁面的提示為準。

  • 2.0版本的Logtail:

    • 原生處理插件可任意組合。

    • 原生處理插件和擴展處理插件可同時使用,但擴展處理插件只能出現(xiàn)在所有的原生處理插件之后。

  • 低于2.0版本的Logtail:

    • 不支持同時添加原生插件和擴展插件。

    • 原生插件僅可用于采集文本日志。使用原生插件時,須符合如下要求:

      • 第一個處理插件必須為正則解析插件、分隔符模式解析插件、JSON解析插件、Nginx模式解析插件、Apache模式解析插件或IIS模式解析插件。

      • 從第二個處理插件到最后一個處理插件,最多包括1個時間解析處理插件,1個過濾處理插件和多個脫敏處理插件。

    • 對于解析失敗時保留原始字段解析成功時保留原始字段參數(shù),只有以下組合有效,其余組合無效。

      • 只上傳解析成功的日志:

        image

      • 解析成功時上傳解析后的日志,解析失敗時上傳原始日志:

        image

      • 解析成功時不僅上傳解析后的日志,并且追加原始日志字段,解析失敗時上傳原始日志。

        例如,原始日志"content": "{"request_method":"GET", "request_time":"200"}"解析成功,追加原始字段是在解析后日志的基礎上再增加一個字段,字段名為重命名的原始字段(如果不填則默認為原始字段名),字段值為原始日志{"request_method":"GET", "request_time":"200"}

        image

重要

Logtail配置生效時間最長需要3分鐘,請耐心等待。

4. 查詢分析配置

日志服務默認開啟全文索引。您也可以根據(jù)采集到的日志,手動創(chuàng)建字段索引,或者單擊自動生成索引,日志服務將自動生成字段索引。更多信息,請參見創(chuàng)建索引image

5. 查詢?nèi)罩?/b>

單擊查詢?nèi)罩?/b>,系統(tǒng)將跳轉至Logstore查詢分析頁面。image

您需要等待1分鐘左右,待索引生效后,才能在原始日志頁簽中,查看已采集到的日志。查詢和分析日志的詳細步驟,請參見查詢和分析日志

說明

如果需要查詢?nèi)罩局械乃凶侄危ㄗh使用全文索引。如果只需查詢部分字段、建議使用字段索引,減少索引流量。如果需要對字段進行分析(SELECT語句),必須創(chuàng)建字段索引。

后續(xù)步驟