日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

Flume消費

日志服務支持通過aliyun-log-flume插件與Flume進行對接,實現日志數據的寫入和消費。

背景信息

aliyun-log-flume是一個實現日志服務與Flume對接的插件,與Flume對接后,日志服務可以通過Flume與其它數據系統如HDFS、Kafka等對接。aliyun-log-flume提供Sink和Source實現日志服務與Flume的對接。

  • Sink:Flume讀取其他數據源的數據然后寫入日志服務。

  • Source:Flume消費日志服務的日志數據然后寫入其他系統。

更多信息,請參見aliyun-log-flume

操作步驟

  1. 下載并安裝Flume。

    更多信息,請參見Flume

  2. 下載aliyun-log-flume插件,并將插件存放于***/flume/lib目錄下。

    更多信息,請參見aliyun-log-flume-1.3.jar

  3. ***/flume/conf目錄下,創建配置文件flumejob.conf。

    • Sink配置及示例請參見Sink

    • Source配置及示例請參見Source

  4. 啟動Flume。

Sink

通過Sink將其他數據源的數據通過Flume寫入日志服務。目前支持兩種解析格式:

  • SIMPLE:將整個Flume Event作為一個字段寫入日志服務。

  • DELIMITED:將整個Flume Event作為被分隔符分隔的數據,根據配置的列名解析成對應的字段寫入日志服務。

Sink的配置如下:

參數

是否必須

說明

type

默認配置為com.aliyun.Loghub.flume.sink.LoghubSink。

endpoint

Project的服務入口,例如http://cn-qingdao.log.aliyuncs.com。請根據實際情況替換服務入口。更多信息,請參見服務接入點

project

Project名稱。

logstore

Logstore名稱。

accessKeyId

阿里云AccessKey ID,用于標識用戶。為保證賬號安全,建議您使用RAM用戶的AccessKey。如何獲取AccessKey,請參見訪問密鑰

accessKey

阿里云AccessKey Secret,用于驗證用戶的密鑰。為保證賬號安全,建議您使用RAM用戶的AccessKey。如何獲取AccessKey,請參見訪問密鑰

batchSize

每批次寫入日志服務的數據條數。默認為1000條。

maxBufferSize

緩存隊列的大小。默認為1000條。

serializer

Event序列化格式。支持的模式如下:

  • DELIMITED:設置解析格式為分隔符模式。

  • SIMPLE:設置解析格式為單行模式。默認為該模式。

  • JSON:設置解析格式為JSON模式。

  • 自定義serializer:設置解析格式為自定義的序列化模式,設置為該模式時需要填寫完整列名稱。

columns

serializerDELIMITED時,必須指定該字段列表,用半角逗號(,)分隔,順序與實際數據中的字段順序一致。

separatorChar

serializerDELIMITED時,用于指定數據的分隔符,必須為單個字符。默認為英文逗號(,)。

quoteChar

serializerDELIMITED時,用于指定引用符。默認為半角雙引號(")。

escapeChar

serializerDELIMITED時,用于指定轉義字符。默認為半角雙引號(")。

useRecordTime

用于設置是否使用數據中的timestamp字段作為日志時間。默認為false表示使用當前時間。

Sink配置示例請參見GitHub

Source

通過Source將日志服務的日志數據通過Flume投遞到其他的數據源。目前支持兩種輸出格式。

  • DELIMITED:數據以分隔符日志的形式寫入Flume。

  • JSON:數據以JSON日志的形式寫入Flume。

Source配置如下:

參數

是否必須

說明

type

默認配置為com.aliyun.Loghub.flume.source.LoghubSource。

endpoint

Project的服務入口,例如http://cn-qingdao.log.aliyuncs.com。請根據實際情況替換服務入口。更多信息,請參見服務接入點

project

Project名稱。

logstore

Logstore名稱。

accessKeyId

阿里云AccessKey ID,用于標識用戶。為保證賬號安全,建議您使用RAM用戶的AccessKey。如何獲取AccessKey,請參見訪問密鑰

accessKey

阿里云AccessKey Secret,用于驗證用戶的密鑰。為保證賬號安全,建議您使用RAM用戶的AccessKey。如何獲取AccessKey,請參見訪問密鑰

heartbeatIntervalMs

客戶端和日志服務的心跳間隔,默認為30000毫秒。

fetchIntervalMs

數據拉取間隔,默認為100毫秒。

fetchInOrder

是否按順序消費。默認為false。

batchSize

每批次讀取的數據條數,默認為100條。

consumerGroup

讀取的消費組名稱。

initialPosition

讀取數據的起點位置,支持beginendtimestamp。默認為begin

說明

如果服務端已經存在Checkpoint,會優先使用服務端的Checkpoint。

timestamp

initialPositiontimestamp時,必須指定時間戳,為Unix時間戳格式。

deserializer

Event反序列化格式,支持的模式如下:

  • DELIMITED:設置解析格式為分隔符模式。默認為該模式。

  • JSON:設置解析格式為JSON模式。

  • 自定義deserializer:設置解析格式為自定義的反序列化模式,設置為該模式時需要填寫完整列名稱。

columns

deserializerDELIMITED時,必須指定字段列表,用半角逗號(,)分隔,順序與實際數據中的字段順序一致。

separatorChar

deserializerDELIMITED時,用于指定數據的分隔符,必須為單個字符。默認為英文逗號(,)。

quoteChar

deserializerDELIMITED時,用于指定引用符。默認為半角雙引號(")。

escapeChar

deserializerDELIMITED時,用于指定轉義字符。默認為半角雙引號(")。

appendTimestamp

deserializerDELIMITED時,用于設置是否將時間戳作為一個字段自動添加到每行末尾。默認為false。

sourceAsField

deserializerJSON時,用于設置是否將日志Source作為一個字段,字段名稱為__source__。默認為false。

tagAsField

deserializerJSON時,用于設置是否將日志Tag作為字段,字段名稱為__tag__:{tag名稱}。默認為false。

timeAsField

deserializerJSON時,用于設置是否將日志時間作為一個字段,字段名稱為__time__。默認為false。

useRecordTime

用于設置是否使用日志的時間,如果為false則使用當前時間。默認為false。

Source配置示例請參見GitHub