您可以使用Kafka Producer SDK、Beats系列軟件、Collectd、Fluentd、Logstash、Telegraf、Vector等采集工具采集日志,并通過Kafka協議上傳到日志服務。本文介紹通過采集工具采集到日志后,利用Kafka協議上傳日志到日志服務的操作步驟。
相關限制
支持的Kafka協議版本最低為2.1.0。
為保證日志傳輸安全性,必須使用SASL_SSL連接協議。
權限說明
以下兩個權限規則滿足其中之一即可。
自定義權限策略
創建一個自定義權限策略,其中在腳本編輯頁簽,請使用以下腳本替換配置框中的原有內容。具體操作,請參見創建自定義權限策略。
說明腳本中的
Project名稱
請根據實際情況替換。{ "Version": "1", "Statement": [ { "Action": "log:GetProject", "Resource": "acs:log:*:*:project/project名稱", "Effect": "Allow" }, { "Action": [ "log:GetLogStore", "log:ListShards", "log:PostLogStoreLogs" ], "Resource": "acs:log:*:*:project/project名稱/logstore/*", "Effect": "Allow" } ] }
為RAM用戶添加創建的自定義權限策略。具體操作,請參見為RAM用戶授權。
配置方式
使用Kafka協議上傳日志時,您需要配置以下參數。
配置名 | 配置值 | 說明 | 示例 |
SLS_KAFKA_ENDPOINT | 初始連接的集群地址,格式為 |
| aliyun-project-test為Project名稱,
|
SLS_PROJECT | Project名稱 | 日志服務對應的Project名稱。 | aliyun-project-test |
SLS_LOGSTORE | Logstore名稱 | 日志服務對應的Logstore名稱。Logstore名稱后綴加上 | 例如Logstore名稱是
|
SLS_PASSWORD | 具備sls寫入權限的AccessKeySecret。 | AK的概念和創建步驟,請參見創建AccessKey。 值為AccessKey ID和AliyunKey Secret用
| LTaI5xxxxxxxxxxxxindexp2#CZO8XXXXXXXXXXpKSG 說明
|
如果您要通過Kafka消費組實時消費日志服務的數據,請提交工單咨詢阿里云技術支持工程師。
示例一:通過Beats系列軟件上傳日志
Beats系列軟件(MetricBeat、PacketBeat、Winlogbeat、Auditbeat、Filebeat、Heartbeat等)采集到日志后,支持通過Kafka協議將日志上傳到日志服務。更多信息,請參見Beats-Kafka-Output。
配置示例
示例中用到的
SLS_
開頭的參數配置請參見配置方式。output.kafka: # initial brokers for reading cluster metadata hosts: ["SLS_KAFKA_ENDPOINT"] username: "SLS_PROJECT" password: "SLS_PASSWORD" ssl.certificate_authorities: # message topic selection + partitioning topic: 'SLS_LOGSTORE' partition.round_robin: reachable_only: false required_acks: 1 compression: gzip max_message_bytes: 1000000
示例二:通過Collectd上傳日志
Collectd是一個守護(daemon)進程,用于定期采集系統和應用程序的性能指標,并支持通過Kafka協議上傳到日志服務。更多信息,請參見Write Kafka Plugin。
將Collectd采集到日志上傳到日志服務時,還需安裝Kafka插件以及相關依賴。例如:在linux Centos中,可以使用yum安裝Kafka插件,命令為sudo yum install collectd-write_kafka
,安裝RPM請參見Collectd-write_kafka。
配置示例
示例中將日志輸出格式(Format)設置為JSON,除此之外,還支持Command、Graphite類型。更多信息,請參見Collectd配置文檔。
示例中用到的
SLS_
開頭的參數配置請參見配置方式。
LoadPlugin write_kafka <Plugin write_kafka> Property "metadata.broker.list" "SLS_KAFKA_ENDPOINT" Property "security.protocol" "sasl_ssl" Property "sasl.mechanism" "PLAIN" Property "sasl.username" "SLS_PROJECT" Property "sasl.password" "SLS_PASSWORD" Property "broker.address.family" "v4" <Topic "SLS_LOGSTORE"> Format JSON Key "content" </Topic> </Plugin>
示例三:使用Telegraf上傳日志
Telegraf是由Go語言編寫的代理程序,內存占用小,用于收集、處理、匯總數據指標。Telegraf具有豐富的插件及集成功能,可從其運行的系統中獲取各種指標、從第三方API中獲取指標以及通過statsd和Kafka消費者服務監聽指標。
將Telegraf采集到的日志通過Kafka協議上傳到日志服務前,您需要先修改配置文件。
配置示例
示例中將日志輸出格式(Format)設置為JSON,除此之外還支持Graphite、Carbon2等類型。更多信息,請參見Telegraf輸出格式。
說明Telegraf必須配置一個合法的tls_ca路徑,使用服務器自帶的根證書的路徑即可。Linux環境中,根證書CA路徑一般為/etc/ssl/certs/ca-bundle.crt。
示例中用到的
SLS_
開頭的參數配置請參見配置方式。
# Kafka output plugin configuration [[outputs.kafka]] ## URLs of kafka brokers brokers = ["SLS_KAFKA_ENDPOINT"] ## Kafka topic for producer messages topic = "SLS_LOGSTORE" routing_key = "content" ## CompressionCodec represents the various compression codecs recognized by ## Kafka in messages. ## 0 : No compression ## 1 : Gzip compression ## 2 : Snappy compression ## 3 : LZ4 compression compression_codec = 1 ## Optional TLS Config tls_ca = "/etc/ssl/certs/ca-bundle.crt" tls_cert = "/etc/ssl/certs/ca-certificates.crt" # tls_key = "/etc/telegraf/key.pem" ## Use TLS but skip chain & host verification # insecure_skip_verify = false ## Optional SASL Config sasl_username = "SLS_PROJECT" sasl_password = "SLS_PASSWORD" ## Data format to output. ## https://github.com/influxdata/telegraf/blob/master/docs/DATA_FORMATS_OUTPUT.md data_format = "json"
示例四:使用Fluentd上傳日志
Fluentd是一個開源的日志收集器,是云端原生計算基金會(CNCF)的成員項目之一,遵循Apache 2 License協議。
Fluentd支持眾多輸入、處理、輸出插件,支持通過Kafka插件將日志上傳到日志服務,您只需安裝并配置Kafka插件即可。更多信息,請參見fluent-plugin-kafka。
配置示例
示例中將日志輸出格式(Format)設置為JSON,除此之外還支持數十種Format類型。更多信息,請參見Fluentd Formatter。
示例中用到的
SLS_
開頭的參數配置請參見配置方式。
<match **> @type kafka2 brokers SLS_KAFKA_ENDPOINT default_topic SLS_LOGSTORE default_message_key content sasl_over_ssl true use_event_time true username SLS_PROJECT password "SLS_PASSWORD" ssl_ca_certs_from_system true # ruby-kafka producer options max_send_retries 1000 required_acks 1 compression_codec gzip use_event_time true max_send_limit_bytes 2097152 <buffer hostlogs> flush_interval 10s </buffer> <format> @type json </format> </match>
示例五:使用Logstash上傳日志
Logstash是一個具備實時處理能力、開源的日志采集引擎,可以動態采集不同來源的日志。
Logstash內置Kafka輸出插件,您可以配置Logstash實現日志通過kafka協議上傳到日志服務。由于日志服務使用SASL_SSL連接協議,因此還需要配置SSL證書和jaas文件。
配置示例
示例中將日志輸出格式(Format)設置為JSON,除此之外還支持數十種Format類型。更多信息,請參見Logstash Codec。
說明本示例為連通性測試的配置,您的生產環境中建議刪除stdout的輸出配置。
示例中用到的
SLS_
開頭的參數配置請參見配置方式。
output { stdout { codec => rubydebug } kafka { topic_id => "SLS_LOGSTORE" bootstrap_servers => "SLS_KAFKA_ENDPOINT" security_protocol => "SASL_SSL" sasl_jaas_config => "org.apache.kafka.common.security.plain.PlainLoginModule required username='SLS_PROJECT' password='SLS_PASSWORD';" sasl_mechanism => "PLAIN" codec => "json" client_id => "kafka-logstash" } }
示例六:通過Fluent-bit上傳日志
Fluent-bit是一個輕量級、高可擴展的日志與指標的處理器、轉發器,支持眾多輸入、處理和輸出插件,支持通過Kafka插件將日志上傳到日志服務。更多信息,請參見Kafka output plugin。
配置示例
示例中用到的
SLS_
開頭的參數配置請參見配置方式。[Output] Name kafka Match * Brokers SLS_KAFKA_ENDPOINT Topics SLS_LOGSTORE Format json rdkafka.sasl.username SLS_PROJECT rdkafka.sasl.password SLS_PASSWORD rdkafka.security.protocol SASL_SSL rdkafka.sasl.mechanism PLAIN
示例七 :Vector配置Kafka協議上傳
Vector是一款輕量級、高性能的日志處理軟件,它支持Kafka協議的方式上報日志。下面是Vector通過Kafka兼容模式寫入SLS的配置方法。
配置示例
示例中用到的
SLS_
開頭的參數配置請參見配置方式。[sinks.aliyun_sls] type = "kafka" inputs = ["test_logs"] bootstrap_servers = "SLS_KAFKA_ENDPOINT" compression = "gzip" healthcheck = true topic = "SLS_LOGSTORE" encoding.codec = "json" sasl.enabled = true sasl.mechanism = "PLAIN" sasl.username = "SLS_PROJECT" sasl.password = "SLS_PASSWORD" tls.enabled = true
示例八:通過Kafka生產者(produce)上傳日志
代碼示例
package org.example; import org.apache.kafka.clients.producer.KafkaProducer; import org.apache.kafka.clients.producer.ProducerRecord; import org.apache.kafka.common.serialization.StringSerializer; import java.util.Properties; public class KafkaProduceExample { public static void main(String[] args) { //配置信息。 Properties props = new Properties(); String project = "etl-dev"; String logstore = "testlog"; // 如果希望produce的內容被json解析展開,則設置為true boolean parseJson = true; // 阿里云賬號AccessKey擁有所有API的訪問權限,風險很高。強烈建議您創建并使用RAM用戶進行API訪問或日常運維,請登錄RAM控制臺創建RAM用戶。 // 此處以把AccessKey 和 AccessKeySecret 保存在環境變量為例說明。您可以根據業務需要,保存到配置文件里。 // 強烈建議不要把 AccessKey 和 AccessKeySecret 保存到代碼里,會存在密鑰泄漏風險 String accessKeyID = System.getenv("SLS_ACCESS_KEY_ID"); String accessKeySecret = System.getenv("SLS_ACCESS_KEY_SECRET"); String endpoint = "cn-huhehaote.log.aliyuncs.com"; // 根據實際project所在的endpoint配置 String port = "10012"; // 公網用10012,私網用10011 String hosts = project + "." + endpoint + ":" + port; String topic = logstore; if(parseJson) { topic = topic + ".json"; } props.put("bootstrap.servers", hosts); props.put("security.protocol", "sasl_ssl"); props.put("sasl.mechanism", "PLAIN"); props.put("sasl.jaas.config", "org.apache.kafka.common.security.plain.PlainLoginModule required username=\"" + project + "\" password=\"" + accessKeyID + "#" + accessKeySecret + "\";"); props.put("enable.idempotence", "false"); // SLS的Kafka寫入接口不支持事務 //設置數據key和value的序列化處理類。 props.put("key.serializer", StringSerializer.class); props.put("value.serializer", StringSerializer.class); //創建生產者實例。 KafkaProducer<String,String> producer = new KafkaProducer<>(props); //發送記錄 for(int i=0;i<1;i++){ String content = "{\"msg\": \"Hello World\"}"; ProducerRecord record = new ProducerRecord<String, String>(topic, content); producer.send(record); } producer.close(); } }
pom依賴
<dependency> <groupId>org.apache.kafka</groupId> <artifactId>kafka-clients</artifactId> <version>2.1.0</version> </dependency>
錯誤信息
使用Kafka協議上傳日志失敗時,會按照Kafka的錯誤信息返回對應的錯誤信息,如下表所示,Kafka協議錯誤信息詳情,請參見error list。
錯誤信息 | 說明 | 推薦解決方式 |
NetworkException | 出現網絡錯誤時返回該錯誤信息。 | 一般等待1秒后重試即可。 |
TopicAuthorizationException | 鑒權失敗時返回該錯誤信息。 | 一般是您提供的AccessKey錯誤或沒有寫入對應Project、Logstore的權限。請填寫正確的且具備寫入權限的AccessKey。 |
UnknownTopicOrPartitionException | 出現該錯誤可能有兩種原因:
| 請確保已創建對應的Project和Logstore。如果已創建還是提示該錯誤,請檢查Project所在地域是否和填入的Endpoint一致。 |
KafkaStorageException | 服務端出現異常時返回該錯誤信息。 | 一般等待1秒后重試即可。 |