日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

導(dǎo)入OSS數(shù)據(jù)

更新時(shí)間:
重要

本文中含有需要您注意的重要提示信息,忽略該信息可能對(duì)您的業(yè)務(wù)造成影響,請(qǐng)務(wù)必仔細(xì)閱讀。

您可以將OSS Bucket中的日志文件,通過(guò)數(shù)據(jù)導(dǎo)入方式導(dǎo)入到日志服務(wù),實(shí)現(xiàn)日志的查詢分析、加工等操作。目前日志服務(wù)只支持導(dǎo)入5 GB以內(nèi)的OSS文件,壓縮文件大小按照壓縮后的大小計(jì)算。

費(fèi)用說(shuō)明

日志服務(wù)不針對(duì)導(dǎo)入功能收取費(fèi)用,但導(dǎo)入功能需要訪問(wèn)OSS API,會(huì)產(chǎn)生OSS的流量費(fèi)用和請(qǐng)求費(fèi)用。相關(guān)計(jì)費(fèi)項(xiàng)的定價(jià)詳情,請(qǐng)參見(jiàn)OSS定價(jià)。導(dǎo)入OSS數(shù)據(jù)時(shí),每天產(chǎn)生的OSS費(fèi)用的計(jì)算公式如下:

image..png

費(fèi)用參數(shù)說(shuō)明

字段

說(shuō)明

N

每天導(dǎo)入的文件個(gè)數(shù)。

T

每天導(dǎo)入的總數(shù)據(jù)量,單位:GB。

p_read

每GB數(shù)據(jù)的流量費(fèi)用。

  • 同地域?qū)霑r(shí),會(huì)產(chǎn)生OSS的內(nèi)網(wǎng)流出流量,該流量免費(fèi)。

  • 跨地域?qū)霑r(shí),會(huì)產(chǎn)生OSS的外網(wǎng)流出流量。

p_put

每萬(wàn)次的Put類型請(qǐng)求費(fèi)用。

日志服務(wù)使用ListObjects接口獲取目標(biāo)Bucket中的文件列表。該接口在OSS側(cè)按照Put類型請(qǐng)求收費(fèi)。另外,該接口每次最多返回1000條數(shù)據(jù),因此如果您有100萬(wàn)個(gè)新增文件,需要進(jìn)行1,000,000/1000=1000次請(qǐng)求。

p_get

每萬(wàn)次的GET類型請(qǐng)求費(fèi)用。

M

新文件檢查周期,單位:分鐘。

您可以在創(chuàng)建數(shù)據(jù)導(dǎo)入配置時(shí),設(shè)置檢查新文件周期參數(shù)。

案例1(同地域?qū)耄?/h2>

某企業(yè)基于阿里云OSS、SLS等產(chǎn)品開(kāi)發(fā)App A,每天產(chǎn)生10萬(wàn)個(gè)文件,平均每個(gè)文件大小為100 MB,這些文件保存在杭州地域的標(biāo)準(zhǔn)型OSS Bucket中。該企業(yè)要將這些數(shù)據(jù)導(dǎo)入到杭州地域的SLS Logstore中且設(shè)置檢查新文件周期為5分鐘,則每天產(chǎn)生的OSS費(fèi)用為0.114592元,具體費(fèi)用說(shuō)明如下表所示。

計(jì)費(fèi)項(xiàng)

定價(jià)

使用情況

每天費(fèi)用

PUT類型請(qǐng)求

0.01元/萬(wàn)次

14592次

14592次/10000×0.01元/萬(wàn)次=0.014592元

GET類型請(qǐng)求

0.01元/萬(wàn)次

100,000次

100,000次/10,000×0.01元/萬(wàn)次=0.1元

總費(fèi)用

0.114592元

案例2(跨地域,每天導(dǎo)入一次)

某企業(yè)基于阿里云OSS、SLS等產(chǎn)品開(kāi)發(fā)App B,該App每天產(chǎn)生10萬(wàn)個(gè)文件,平均每個(gè)文件大小為100 MB,這些文件保存在上海地域的標(biāo)準(zhǔn)型OSS Bucket中。該企業(yè)要將這些數(shù)據(jù)導(dǎo)入到杭州地域的SLS Logstore中且設(shè)置檢查新文件周期為1天,則每天產(chǎn)生的OSS費(fèi)用為2500.1001元,具體費(fèi)用說(shuō)明如下表所示。

計(jì)費(fèi)項(xiàng)

定價(jià)

使用情況

每天費(fèi)用

PUT類型請(qǐng)求

0.01元/萬(wàn)次

100次

100次/10,000×0.01元/萬(wàn)次=0.0001元

GET類型請(qǐng)求

0.01元/萬(wàn)次

100,000次

100,000次/10,000×0.01元/萬(wàn)次=0.1元

外網(wǎng)流出流量

0.25元/GB

10000 GB

10000 GB×0.25 元/GB=2500元

總費(fèi)用

2500.1001元

案例3(跨地域,每5分鐘導(dǎo)入一次

某企業(yè)基于阿里云OSS、SLS等產(chǎn)品開(kāi)發(fā)App C,該App每天產(chǎn)生10萬(wàn)個(gè)文件,平均每個(gè)文件大小為100 MB,這些文件保存在上海地域的標(biāo)準(zhǔn)型OSS Bucket上。該企業(yè)要將這些數(shù)據(jù)導(dǎo)入到杭州地域的SLS Logstore中且設(shè)置檢查新文件周期為5分鐘,則每天產(chǎn)生的OSS費(fèi)用為4375.114592元,具體費(fèi)用說(shuō)明如下表所示。

計(jì)費(fèi)項(xiàng)

定價(jià)

使用情況

每天費(fèi)用

PUT類型請(qǐng)求

0.01元/萬(wàn)次

14592次/10,000×0.01元/萬(wàn)次=0.014592元

GET類型請(qǐng)求

0.01元/萬(wàn)次

100,000次

100,000次/10,000×0.01元/萬(wàn)次=0.1元

外網(wǎng)流出流量

00:00-08:00:0.25元/GB

08:00-24:00:0.50元/GB

10000 GB

4375元

總費(fèi)用

4375.114592元

前提條件

創(chuàng)建數(shù)據(jù)導(dǎo)入配置

重要

針對(duì)更新過(guò)的OSS文件,數(shù)據(jù)導(dǎo)入任務(wù)會(huì)重新進(jìn)行全量導(dǎo)入。即之前已導(dǎo)入過(guò)的文件,又追加了部分內(nèi)容,那么這個(gè)文件中數(shù)據(jù)將再次被全部導(dǎo)入。

  1. 登錄日志服務(wù)控制臺(tái)

  2. 接入數(shù)據(jù)區(qū)域的數(shù)據(jù)導(dǎo)入頁(yè)簽中,選擇OSS-數(shù)據(jù)導(dǎo)入

  3. 選擇目標(biāo)Project和Logstore,單擊下一步
  4. 設(shè)置導(dǎo)入配置。

    1. 導(dǎo)入配置步驟中,設(shè)置如下參數(shù)。

      參數(shù)設(shè)置

      參數(shù)

      說(shuō)明

      任務(wù)名稱

      SLS任務(wù)的唯一名稱。

      顯示名稱

      任務(wù)顯示名稱。

      任務(wù)描述

      導(dǎo)入任務(wù)的描述。

      OSS區(qū)域

      待導(dǎo)入的OSS文件所在Bucket的地域。

      如果OSS Bucket和日志服務(wù)Project處于同一地域,可節(jié)省公網(wǎng)流量且傳輸速度快。

      Bucket

      待導(dǎo)入的OSS文件所在的Bucket。

      文件路徑前綴過(guò)濾

      通過(guò)文件路徑前綴過(guò)濾OSS文件,用于準(zhǔn)確定位待導(dǎo)入的文件。例如待導(dǎo)入的文件都在csv/目錄下,則可以指定前綴為csv/

      如果不設(shè)置該參數(shù),則遍歷整個(gè)OSS Bucket。

      說(shuō)明

      建議設(shè)置該參數(shù)。當(dāng)Bucket中的文件數(shù)量非常多時(shí),全量遍歷將導(dǎo)致數(shù)據(jù)導(dǎo)入效率非常低。

      文件路徑正則過(guò)濾

      通過(guò)文件路徑的正則表達(dá)式過(guò)濾OSS文件,用于準(zhǔn)確定位待導(dǎo)入的文件。只有文件名(包含文件路徑)匹配該正則表達(dá)式的文件才會(huì)被導(dǎo)入。默認(rèn)為空,表示不過(guò)濾。

      例如OSS文件為testdata/csv/bill.csv,您可以設(shè)置正則表達(dá)式為(testdata/csv/)(.*)

      調(diào)整正則表達(dá)式的方法,請(qǐng)參見(jiàn)如何調(diào)試正則表達(dá)式

      文件修改時(shí)間過(guò)濾

      通過(guò)文件修改時(shí)間過(guò)濾OSS文件,用于準(zhǔn)確定位待導(dǎo)入的文件。

      • 所有:如果您想導(dǎo)入所有符合條件的文件,請(qǐng)選擇該項(xiàng)。

      • 某個(gè)時(shí)間開(kāi)始:如果您想導(dǎo)入某個(gè)時(shí)間點(diǎn)后修改過(guò)的文件,請(qǐng)選擇該項(xiàng)。

      • 特定時(shí)間范圍:如果您想導(dǎo)入某個(gè)時(shí)間范圍內(nèi)修改過(guò)的文件,請(qǐng)選擇該項(xiàng)。

      數(shù)據(jù)格式

      文件的解析格式,如下所示。

      • CSV:分隔符分割的文本文件,支持指定文件中的首行為字段名稱或手動(dòng)指定字段名稱。除字段名稱外的每一行都會(huì)被解析為日志字段的值。

      • 單行JSON:逐行讀取OSS文件,將每一行看做一個(gè)JSON對(duì)象進(jìn)行解析。解析后,JSON對(duì)象中的各個(gè)字段對(duì)應(yīng)為日志中的各個(gè)字段。

      • 單行文本日志:將OSS文件中的每一行解析為一條日志。

      • 跨行文本日志:多行模式,支持指定首行或者尾行的正則表達(dá)式解析日志。

      • ORC:ORC文件格式,無(wú)需任何配置,自動(dòng)解析成日志格式。

      • Parquet:Parquet格式,無(wú)需任何配置,自動(dòng)解析成日志格式。

      • 阿里云OSS訪問(wèn)日志:阿里云OSS訪問(wèn)日志格式。更多信息,請(qǐng)參見(jiàn)日志轉(zhuǎn)存

      • 阿里云CDN下載日志:阿里云CDN下載日志格式。更多信息,請(qǐng)參見(jiàn)下載離線日志

      壓縮格式

      待導(dǎo)入的OSS文件的壓縮格式,日志服務(wù)根據(jù)對(duì)應(yīng)格式進(jìn)行解壓并讀取數(shù)據(jù)。

      編碼格式

      待導(dǎo)入的OSS文件的編碼格式。目前僅支持UTF-8和GBK。

      檢查新文件周期

      如果目標(biāo)OSS文件路徑中不斷有新文件產(chǎn)生,您可以根據(jù)需求設(shè)置檢查新文件周期。設(shè)置后,導(dǎo)入任務(wù)會(huì)一直在后臺(tái)運(yùn)行,自動(dòng)周期性地發(fā)現(xiàn)并讀取新文件(后臺(tái)保證不會(huì)將同一個(gè)OSS文件中的數(shù)據(jù)重復(fù)寫(xiě)入到日志服務(wù))。

      如果目標(biāo)OSS文件路徑中不再產(chǎn)生新文件,請(qǐng)修改為永不檢查,即導(dǎo)入任務(wù)讀取完所有符合條件的文件后,將自動(dòng)退出。

      導(dǎo)入歸檔文件

      如果待導(dǎo)入的OSS文件為普通歸檔存儲(chǔ)或者冷歸檔存儲(chǔ),則需要解凍后才能讀取。開(kāi)啟此功能,則歸檔文件會(huì)自動(dòng)解凍。暫不支持深度冷歸檔。

      說(shuō)明
      • 解凍普通歸檔文件需耗時(shí)1分鐘左右,可能導(dǎo)致第一次預(yù)覽超時(shí)。超時(shí)后,請(qǐng)等待一段時(shí)間再重試。

      • 解凍冷歸檔文件需耗時(shí)1小時(shí)左右,預(yù)覽超時(shí)后,可以選擇跳過(guò)預(yù)覽或者等待1小時(shí)后再次進(jìn)行預(yù)覽。

        解凍冷歸檔文件時(shí),默認(rèn)采用7天的解凍有效期,以保證有足夠的時(shí)間導(dǎo)入冷歸檔文件。

      日志時(shí)間配置

      時(shí)間字段

      當(dāng)選擇數(shù)據(jù)格式CSV單行JSONORCParquet阿里云OSS訪問(wèn)日志阿里云CDN下載日志時(shí),您需要設(shè)置一個(gè)時(shí)間字段,即設(shè)置為OSS文件中代表時(shí)間的列名,用于指定導(dǎo)入日志到日志服務(wù)時(shí)的時(shí)間。

      提取時(shí)間正則

      當(dāng)選擇數(shù)據(jù)格式單行文本日志跨行文本日志,您需要使用正則表達(dá)式提取日志中的時(shí)間。

      例如日志樣例為127.0.0.1 - - [10/Sep/2018:12:36:49 +0800] "GET /index.html HTTP/1.1"時(shí),則您可以設(shè)置提取時(shí)間正則[0-9]{0,2}\/[0-9a-zA-Z]+\/[0-9\: +]+

      說(shuō)明

      針對(duì)其他類型的數(shù)據(jù)格式,如果您只需提取時(shí)間字段中的部分內(nèi)容,也可通過(guò)正則表達(dá)式提取。

      時(shí)間字段格式

      指定時(shí)間格式,用于解析時(shí)間字段的值。

      • 支持Java SimpleDateFormat語(yǔ)法的時(shí)間格式,例如yyyy-MM-dd HH:mm:ss。時(shí)間格式的語(yǔ)法詳情,請(qǐng)參見(jiàn)Class SimpleDateFormat。常見(jiàn)的時(shí)間格式,請(qǐng)參見(jiàn)時(shí)間格式

      • 支持epoch格式,包括epoch、epochMillis、epochMicro和epochNano。

      時(shí)間字段分區(qū)

      選擇時(shí)間字段對(duì)應(yīng)的時(shí)區(qū)。當(dāng)時(shí)間字段格式為epoch類別時(shí),不需要設(shè)置時(shí)區(qū)。

      如果解析日志時(shí)間需要考慮夏令時(shí),可以選擇UTC格式;否則,選擇GMT格式。

      高級(jí)配置

      使用OSS元數(shù)據(jù)索引

      當(dāng)OSS文件數(shù)量超過(guò)百萬(wàn)時(shí),強(qiáng)烈建議開(kāi)啟,否則發(fā)現(xiàn)新文件的效率很低。采用OSS元數(shù)據(jù)索引后,可以在秒級(jí)內(nèi)發(fā)現(xiàn)OSS Bucket中的新文件,實(shí)現(xiàn)近實(shí)時(shí)導(dǎo)入Bucket中新寫(xiě)入文件的數(shù)據(jù)。

      在使用OSS元數(shù)據(jù)索引前,需先在OSS側(cè)開(kāi)通OSS元數(shù)據(jù)索引管理功能。具體操作,請(qǐng)參見(jiàn)數(shù)據(jù)索引

      當(dāng)選擇數(shù)據(jù)格式CSV跨行文本日志時(shí),需額外設(shè)置相關(guān)參數(shù),具體說(shuō)明如下表所示。

      CSV

      參數(shù)

      說(shuō)明

      分隔符

      設(shè)置日志的分隔符,默認(rèn)值為半角逗號(hào)(,)。

      引號(hào)

      CSV字符串所使用的引號(hào)字符。

      轉(zhuǎn)義符

      配置日志的轉(zhuǎn)義符,默認(rèn)值為反斜線(\)。

      日志最大跨行數(shù)

      當(dāng)一條日志跨多行時(shí),需要指定最大行數(shù),默認(rèn)值為1。

      首行作為字段名稱

      打開(kāi)首行作為字段名稱開(kāi)關(guān)后,將使用CSV文件中的首行作為字段名稱。例如提取下圖中的首行為日志字段的名稱。首行

      自定義字段列表

      關(guān)閉首行作為字段名稱開(kāi)關(guān)后,請(qǐng)根據(jù)需求自定義日志字段名稱,多個(gè)字段名稱之間用半角逗號(hào)(,)隔開(kāi)。

      跳過(guò)行數(shù)

      指定跳過(guò)的日志行數(shù)。例如設(shè)置為1,則表示從CSV文件中的第2行開(kāi)始采集日志。

      跨文本日志

      參數(shù)

      說(shuō)明

      正則匹配位置

      設(shè)置正則表達(dá)式匹配的位置,具體說(shuō)明如下:

      • 首行正則:使用正則表達(dá)式匹配一條日志的行首,未匹配部分為該條日志的一部分,直到達(dá)到最大行數(shù)。

      • 尾行正則:使用正則表達(dá)式匹配一條日志的行尾,未匹配部分為下一條日志的一部分,直到達(dá)到最大行數(shù)。

      正則表達(dá)式

      根據(jù)日志內(nèi)容,設(shè)置正確的正則表達(dá)式。

      調(diào)整正則表達(dá)式的方法,請(qǐng)參見(jiàn)如何調(diào)試正則表達(dá)式

      最大行數(shù)

      一條日志最大的行數(shù)。

    2. 單擊預(yù)覽,預(yù)覽導(dǎo)入結(jié)果。

    3. 確認(rèn)無(wú)誤后,單擊下一步

  5. 創(chuàng)建索引預(yù)覽數(shù)據(jù),然后單擊下一步。日志服務(wù)默認(rèn)開(kāi)啟全文索引。您也可以根據(jù)采集到的日志,手動(dòng)創(chuàng)建字段索引,或者單擊自動(dòng)生成索引,日志服務(wù)將自動(dòng)生成字段索引。更多信息,請(qǐng)參見(jiàn)創(chuàng)建索引

    重要

    如果需要查詢?nèi)罩局械乃凶侄危ㄗh使用全文索引。如果只需查詢部分字段、建議使用字段索引,減少索引流量。如果需要對(duì)字段進(jìn)行分析(SELECT語(yǔ)句),必須創(chuàng)建字段索引。

  6. 單擊查詢?nèi)罩?/b>,進(jìn)入查詢和分析頁(yè)面,確認(rèn)是否成功導(dǎo)入OSS數(shù)據(jù)。

    等待1分鐘左右,如果有目標(biāo)OSS數(shù)據(jù)導(dǎo)入,則說(shuō)明導(dǎo)入成功。

相關(guān)操作

創(chuàng)建導(dǎo)入配置成功后,您可以在控制臺(tái)中查看已創(chuàng)建的導(dǎo)入配置及生成的統(tǒng)計(jì)報(bào)表。

  1. Project列表區(qū)域,單擊目標(biāo)Project。

  2. 日志存儲(chǔ) > 日志庫(kù)中,選擇目標(biāo)日志庫(kù)下的數(shù)據(jù)接入 > 數(shù)據(jù)導(dǎo)入,單擊配置名稱。

  3. 查看任務(wù)

    導(dǎo)入配置概覽頁(yè)面,查看導(dǎo)入配置的基本信息和統(tǒng)計(jì)報(bào)表。

    導(dǎo)入任務(wù)概覽

    修改任務(wù)

    單擊修改配置,修改導(dǎo)入配置的相關(guān)信息。更多信息,請(qǐng)參見(jiàn)設(shè)置導(dǎo)入配置

    刪除任務(wù)

    單擊刪除配置,刪除該導(dǎo)入配置。

    警告

    刪除后不可恢復(fù),請(qǐng)謹(jǐn)慎操作。

    停止任務(wù)

    單擊停止,停止該導(dǎo)入任務(wù)。

常見(jiàn)問(wèn)題

問(wèn)題

可能原因

解決方法

預(yù)覽時(shí)顯示無(wú)數(shù)據(jù)。

OSS Bucket中沒(méi)有文件、文件中沒(méi)有數(shù)據(jù)或者沒(méi)有符合過(guò)濾條件的文件。

  • 檢查Bucket下是否存在不為空的文件(CSV文件是否僅包含headers行)。如果不存在有數(shù)據(jù)的文件,則可以等待文件有數(shù)據(jù)后,再進(jìn)行導(dǎo)入。

  • 調(diào)整文件路徑前綴過(guò)濾文件路徑正則過(guò)濾文件修改時(shí)間過(guò)濾等配置項(xiàng)。

數(shù)據(jù)中存在亂碼。

數(shù)據(jù)格式、壓縮格式或編碼格式配置不符合預(yù)期。

確認(rèn)OSS文件的真實(shí)格式,然后調(diào)整數(shù)據(jù)格式壓縮格式編碼格式等配置項(xiàng)。

如果需要修復(fù)已有的亂碼數(shù)據(jù),請(qǐng)創(chuàng)建新的Logstore和導(dǎo)入配置。

日志服務(wù)中顯示的數(shù)據(jù)時(shí)間和數(shù)據(jù)本身的時(shí)間不一致。

設(shè)置導(dǎo)入配置時(shí),沒(méi)有指定日志時(shí)間字段或者設(shè)置時(shí)間格式、時(shí)區(qū)有誤。

設(shè)置指定的日志時(shí)間字段以及正確的時(shí)間格式和時(shí)區(qū)。更多信息,請(qǐng)參見(jiàn)創(chuàng)建數(shù)據(jù)導(dǎo)入配置

導(dǎo)入數(shù)據(jù)后,無(wú)法查詢和分析數(shù)據(jù)。

  • 數(shù)據(jù)不在查詢范圍內(nèi)。

  • 未配置索引。

  • 索引未生效。

  • 檢查待查詢數(shù)據(jù)的時(shí)間是否在查詢時(shí)間范圍內(nèi)。

    如果不在查詢范圍內(nèi),請(qǐng)調(diào)整查詢范圍并重新查詢。

  • 檢查是否已為L(zhǎng)ogstore設(shè)置索引。

    如果未設(shè)置,請(qǐng)先設(shè)置索引。具體操作,請(qǐng)參見(jiàn)創(chuàng)建索引重建索引

  • 如果已設(shè)置索引,且數(shù)據(jù)處理流量觀測(cè)儀表盤中顯示的成功導(dǎo)入數(shù)據(jù)量符合預(yù)期,則可能原因是索引未生效,請(qǐng)嘗試重建索引。具體操作,請(qǐng)參見(jiàn)重建索引

導(dǎo)入的數(shù)據(jù)條目數(shù)量少于預(yù)期。

部分文件存在單行數(shù)據(jù)大小超過(guò)3 MB的數(shù)據(jù),導(dǎo)致數(shù)據(jù)在導(dǎo)入過(guò)程被丟棄。更多信息,請(qǐng)參見(jiàn)采集限制

寫(xiě)入數(shù)據(jù)到OSS文件時(shí),避免單行數(shù)據(jù)大小超過(guò)3 MB。

文件數(shù)量和總數(shù)據(jù)量都很大,但導(dǎo)入數(shù)據(jù)的速度不及預(yù)期(正常情況下,可達(dá)到80 MB/s)。

Logstore Shard數(shù)量過(guò)少。更多信息,請(qǐng)參見(jiàn)性能限制

Logstore Shard數(shù)量較少時(shí),請(qǐng)嘗試增加Shard的個(gè)數(shù)(10個(gè)及以上),并觀察延遲情況。具體操作,請(qǐng)參見(jiàn)管理Shard

創(chuàng)建導(dǎo)入配置時(shí),無(wú)法選擇OSS Bucket。

未完成AliyunLogImportOSSRole角色授權(quán)。

參見(jiàn)文本中的前提條件完成授權(quán)。

部分文件沒(méi)有導(dǎo)入。

過(guò)濾條件設(shè)置存在問(wèn)題或者存在單個(gè)文件大小超出5 GB的文件。更多信息,請(qǐng)參見(jiàn)采集限制

  • 檢查待導(dǎo)入的文件是否符合過(guò)濾條件。如果不符合,請(qǐng)修改過(guò)濾條件。

  • 確認(rèn)待導(dǎo)入文件的大小都小于5 GB。

    如果超過(guò)5 GB,請(qǐng)縮小單個(gè)文件的大小。

歸檔文件沒(méi)有導(dǎo)入。

未打開(kāi)導(dǎo)入歸檔文件開(kāi)關(guān)。更多信息,請(qǐng)參見(jiàn)采集限制

  • 方法1:修改導(dǎo)入配置,打開(kāi)導(dǎo)入歸檔文件開(kāi)關(guān)。

  • 方法2:重建一個(gè)導(dǎo)入配置,打開(kāi)導(dǎo)入歸檔文件開(kāi)關(guān)。

多行文本日志解析錯(cuò)誤。

首行正則表達(dá)式或尾行正則表達(dá)式設(shè)置錯(cuò)誤。

檢查首行正則表達(dá)式或尾行正則表達(dá)式的正確性。

新文件導(dǎo)入延遲大。

存量文件太多(即符合文件路徑前綴過(guò)濾的文件數(shù)量太多) 且導(dǎo)入配置中沒(méi)有打開(kāi)使用OSS元數(shù)據(jù)索引開(kāi)關(guān)。

如果符合文件路徑前綴過(guò)濾條件文件數(shù)量太多(超過(guò)100萬(wàn)),需要在導(dǎo)入配置中打開(kāi)使用OSS元數(shù)據(jù)索引開(kāi)關(guān)。否則,發(fā)現(xiàn)新文件的效率非常低。

錯(cuò)誤處理機(jī)制

錯(cuò)誤項(xiàng)

說(shuō)明

讀取文件失敗

讀文件時(shí),如果遇到文件不完整的錯(cuò)誤(例如由網(wǎng)絡(luò)異常、文件損壞等導(dǎo)致),導(dǎo)入任務(wù)會(huì)自動(dòng)重試,重試3次后仍然讀取失敗,將跳過(guò)該文件。

重試間隔和檢查新文件周期一致。如果檢查新文件周期為永不檢查,則重試周期為5分鐘。

壓縮格式解析錯(cuò)誤

解壓文件時(shí),如果遇到文件壓縮格式無(wú)效的錯(cuò)誤,導(dǎo)入任務(wù)將直接跳過(guò)該文件。

數(shù)據(jù)格式解析錯(cuò)誤

  • 解析二進(jìn)制格式(ORC、Parquet)的數(shù)據(jù)失敗時(shí),導(dǎo)入任務(wù)將直接跳過(guò)該文件。

  • 解析其他格式的數(shù)據(jù)失敗時(shí),導(dǎo)入任務(wù)會(huì)將原始文本內(nèi)容存放到日志的content字段中。

OSS Bucket不存在

導(dǎo)入任務(wù)會(huì)定期重試,即重建Bucket后,導(dǎo)入任務(wù)會(huì)自動(dòng)恢復(fù)導(dǎo)入。

權(quán)限錯(cuò)誤

從OSS Bucket讀取數(shù)據(jù)或者寫(xiě)數(shù)據(jù)到日志服務(wù)Logstore存在權(quán)限錯(cuò)誤時(shí),導(dǎo)入任務(wù)會(huì)定期重試,即修復(fù)權(quán)限問(wèn)題后,導(dǎo)入任務(wù)會(huì)自動(dòng)恢復(fù)。

遇到權(quán)限錯(cuò)誤時(shí),導(dǎo)入任務(wù)不會(huì)跳過(guò)任何文件,因此修復(fù)權(quán)限問(wèn)題后,導(dǎo)入任務(wù)會(huì)自動(dòng)將Bucket中還未被處理的文件中的數(shù)據(jù)導(dǎo)入到日志服務(wù)Logstore中。

OSS投遞接口

操作

接口

創(chuàng)建OSS導(dǎo)入任務(wù)

CreateOSSIngestion

修改OSS導(dǎo)入任務(wù)

UpdateOSSIngestion

獲取OSS導(dǎo)入任務(wù)

GetOSSIngestion

刪除OSS導(dǎo)入任務(wù)

DeleteOSSIngestion

啟動(dòng)OSS導(dǎo)入任務(wù)

StartOSSIngestion

停止OSS導(dǎo)入任務(wù)

StopOSSIngestion