本文介紹導入OSS數據到日志服務所涉及的使用限制。
采集限制
限制項 | 說明 |
---|---|
單個文件大小 |
單個文件大小超過限制時,導入任務會忽略整個文件。 |
單條數據大小 | 單條數據最大為3 MB。數據大小超過限制時,該數據會被丟棄。 數據處理流量觀測儀表盤中的寫失敗條數代表被丟棄的數據條數。如何查看,請參見查看導入配置。 |
文件更新 | 針對更新過的OSS文件,數據導入任務會重新進行全量導入。即之前已導入過的文件,又追加了部分內容,那么這個文件中數據將再次被全部導入。 |
新文件發現延遲 | 發現新文件的最小間隔支持設置為1分鐘。當待導入的文件特別多時,可能存在更多延遲。 |
配置限制
限制項 | 說明 |
---|---|
數據導入配置數量 | 單個Project允許創建的所有類型的導入配置總數最多為100個。如果您有更大的使用需求,請提工單申請。 |
性能限制
限制項 | 說明 |
---|---|
并發子任務數量 | 日志服務后臺會自動根據待導入的文件數量,創建多個導入子任務進行并發導入。每個導入配置默認最多生成8個子任務,每個子任務最大支持10 MB/s的處理速度(針對解壓后的數據),即默認情況下,導入任務支持最大80 MB/s的處理速度。 如果您有更大的使用需求,請提工單申請。 |
Logstore Shard數量 | 日志服務的寫性能取決于目標Logstore的Shard數量(單個Shard支持5 MB/s的寫入)。當數據量較大時,建議增加目標Logstore的Shard數量。具體操作,請參見管理Shard。 |
歸檔文件的讀取 | 如果待導入的文件是歸檔類型,則需要解凍后才能被讀取。 一般情況下,解凍一個文件大約需要1分鐘。 |
文件大小 | 相同數據總量的情況下,平均文件大小越大,讀取吞吐越高。反之,小文件越多,讀取吞吐越低。 |
網絡 | 如果OSS Bucket和日志服務Project處于同一地域,可節省公網流量且傳輸速度快。 跨地域導入時,讀取OSS文件受網絡影響較大,性能相對較差。 |
新數據導入延遲 | 當存量文件較多時,如果您未開啟使用OSS元數據索引配置,則可能無法按照新文件的檢查周期對新文件進行采集。 存在100萬左右的存量文件時,新文件采集的延遲時間大約為2分鐘。其他數量的存量文件,可依次進行線性類推。 |