日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

元數(shù)據(jù)采集

DataWorks數(shù)據(jù)地圖為您提供元數(shù)據(jù)采集功能,方便您將不同系統(tǒng)中的元數(shù)據(jù)進行統(tǒng)一匯總管理,您可以在數(shù)據(jù)地圖查看從各數(shù)據(jù)源匯集而來的元數(shù)據(jù)信息。本文為您介紹如何創(chuàng)建采集器,將各數(shù)據(jù)源的元數(shù)據(jù)信息匯集至DataWorks。

前提條件

您需要先在工作空間新建數(shù)據(jù)源后,才可以進行元數(shù)據(jù)采集。新建數(shù)據(jù)源配置詳情請參見:數(shù)據(jù)源管理

元數(shù)據(jù)采集概述

在工作空間中新建數(shù)據(jù)源后,DataWorks可以面向數(shù)據(jù)源提供元數(shù)據(jù)采集能力。在數(shù)據(jù)地圖中開啟元數(shù)據(jù)采集后,系統(tǒng)將一次性全量采集存量的元數(shù)據(jù),同時每天采集增量的元數(shù)據(jù),并匯集至數(shù)據(jù)地圖,方便您進行數(shù)據(jù)總覽、分類分組管理數(shù)據(jù)表、查看數(shù)據(jù)血緣關系等操作。

說明
  • 如果系統(tǒng)默認配置的采集計劃不適用,支持您修改采集器執(zhí)行計劃,詳情請參見管理元數(shù)據(jù)采集器

  • MaxCompute和E-MapReduce(DLF)數(shù)據(jù)源綁定至數(shù)據(jù)開發(fā)后,由系統(tǒng)自動運維元數(shù)據(jù)采集器,您無需額外管理元數(shù)據(jù)采集器。

支持的數(shù)據(jù)源及元數(shù)據(jù)采集方式

數(shù)據(jù)源類型

元數(shù)據(jù)采集方式

是否能在數(shù)據(jù)地圖中看到采集器

元數(shù)據(jù)更新時效性

數(shù)據(jù)表/字段

分區(qū)

數(shù)據(jù)血緣

MaxCompute

  • 數(shù)據(jù)開發(fā) - 綁定數(shù)據(jù)源

  • 自動啟動采集

普通項目:實時

外部項目:T+1

國內(nèi)地域:實時

海外地域:T+1

T+1

E-MapReduce(DLF)

說明

需要為集群開啟EMR_HOOK

  • 管理中心 - 注冊開源集群

  • 自動啟動采集

實時

實時

實時

E-MapReduce(HMS / RDS)

說明

需要為集群開啟EMR_HOOK

  • 管理中心 - 注冊開源集群

  • 自動啟動采集

實時

實時

實時

Hologres

  • 數(shù)據(jù)開發(fā) - 綁定數(shù)據(jù)源

  • 手動啟動采集

取決于自定義采集計劃

不支持

實時

AnalyticDB for PostgreSQL

  • 數(shù)據(jù)開發(fā) - 綁定數(shù)據(jù)源

  • 手動啟動采集

取決于自定義采集計劃

不支持

實時

AnalyticDB for MySQL

  • 數(shù)據(jù)開發(fā) - 綁定數(shù)據(jù)源

  • 手動啟動采集

取決于自定義采集計劃

不支持

實時

說明

需要提交工單為AnalyticDB for MySQL實例開啟數(shù)據(jù)血緣功能。

AnalyticDB for Spark

  • 數(shù)據(jù)開發(fā) - 綁定計算資源

    說明

    當前僅新版數(shù)據(jù)開發(fā)支持綁定AnalyticDB for Spark計算資源。

  • 手動啟動采集

    說明

    AnalyticDB for Spark與AnalyticDB for MySQL使用同一個元數(shù)據(jù)采集入口。

實時

不支持

實時

CDH Hive

  • 管理中心 - 注冊開源集群

  • 自動啟動采集

取決于自定義采集計劃

實時

實時

Data Lake Formation(DLF)

自動啟動采集

實時

實時

不適用

其他數(shù)據(jù)源類型(MySQL、PostgreSQL、SQL Server、Oracle、Table Store(OTS)、StarRocks、Clickhouse等)

  • 管理中心 - 創(chuàng)建數(shù)據(jù)源

  • 手動啟動采集

取決于自定義采集計劃

不支持

不支持

使用限制

  • 僅支持對當前登錄賬號所屬的工作空間中已配置的數(shù)據(jù)源,進行元數(shù)據(jù)采集操作。如果您需要采集其他工作空間中數(shù)據(jù)源的元數(shù)據(jù)信息,您可以聯(lián)系空間管理員添加空間成員,詳情請參見為工作空間添加空間成員

  • 當您需要采集已開啟白名單訪問控制的數(shù)據(jù)源的元數(shù)據(jù)時,則需要提前配置好數(shù)據(jù)庫的白名單權限。詳情請參見元數(shù)據(jù)采集的數(shù)據(jù)源有白名單訪問控制時需要配置的白名單

  • DataWorks目前不建議跨地域采集元數(shù)據(jù),即DataWorks所在的地域需要與數(shù)據(jù)源所在的地域相同。如需跨地域采集元數(shù)據(jù),請在新建數(shù)據(jù)源時使用公網(wǎng)地址。詳情請參見創(chuàng)建并管理數(shù)據(jù)源

  • 暫不支持使用MySQL元數(shù)據(jù)采集器來采集OceanBase數(shù)據(jù)源。

功能入口

  1. 進入數(shù)據(jù)地圖

  2. 在左側菜單欄,單擊元數(shù)據(jù)采集

    您可以在數(shù)據(jù)源視角對已配置的各數(shù)據(jù)源的元數(shù)據(jù)采集器進行管理。對于無數(shù)據(jù)源的情況,支持您單擊新建數(shù)據(jù)源,進入數(shù)據(jù)源配置頁面,創(chuàng)建數(shù)據(jù)源。

查看元數(shù)據(jù)采集器

  • 整體統(tǒng)計

    元數(shù)據(jù)采集頁面,您可以在數(shù)據(jù)源視角查看元數(shù)據(jù)采集總覽,主要為您展示已創(chuàng)建采集器的數(shù)據(jù)源數(shù)量。整體統(tǒng)計

  • 明細列表

    您還可以單擊目標數(shù)據(jù)源類型右上角的管理按鈕,進入采集明細頁面,查看指定工作空間下相應采集器的運行狀態(tài)執(zhí)行計劃上次運行時間上次消耗時間平均運行耗時及上次運行時更新及添加的表數(shù)量。明細列表

管理元數(shù)據(jù)采集器

單擊目標數(shù)據(jù)源右上角的管理按鈕,默認進入已采集列表,您可以對已有采集器進行如下操作。

運行元數(shù)據(jù)采集器

支持您手動運行元數(shù)據(jù)采集器,您可以根據(jù)業(yè)務需要在已采集列表頁面找到目標數(shù)據(jù)源單擊操作列的運行,即可執(zhí)行一次元數(shù)據(jù)采集。

修改元數(shù)據(jù)采集器的執(zhí)行計劃

進入已采集列表,單擊目標數(shù)據(jù)源采集器操作列的編輯,即可修改采集器的執(zhí)行計劃,支持的執(zhí)行計劃包括手動采集周期采集

  • 手動采集:在配置目標數(shù)據(jù)源的元數(shù)據(jù)采集器后,需要按需手動觸發(fā)元數(shù)據(jù)的采集和更新。

  • 周期采集:在配置目標數(shù)據(jù)源的元數(shù)據(jù)采集器后,您無需手動觸發(fā),系統(tǒng)會按照配置的采集計劃周期性進行元數(shù)據(jù)的采集和更新。

移除元數(shù)據(jù)采集器

支持您在已采集列表頁面找到目標數(shù)據(jù)源單擊操作列的移除,移除當前數(shù)據(jù)源的元數(shù)據(jù)采集器。移除后該數(shù)據(jù)源將會進入未采集列表,不再進行元數(shù)據(jù)采集。

創(chuàng)建元數(shù)據(jù)采集器

新建數(shù)據(jù)源或注冊集群后,您可以進入數(shù)據(jù)地圖中開啟元數(shù)據(jù)采集,在已采集列表中查看目標數(shù)據(jù)源的元數(shù)據(jù)采集情況。

移除元數(shù)據(jù)采集器后,如果后續(xù)您需要重新啟動采集,支持您在未采集列表中重新創(chuàng)建元數(shù)據(jù)采集器,以下是詳細的操作步驟。

  1. 單擊列表頂部的未采集列表

  2. 找到目標數(shù)據(jù)源,單擊操作列的元數(shù)據(jù)采集,在彈出來的配置采集計劃框中配置各項參數(shù)。

    說明

    不同數(shù)據(jù)源配置采集計劃界面可能存在差異,請以產(chǎn)品界面為準。

    配置采集計劃

    參數(shù)

    描述

    資源組名稱

    選擇已與數(shù)據(jù)源網(wǎng)絡連通的資源組。數(shù)據(jù)地圖支持您選擇如下3種資源組,您可根據(jù)需求選取:

    • 默認資源組default

    • 您自己的獨享調(diào)度資源組。

    • 您自己的獨享數(shù)據(jù)集成資源組。

    • 您自己的Serverless資源組(通用型資源組)。

    連通性測試

    選擇完資源組名稱后,如果您想再次測試資源組與數(shù)據(jù)源的連通性,您可以單擊測試連通性進行驗證。如果顯示測試連通性未通過

    采集計劃

    包括手動采集每月每周每天每小時。根據(jù)不同的執(zhí)行周期,生成不同的執(zhí)行計劃,在相應執(zhí)行計劃的時間內(nèi),對目標數(shù)據(jù)源進行元數(shù)據(jù)采集。

    • 手動采集:根據(jù)實際業(yè)務需求,在業(yè)務需要時手動觸發(fā)元數(shù)據(jù)的采集和更新。

    • 月采集:即在每月所指定日期的指定時間點自動采集一次元數(shù)據(jù)。

      重要

      部分月份不包含29、30、31日,請您謹慎選擇月末日期。

    • 周采集:即在每周所指定日期的指定時間點自動采集一次元數(shù)據(jù)。

      不輸入時間時,則默認在每周指定幾天的00:00:00采集。

    • 天采集:即在每天特定的時間點自動采集一次元數(shù)據(jù)。

    • 小時采集:即在每小時的第N分鐘自動采集一次元數(shù)據(jù)。

  3. 確認配置信息無誤后,單擊確認

    系統(tǒng)會根據(jù)配置的采集計劃,進行元數(shù)據(jù)采集,如果是手動采集,您可以根據(jù)實際業(yè)務需求,在業(yè)務需要時進入已采集列表,找到目標數(shù)據(jù)源,單擊操作列的運行,即可手動執(zhí)行采集任務。

后續(xù)步驟

采集元數(shù)據(jù)成功后,您可以在數(shù)據(jù)地圖中進行數(shù)據(jù)總覽、分類分組管理數(shù)據(jù)表、查看數(shù)據(jù)血緣關系等操作。詳情請參見數(shù)據(jù)總覽查找表業(yè)務視角管理:數(shù)據(jù)專輯