日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

使用DataWorks同步數(shù)據(jù)

更新時(shí)間:

本文以MaxCompute為例介紹如何將數(shù)據(jù)通過DataWorks同步至云數(shù)據(jù)庫ClickHouse

背景信息

您可以通過DataWorks,將支持的各種數(shù)據(jù)源數(shù)據(jù)離線同步至云數(shù)據(jù)庫ClickHouse。離線同步支持的數(shù)據(jù)源類型,具體請(qǐng)參見支持的數(shù)據(jù)源與讀寫插件

前提條件

注意事項(xiàng)

  • 云數(shù)據(jù)庫ClickHouse僅支持獨(dú)享數(shù)據(jù)集成資源組。

  • 如果您需要對(duì)已同步過的表再次同步,請(qǐng)先執(zhí)行TRUNCATE TABLE <表名>;語句,清空云數(shù)據(jù)庫ClickHouse表中已同步的數(shù)據(jù)。

操作步驟

  1. 創(chuàng)建數(shù)據(jù)源。

    您需要為MaxCompute和云數(shù)據(jù)庫ClickHouse分別創(chuàng)建數(shù)據(jù)源。

    說明

    如何創(chuàng)建數(shù)據(jù)源,請(qǐng)參見創(chuàng)建MaxCompute數(shù)據(jù)源創(chuàng)建ClickHouse數(shù)據(jù)源

  2. 創(chuàng)建MaxCompute表。

    1. 登錄DataWorks控制臺(tái)

    2. 在左側(cè)導(dǎo)航欄,單擊工作空間

    3. 在頁面左上方,選擇工作空間所在地域

    4. 工作空間列表頁,在目標(biāo)工作空間后的操作列,單擊快速進(jìn)入 > 數(shù)據(jù)開發(fā)

    5. 數(shù)據(jù)開發(fā)頁面,將鼠標(biāo)懸停至新建圖標(biāo),單擊新建表 > MaxCompute >

    6. 新建表對(duì)話框中,選擇路徑,輸入名稱,本文以odptabletest1表名為例,單擊新建

    7. 基本屬性區(qū)域,配置各項(xiàng)參數(shù)。

      基本屬性

      參數(shù)含義如下。

      配置項(xiàng)

      說明

      中文名

      定義表的中文名稱。

      主題

      DataWorks的主題相當(dāng)于文件夾。定義表所屬的一級(jí)文件夾與二級(jí)文件夾。您可基于業(yè)務(wù)用途對(duì)表進(jìn)行歸類,將同類表掛載至相同文件夾中。

      說明

      一級(jí)主題、二級(jí)主題僅為DataWorks上表管理文件夾的呈現(xiàn)形式,旨在方便您更好地管理表。 后續(xù)在表管理頁面可通過主題快速查找當(dāng)前表,如果沒有可用的主題,可參考定義表主題新建。

    8. 單擊工具欄中的DDL

    9. DDL模式對(duì)話框中,輸入如下建表語句,單擊生成表結(jié)構(gòu)

      CREATE TABLE IF NOT EXISTS odptabletest1
      (    
      v1  TINYINT,    
      v2  SMALLINT                
      );
    10. 分別單擊提交到開發(fā)環(huán)境提交到生產(chǎn)環(huán)境

  3. 寫入MaxCompute表數(shù)據(jù)。

    1. 數(shù)據(jù)開發(fā)頁面,單擊左側(cè)導(dǎo)航欄的臨時(shí)查詢

    2. 鼠標(biāo)懸停至新建圖標(biāo),單擊新建 > ODPS SQL

    3. 新建節(jié)點(diǎn)對(duì)話框中,選擇路徑,輸入名稱

    4. 單擊確認(rèn)

    5. 在節(jié)點(diǎn)的編輯頁面,輸入如下語句,為MaxCompute表寫入數(shù)據(jù)。

      insert into odptabletest1 values (1,"a"),(2,"b"),(3,"c"),(4,"d");
    6. 單擊工具欄中的執(zhí)行圖標(biāo)。

    7. MaxCompute計(jì)算成本估計(jì)窗口,單擊運(yùn)行

  4. 創(chuàng)建云數(shù)據(jù)庫ClickHouse表。

    1. 登錄云數(shù)據(jù)庫ClickHouse控制臺(tái)

    2. 在頁面左上角,選擇目標(biāo)集群所在的地域。

    3. 集群列表頁面,選擇目標(biāo)集群對(duì)應(yīng)類型的實(shí)例列表,單擊目標(biāo)集群ID。

    4. 集群信息頁面,請(qǐng)單擊右上方導(dǎo)航欄的登錄數(shù)據(jù)庫

    5. 登錄實(shí)例頁面,輸入數(shù)據(jù)庫賬號(hào)和密碼,單擊登錄

    6. 輸入建表語句并單擊執(zhí)行(F8)。建表語句如下。

      create table default.dataworktest ON CLUSTER default (
      v1 Int, 
      v2 String
      ) ENGINE = MergeTree ORDER BY v1;
      說明

      云數(shù)據(jù)庫ClickHouse表的結(jié)構(gòu)類型需與MaxCompute對(duì)應(yīng)。

  5. 創(chuàng)建業(yè)務(wù)流程。

    如果您已有業(yè)務(wù)流程,可以忽略該步驟。

    1. 數(shù)據(jù)開發(fā)頁面,單擊左側(cè)導(dǎo)航欄的數(shù)據(jù)開發(fā)

    2. 鼠標(biāo)懸停至新建圖標(biāo),選擇新建業(yè)務(wù)流程

    3. 新建業(yè)務(wù)流程對(duì)話框,輸入業(yè)務(wù)名稱

      重要

      業(yè)務(wù)名稱必須由大小寫字母、中文、數(shù)字、下劃線(_)以及小數(shù)點(diǎn)(.)組成,且不能超過128個(gè)字符。

    4. 單擊新建

  6. 創(chuàng)建離線同步節(jié)點(diǎn)。

    1. 展開業(yè)務(wù)流程,右鍵單擊數(shù)據(jù)集成

    2. 單擊新建節(jié)點(diǎn) > 離線同步

    3. 新建節(jié)點(diǎn)對(duì)話框中,輸入名稱,并選擇路徑

      重要

      節(jié)點(diǎn)名稱必須由大小寫字母、中文、數(shù)字、下劃線(_)以及小數(shù)點(diǎn)(.)組成,且不能超過128個(gè)字符。

    4. 單擊確認(rèn)

  7. 配置數(shù)據(jù)來源和數(shù)據(jù)去向。

    1. 配置數(shù)據(jù)來源:數(shù)據(jù)來源為DataWorks支持的任一數(shù)據(jù)源,本文以MaxCompute為例。

      選擇數(shù)據(jù)源

      參數(shù)含義如下。

      參數(shù)

      描述

      數(shù)據(jù)源

      數(shù)據(jù)源的類型和名稱。

      生產(chǎn)項(xiàng)目名

      默認(rèn)不可以修改。

      需要同步的表。

      分區(qū)信息

      如果您每日增量數(shù)據(jù)限定在對(duì)應(yīng)日期的分區(qū)中,可以使用分區(qū)進(jìn)行每日增量。例如,配置分區(qū)v17的值為${bizdate}

      說明

      DataWorks不支持對(duì)MaxCompute分區(qū)表進(jìn)行字段映射,您需要單獨(dú)配置分區(qū)字段。

      說明

      參數(shù)配置的更多信息,請(qǐng)參見MaxCompute Reader

    2. 配置數(shù)據(jù)去向:數(shù)據(jù)源的類型選擇為ClickHouse

      選擇數(shù)據(jù)源

      參數(shù)含義如下。

      參數(shù)

      描述

      數(shù)據(jù)源

      數(shù)據(jù)源的類型與名稱,其中,數(shù)據(jù)源的類型需選擇ClickHouse。

      需要同步的表。

      主鍵或者唯一鍵沖突處理

      固定選擇為insert into(插入)

      導(dǎo)入前準(zhǔn)備語句

      執(zhí)行數(shù)據(jù)同步任務(wù)之前率先執(zhí)行的SQL語句。

      導(dǎo)入后完成語句

      執(zhí)行數(shù)據(jù)同步任務(wù)之后執(zhí)行的SQL語句。

      批量插入字節(jié)大小

      批量插入數(shù)據(jù)的最大字節(jié)數(shù)。

      批量條數(shù)

      批量插入數(shù)據(jù)的條數(shù)。

    3. (可選)字段映射:您可以選擇字段的映射關(guān)系,左側(cè)的源頭表字段和右側(cè)的目標(biāo)表字段為一一對(duì)應(yīng)關(guān)系。

      字段映射

      說明

      參數(shù)說明,具體請(qǐng)參見字段映射

    4. (可選)通道控制:配置作業(yè)速率上限和臟數(shù)據(jù)檢查規(guī)則。

      通道控制

      說明

      參數(shù)說明,具體請(qǐng)參見通道控制

  8. 配置數(shù)據(jù)集成資源組。

    單擊右側(cè)的數(shù)據(jù)集成資源組配置,選擇已經(jīng)創(chuàng)建好的獨(dú)享數(shù)據(jù)集成資源組集成資源組配置

  9. 保存并運(yùn)行數(shù)據(jù)同步任務(wù)。

    1. 單擊工具欄中的保存圖標(biāo),保存數(shù)據(jù)同步任務(wù)。

    2. 單擊工具欄中的運(yùn)行圖標(biāo),運(yùn)行數(shù)據(jù)同步任務(wù)。p353650.png

驗(yàn)證同步結(jié)果

  1. 登錄云數(shù)據(jù)庫ClickHouse控制臺(tái)

  2. 在頁面左上角,選擇目標(biāo)集群所在的地域。

  3. 集群列表頁面,選擇目標(biāo)集群對(duì)應(yīng)類型的實(shí)例列表,單擊目標(biāo)集群ID。

  4. 集群信息頁面,單擊頁面右上方的登錄數(shù)據(jù)庫

  5. 登錄實(shí)例頁面,輸入數(shù)據(jù)庫賬號(hào)和密碼,單擊登錄

  6. 輸入查詢語句并單擊執(zhí)行(F8),確認(rèn)數(shù)據(jù)是否同步成功,查詢語句如下。

    SELECT * FROM dataworktest;

    查詢結(jié)果如下。查詢結(jié)果

    說明

    當(dāng)您執(zhí)行查詢語句并成功返回結(jié)果時(shí),說明數(shù)據(jù)已從DataWorks同步至云數(shù)據(jù)庫ClickHouse