Dataphin數據集成的離線管道功能為您提供可視化組件的開發方式。創建離線管道腳本后,您可以通過多樣性的組件庫拖拽所需組件進行開發??梢暬M件開發方式不僅能降低開發難度和提高開發效率,還方便您快速梳理來源與去向數據源。本文為您介紹如何通過組件庫開發離線單條管道任務。
前提條件
已完成離線管道腳本的創建。在進行離線管道開發前,您需要創建對應的管道開發腳本。更多信息,請參見通過單條管道創建集成任務。
離線管道組件開發入口
在Dataphin首頁,單擊頂部菜單欄研發->數據集成。
按照以下操作指引,進入離線管道組件開發頁面。
選擇項目(Dev-Prod模式需要選擇環境)->單擊離線集成->選擇并單擊需要開發的離線管道->單擊組件庫。
離線組件庫開發說明
一般的,一個完整的離線管道由輸入(>=1個)、轉換(>=0個)、流程(>=0個)及輸出(>=1個)組件組成。
在離線單條管道腳本的開發頁面,單擊頁面右上角的組件庫,將展示收藏、輸入、轉換、流程、輸出、自定義組件。
收藏組件
當前登錄賬號在其他組件庫中,通過單擊進行收藏的組件將在此處展示。您可以將您經常使用的組件進行收藏,并在收藏組件庫中進行快捷的選取與使用。
輸入組件
原數據的來源,您可根據您的業務數據類型選擇對應的組件拖動到左側的管道畫布用于數據輸入。各輸入組件功能詳情,請參見各組件配置詳情。
輸入組件不支持有上游節點。
輸入下游節點可以是轉換、輸出、流程。
如果輸入組件有多個下游節點(輸出或轉換),則組件連接時需選擇輸入組件的數據發送方式。
復制:上游節點的數據根據下游節點數量進行等份復制,且每個下游節點的數據都是上游節點的全部數據。
輪流分發:上游節點的數據根據下游節點數量進行輪流分發,且所有下游節點的數據之和等于上游節點的數據。
輸出組件
數據來源集成的目標數據。您可根據您的業務需求,選擇對應的輸出組件并拖動到左側的管道畫布用于數據的輸出。各輸出組件功能詳情,請參見各組件配置詳情。
輸出組件不支持有下游節點。
流程組件
用于數據集成時的流程控制,Dataphin支持限速、條件分發2種流程組件。各流程組件功能詳情,請參見各組件配置詳情。
流程組件不支持作為離線管道的第一個或最后一個節點,但支持放置于管道腳本中間的任意位置。
如果流程組件有多個下游節點(轉換、輸出或流程),則組件連接時需選擇輸入組件的數據發送方式。
如果流程選擇條件分發組件,則組件連接時需選擇分發的條件:
如果您選擇條件結果為true,當上游節點的結果為true時,數據向下游發送。
如果您選擇條件結果為false,當上游節點的結果為false時,數據向下游發送。
轉換組件
可用于將輸入組件的來源數據進行轉換,如對數據字段進行計算、過濾、加密等。各轉換組件功能詳情,請參見各組件配置詳情。
轉換組件支持有多個下游組件(轉換、輸出、流程),所以在組件連接時需要選擇輸入組件的數據發送方式。
有向連接
選取所需要的組件后,您可以通過有向連接的方式,將上游輸入組件指向下游轉化、流程、輸出組件,形成有向連線。集成任務運行時將根據有向連接依次執行各組件。組件連接時的上下游關系,請參見下圖。
畫布操作
一個管道畫布支持有多個管道腳本同時構建,同時您也可以在管道畫布中右鍵單擊執行如下操作。
操作 | 描述 |
復制 | 復制管道畫布中已有的組件。 |
粘貼 | 將選復制的管道組件粘貼在管道畫布中。 |
刪除 | 刪除選中的組件。 |
全選 | 選中管道畫布中的所有組件。 |
圈選 | 通過鼠標圈定選擇多個組件。 |
切換為腳本模式組件
非邏輯表LogicalTable組件、腳本模式組件、本地文件組件的輸入與輸出組件在組件配置對話框中,支持單擊切換為腳本模式組件。切換成腳本模式后,將無法切回。下圖以MySQL輸入組件為例。
切換前 | 切換后 |
組件配置說明
Dataphin支持的組件及配置說明請參見下表:
輸入組件
組件名稱 | 組件配置 |
MYSQL | |
Oracle | |
Vertica | |
FTP | |
邏輯表LogicalTable | |
AnalyticDB for PostgreSQL | |
PolarDB | |
本地文件 | |
Teradata | |
OceanBase | |
Hologres | |
DataHub | |
DM | |
TiDB | |
GBase 8a | |
SAP Table | |
StarRocks | |
Elasticsearch | |
Salesforce | |
SelectDB | |
Microsoft SQL Server | |
PostgreSQL | |
PolarDB-X(原DRDS) | |
MaxCompute | |
MongoDB | |
AnalyticDB for MySQL 3.0 | |
Log Service | |
OSS | |
SAP HANA | |
IBM DB2 | |
腳本模式輸入 | |
ClickHouse | |
Kafka | |
API | |
KingbaseES | |
GoldenDB | |
Impala | |
OpenGauss | |
Greenplum |
輸出組件
組件名稱 | 組件配置 |
MYSQL | |
Oracle | |
Vertica | |
FTP | |
AnalyticDB for MySQL2.0 | |
AnalyticDB for MySQL 3.0 | |
PolarDB | |
SAP HANA | |
IBM DB2 | |
腳本模式輸出 | |
ClickHouse | |
Kafka | |
KingbaseES | |
GoldenDB | |
Impala | |
StarRocks | |
Greenplum | |
Microsoft SQL Server | |
PostgreSQL | |
PolarDB-X(原DRDS) | |
MaxCompute | |
MongoDB | |
Elasticsearch | |
AnalyticDB for PostgreSQL | |
OSS | |
Teradata | |
OceanBase | |
Hologres | |
DataHub | |
DM | |
TiDB | |
GBase 8a | |
OpenGauss | |
API | |
SelectDB |
轉換組件
組件名稱 | 組件配置 |
字段選擇 | |
字段計算 | |
過濾轉換 | |
加密轉換 | |
解密轉換 |
流程組件
組件名稱 | 組件配置 |
限速 | |
條件分發 |
自定義組件
如需使用自定義組件,請先在Dataphin自定義組件后,再進行自定義組件的選取使用。具體操作,請參見新建離線自定義源類型。