阿里云數據湖構建(Data Lake Formation,簡稱DLF)是一款全托管的統一元數據和數據存儲及管理平臺,旨在為客戶提供元數據管理、存儲管理、權限管理、存儲分析和存儲優化等功能。DataWorks數據集成支持寫入DLF2.0數據源,本文將為您介紹DLF的使用詳情。
使用限制
僅支持數據集成使用。
創建數據源
進入數據源頁面。
登錄DataWorks控制臺,切換至目標地域后,單擊左側導航欄的 ,在下拉框中選擇對應工作空間后單擊進入管理中心。
進入工作空間管理中心頁面后,單擊左側導航欄的
,進入數據源頁面。
單擊新增數據源按鈕,搜索并選擇Data Lake Formation 2.0,來創建數據源,可參考以下表格內容:
參數
說明
數據源名稱
可自定義數據源名稱。數據源名稱工作空間內唯一;必須以字母、數字、下劃線組合,且不能以數字和下劃線開頭。
配置模式
僅支持阿里云實例模式。
訪問身份
可選擇如下內容:
阿里云主賬號。
阿里云RAM子賬號。
阿里云RAM角色。
可按需求進行選擇。
DLF數據目錄(Catalog)
默認加載與DataWorks同地域下的DLF數據目錄。
數據庫名稱
選擇數據目錄下的數據庫。
以上內容配置完成后,需在連接配置模塊測試該數據源與Serverless資源組的連通性,若連通性測試為可連通,即可單擊完成編輯,完成該數據源的創建。若連通性測試失敗,則需參考網絡連通進行排查。
創建數據集成任務
在DataWorks的數據集成中,支持使用Data Lake Formation 2.0 數據源,詳情可參見:同步數據至Data Lake Formation 2.0。
文檔內容是否對您有幫助?