本文為您介紹如何使用HoloWeb,通過可視化的方式快捷導入MaxCompute數據。
前提條件
存在已登錄實例,請參見登錄實例。
背景信息
HoloWeb支持一鍵同步MaxCompute數據功能,您可以使用可視化方式導入MaxCompute表數據并進行查詢。該方式比創建外部表直接查詢數據的性能更好。
操作步驟
在頂部菜單欄左側,選擇相應的地域。
單擊前往HoloWeb,進入HoloWeb開發頁面。
在HoloWeb開發頁面的頂部菜單欄,選擇 ,單擊一鍵MaxCompute數據導入。
配置新建MaxCompute數據導入頁面的各項參數。
參數描述如下表所示。
類別
參數
描述
選擇實例
實例名
已登錄的實例名稱。
MaxCompute 源表
項目名
MaxCompute的項目名稱。
Schema Name
MaxCompute的Schema名稱,對于使用兩層模型的MaxCompute項目,默認不展示;對于使用三層模型的MaxCompute項目,此處可下拉選擇當前項目下有權限的所有Schema。
表名
MaxCompute的表名稱,支持基于前綴模糊搜索。
Hologres 目標表
數據庫名
選擇內部表所在的Hologres數據庫名稱。
Schema Name
Hologres的Schema名稱。
默認為public Schema,您也可以選擇其他有權限的Schema。
表名
新建的Hologres內部表名稱。
選擇MaxCompute表后,將會自動填入MaxCompute表名稱,您也可以手動重命名。
目標表描述
新建的Hologres內部表描述,可自定義修改。
參數設置
GUC參數
輸入需要設定的GUC參數。GUC參數詳情請參見GUC參數。
導入設置
字段
需要導入的MaxCompute表字段。
您可以選擇導入部分或全部字段。
分區配置
分區字段
選擇分區字段,Hologres將會默認將表創建為分區表。
Hologres僅支持一級分區。如果您需要導入MaxCompute的多級分區,則在Hologres中設置一級分區即可,其余分區自動映射為Hologres的普通字段。
業務日期
如果MaxCompute表使用日期進行分區,則您可以選擇具體的分區日期,系統將會導入指定日期的數據至MaxCompute表。
索引配置
存儲模式
列存,適用于各種復雜查詢。
行存,適用于基于主鍵的點查詢和Scan。
行列共存,支持行存和列存的所有場景,以及非主鍵點查的場景。
如果不指定存儲模式,則默認為列存。
表數據生命周期
表數據的生命周期。默認為永久存儲。
指定生命周期后,如果數據在指定時間內未被修改,則引擎將會在到期后的某一個時間段刪除數據。
Binlog
是否開啟Binlog,詳情請參見訂閱Hologres Binlog。
Binlog生命周期
Binlog的TTL,默認為30天,即默認值為2592000秒。
分布列
Hologres會按照分布列指定的列將數據shuffle到各個Shard,同樣的數值會在同樣的Shard中。以分布列做過濾條件時,可以大大提高執行效率。
分段列
您可以指定部分列作為分段鍵Segment_key。當查詢條件包含分段列時,您可以通過分段鍵快速查找相應數據的存儲位置。
聚簇列
您可以指定部分列作為聚簇索引Clustering_key。索引的類型和列的順序密切相關。聚簇索引幫助您加速執行索引列的Range和Filter查詢。
字典編碼列
Hologres支持為指定列的值構建字典映射。字典編碼可以將字符串的比較轉換為數字的比較,加速Group By和Filter查詢。
默認設置所有text列至字典編碼列中。
位圖列
Hologres支持在位圖列構建比特編碼。位圖列可以根據設置的條件快速過濾字段內部的數據。
默認設置所有text列至位圖列中。
SQL Script為您自動解析當前可視化操作對應的SQL語句。
單擊右上角的提交。