使用數(shù)據(jù)集和變量
DataV-Note(智能分析)中的數(shù)據(jù)集分為數(shù)據(jù)庫、文件數(shù)據(jù)集和查詢結(jié)果集。數(shù)據(jù)庫和文件數(shù)據(jù)集是用于進行查詢分析的原始數(shù)據(jù);結(jié)果數(shù)據(jù)集是基于原始數(shù)據(jù)通過指定條件篩選、處理生成的結(jié)果數(shù)據(jù)。變量則是分析單元輸出結(jié)果的集合(例如,SQL查詢、過濾器生成的結(jié)果、控件輸出的參數(shù)等),可供SQL、Python等引用,構(gòu)建聯(lián)動查詢。本文為您介紹如何使用數(shù)據(jù)集和變量。
前提條件
已創(chuàng)建項目,詳情請參見創(chuàng)建項目。
進入項目編輯頁面
在
頁簽,鼠標懸停至目標項目,單擊編輯,進入該項目的編輯界面。在該頁面,您可按需創(chuàng)建數(shù)據(jù)集或使用變量。
創(chuàng)建數(shù)據(jù)集
在項目編輯頁面左側(cè)導航欄,默認展示數(shù)據(jù)集頁簽,您可按需連接數(shù)據(jù)庫、導入文件數(shù)據(jù)或生成查詢結(jié)果集。
連接數(shù)據(jù)庫
在查詢分析。
目錄,單擊圖標,即可按照界面指引創(chuàng)建數(shù)據(jù)源連接。連接數(shù)據(jù)庫后,可對相應數(shù)據(jù)進行支持連接RDS MySQL、PostgreSQL、Hologres等多種類型的數(shù)據(jù)庫,詳情請參見數(shù)據(jù)源管理。
僅連通性校驗成功的數(shù)據(jù)源會展示在數(shù)據(jù)庫目錄下,全量數(shù)據(jù)源列表請移至工作臺界面的數(shù)據(jù)源目錄查看。
導入文件數(shù)據(jù)
在查詢分析。
目錄,單擊圖標,即可按照界面指引上傳文件。導入文件后,可對相應數(shù)據(jù)進行支持上傳
CSV
、Excel
、JSON
格式數(shù)據(jù)文件,且文件大小不超過500MB
。對于
JSON
文件,目前僅支持使用數(shù)組類型的文件內(nèi)容。上傳的文件名稱必須在當前項目下唯一。
生成并使用查詢結(jié)果集
查詢結(jié)果集通常為分析報告最終需要展示的數(shù)據(jù),也可作為圖表、表格、地圖、交叉表進行可視化分析的輸入數(shù)據(jù)。
生成查詢結(jié)果集
您需先基于數(shù)據(jù)庫數(shù)據(jù)或文件數(shù)據(jù)進行查詢分析,該結(jié)果將自動生成查詢結(jié)果集。示例基于文件數(shù)據(jù)集生成查詢結(jié)果集。
可按需更改查詢結(jié)果集的類型,支持的類型如下:
普通視圖(View):依賴該視圖的查詢都將直接從源表(即文件數(shù)據(jù)集或數(shù)據(jù)庫的原始數(shù)據(jù))中獲取相應數(shù)據(jù)。
緩存視圖(CachedView):該視圖會將相關(guān)數(shù)據(jù)緩存至Note本地,用于加速查詢,減輕源表壓力。
Pandas的數(shù)據(jù)集(DataFrame):支持在Python分析單元中使用Pandas操作數(shù)據(jù)。
基于查詢結(jié)果集進行可視化分析
可按需創(chuàng)建可視化分析單元,選擇相應查詢結(jié)果集進行可視化展示分析。示例通過堆疊條形圖展示
retail
查詢結(jié)果集的數(shù)據(jù)。
管理數(shù)據(jù)集
在數(shù)據(jù)集列表,可執(zhí)行如下管理操作:
按需拷貝數(shù)據(jù)集表名、基于所選數(shù)據(jù)集創(chuàng)建SQL查詢、刪除數(shù)據(jù)集。
重要僅支持刪除文件數(shù)據(jù)集,刪除操作不可逆,請謹慎執(zhí)行。
查看數(shù)據(jù)庫表詳情。
結(jié)構(gòu):表的字段名稱、數(shù)據(jù)類型等信息,不同表的參數(shù)字段存在差異。
DDL:表的數(shù)據(jù)定義語言,僅供參考。
抽樣數(shù)據(jù):表的部分抽樣數(shù)據(jù),全量數(shù)據(jù)請在SQL分析單元中查看。
使用變量
在項目編輯頁面左側(cè)導航欄,單擊圖標,進入變量頁簽。當前項目中所有分析單元的輸出結(jié)果(例如,SQL查詢、過濾器生成的查詢結(jié)果集、控件輸出的參數(shù)等)將作為變量呈現(xiàn),可在SQL分析、Python分析、可視化分析中引用,構(gòu)建聯(lián)動查詢。