DataWorks的數據分析功能為企業提供了全面的數據分析和服務共享能力,可便捷地連接多種數據源、支持SQL查詢,并提供電子表格等多樣化的數據分析工具,以滿足企業日常的數據提取和分析需求。本文將通過MaxCompute引擎在SQL查詢中對公共數據集進行查詢和分析,介紹數據分析的基本使用。
權限說明
已擁有數據分析權限,查看角色權限列表請參見:數據分析預設角色權限列表。
角色授權,授權操作請參見:添加空間成員并管理成員角色權限。
背景信息
DataWorks的數據分析,為您提供了多種業務場景下的公共數據集。本文使用阿里電商數據集(commerce_ali_e_commerce
表),帶您快速體驗數據分析的相關功能。
阿里電商數據集介紹:統計淘寶不同時間段的訂單詳情。
表中記錄了
2017年11月25日
至2017年12月3日
之間,約100萬用戶的隨機行為(包括點擊、購買、加購、喜歡)。用戶數量
987,994
,商品數量4,162,024
,所有行為數量100,150,807
。
數據分析功能模塊介紹,詳情請參見數據分析概述。
公共數據集支持地域:華東2(上海)、華北2(北京)、華南1(深圳)、華東1(杭州)、西南1(成都)、華北3(張家口)、華北6(烏蘭察布)。
前提條件
已新增MaxCompute數據源。詳情請參見創建MaxCompute數據源。
操作流程
進入數據分析-SQL查詢
登錄DataWorks控制臺,切換至目標地域后,單擊左側導航欄的 ,在下拉框中選擇對應工作空間后單擊進入SQL查詢。
步驟一:數據查詢
本文示例基于阿里電商數據集(commerce_ali_e_commerce
),該表統計淘寶不同時間段的訂單詳情,將使用SQL查詢功能,對數據集做查詢和排序操作,并對查詢的結果進行分析和共享。
進入SQL查詢。
您可以通過如下兩種方式進入:
創建臨時文件。
在頁面左側區域,單擊我的文件右側的圖標,選擇新建文件,根據界面提示創建SQL查詢文件。更多創建SQL查詢文件方式請參見:創建SQL查詢。
說明本文使用DataWorks提供的公共數據集。首次進入SQL查詢,您可在歡迎頁單擊
,即可生成用于統計阿里電商數據集(commerce_ali_e_commerce
)。更多公共數據集,您可前往
,在公共數據目錄中查看。
選擇SQL執行數據源。
在臨時文件編輯頁面,單擊右上角的圖標,選擇當前SQL查詢需要查詢的工作空間、引擎類型及數據源。本文示例選擇已創建的MaxCompute數據源。
編輯任務代碼并執行。
在臨時查詢文件的代碼編輯區域,編輯并運行如下代碼。
基于公共數據集,統計淘寶不同時間段訂單數量并排序。
SET odps.namespace.schema = true ; SELECT CASE WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 0 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 3 THEN '0點-3點' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 4 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 7 THEN '4點-7點' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 8 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 11 THEN '8點-11點' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 12 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 15 THEN '12點-15點' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 16 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 19 THEN '16點-19點' WHEN CAST(SUBSTR(behavior_time,12) AS BIGINT) >= 20 AND CAST(SUBSTR(behavior_time,12) AS BIGINT) <= 23 THEN '20點-23點' END AS 下單時間 ,COUNT(*) AS 訂單數 FROM bigdata_public_dataset.commerce.commerce_ali_e_commerce GROUP BY 下單時間 ORDER BY COUNT(*) DESC LIMIT 100 ;
查看查詢結果。
點擊圖標,運行SQL代碼。
步驟二:數據分析
在步驟一的查詢結果頁,在左側導航欄中選擇圖標,單擊編輯圖標,進入圖表編輯頁面。您可根據業務需求編輯圖表信息。
示例一:查看不同時間段的訂單數總和
業務名稱修改。
雙擊表上方名稱,可修改圖表名稱。
樣式設置。
單擊右側樣式設置,選擇
,單擊更換。選擇
中選擇詳細,可以顯示軸標題。也可在圖表樣式頁簽中,進行修改。
數據設置。
單擊左側數據設置,以拖拽的方式,將下單時間拖拽到Y軸,將訂單數拖拽到X軸。
說明X軸默認聚合方式是求和。您也可以根據業務需求進行調整。
示例二:查看不同時間段的訂單數分布
業務名稱修改。
雙擊表上方名稱,可修改圖表名稱。
樣式設置。
單擊右側樣式設置,選擇
,單擊更換。選擇
中選擇詳細。
數據設置。
單擊左側數據設置,以拖拽的方式,將下單時間拖拽到類,將訂單數拖拽到值。
說明值默認聚合方式是求和。在值的下拉菜單中選擇
,您也可以根據業務需求進行調整。
您也可以使用DataWorks提供的電子表格進行數據的展示分析,詳情請參見電子表格。
步驟三:數據分享
您可將SQL查詢的結果,以電子表格的方式分享給其他用戶實現數據在線流動。