本文將為您介紹DataWorks V3.0版本的發布歷史及新增特性。
DataWorks V3.0發布
發布版本:DataWorks V3.0
發布時間:2019年12月18日
發布范圍:全球所有已開通DataWorks的地域
發布內容:DataWorks V2.0僅支持MaxCompute計算引擎,DataWorks V3.0全新升級了多引擎架構,在MaxCompute的基礎上,新增開源大數據引擎E-MapReduce、交互式分析和圖計算服務(Graph Compute)等引擎服務。
同一個工作空間支持多個引擎實例,方便對業務、任務和表進行統籌管理。
DataWorks V3.0核心特性
支持多種計算引擎
DataWorks V3.0全新升級了多引擎插件化架構,在DataWorks V2.0版本僅支持MaxCompute計算引擎的基礎上,新增開源大數據引擎E-MapReduce、交互式分析和圖計算服務(Graph Compute)等引擎服務。
MaxCompute:大數據計算服務MaxCompute(原ODPS)是一種快速、完全托管的EB級大數據計算引擎,是大規模離線數據倉庫的核心引擎。MaxCompute是DataWorks最早支持,且最成熟完備的計算引擎,目前已基本覆蓋MaxCompute的所有功能。詳情請參見離線計算MaxCompute。
E-MapReduce:E-MapReduce(Elastic MapReduce,簡稱EMR)構建在阿里云云服務器ECS上,基于開源的Apache Hadoop和Apache Spark,讓您可以方便地使用Hadoop和Spark生態系統中的其它周邊系統(例如Hive),來分析和處理自己的數據的大數據引擎服務。
DataWorks V3.0全面支持EMR引擎的相關功能,包括元數據、數據地圖、數據血緣、數據開發、任務調度、任務運維監控和數據質量控制等。詳情請參見E-MapReduce。
交互式分析:交互式分析(Interactive Analytics)是一種全面兼容PostgreSQL協議,并與大數據生態無縫打通的實時交互式分析產品。
交互式分析支持對萬億級數據進行高并發、低延時、多維分析透視和業務探索,可以讓您快速對接現有的BI工具。
DataWorks V3.0全新推出一站式OLAP開發平臺Holo Studio,為您提供標準化、無門檻的開發管理服務和一站式實時數倉構建服務,以及高效、便捷的開發服務,提升開發效率。詳情請參見什么是實時數倉Hologres。
圖計算服務:圖計算服務(Graph Compute,簡稱GCS)是新一代一站式圖數據管理和分析平臺,具有數據加載快、規模可擴展、查詢延時低(毫秒級)、離線在線混合引擎和共享存儲等優勢。
DataWorks V3.0全新推出圖計算開發平臺Graph Studio,為圖應用開發者提供實例建模、數據導入、數據查詢(Gremlin)、可視化分析等一站式的開發服務。詳情請參見圖計算服務Graph Compute。
支持多個引擎實例
DataWorks V2.0的一個工作空間只能支持一個引擎實例。例如,對于MaxCompute引擎,一個工作空間僅支持創建一個MaxCompute項目。DataWorks V3.0的一個工作空間支持創建多個引擎實例(目前僅DataWorks專業版及以上版本支持),您可以更靈活地對業務所需要的計算引擎、計算任務和數據表等,進行統一管理。
任務資源組編排
DataWorks V3.0將全新推出任務資源組編排,即提供批量設置任務資源組的功能,方便對任務資源組進行快速、批量調整。例如,從獨享資源組批量切換至Serverless資源組。
工作空間導入導出
DataWorks V2.0支持工作空間備份恢復,DataWorks V3.0升級該功能,推出更加靈活的導入導出工具。支持靈活選擇導入或導出工作空間內的任務節點、表DDL、資源、函數和數據源等內容,以便您遷移工作空間的內容,或快速初始化工作空間。