Tez是Apache構建在Hadoop之上的支持分布式DAG(Directed Acyclic Graph)的計算框架,支持通過復雜的DAG描述并處理大數據任務。
背景信息
Tez主要使用在Apache Hive中,作為Hive的一種運行時引擎,可以優化Hive SQL的查詢引擎。與Hive On MR(MapReduce)相比,Hive On Tez具有更好的查詢性能和穩定性。
Hive基于MapReduce提交任務和基于Tez提交任務流程圖如下所示:
Tez的詳細信息,請參見Apache TEZ。
開啟Tez引擎
Hive支持使用Tez引擎執行SQL任務,在執行任務前您可以按照如下操作手動開啟Tez引擎。
進入集群服務頁面。
登錄EMR on ECS。
在頂部菜單欄處,根據實際情況選擇地域和資源組。
在EMR on ECS頁面,單擊目標集群操作列的集群服務。
在集群服務頁面,單擊Hive服務區域的配置。
修改并保存配置。
在搜索框中輸入hive.execution.engine參數。
修改hive.execution.engine的值為tez,單擊保存。
在彈出的對話框中,輸入執行原因,單擊保存。
重啟Hive。
在集群服務頁面,選擇右上角的 。
在彈出的對話框中,輸入執行原因,單擊確定。
在確認對話框中,單擊確定。
訪問Tez Web UI
在E-MapReduce控制臺的訪問鏈接與端口頁面,單擊TEZ UI所在行的鏈接,即可訪問Tez Web UI。
訪問Tez Web UI的詳情,請參見訪問鏈接與端口。
文檔內容是否對您有幫助?