本文為您介紹云數據庫ClickHouse產品中涉及的一些基本術語和概念,以便于您更好地理解云數據庫ClickHouse產品。
通用概念
地域(Region)
云數據庫ClickHouse的服務器的地理位置。在購買云數據庫ClickHouse服務時,您需指定服務地域,并且地域一旦指定后,無法進行更改。
可用區(Zone)
在同一地域下,電力和網絡隔離的物理區域。可用區之間內網互通,且內網絡延時更小。
數據庫(Database)
數據庫是云數據庫ClickHouse集群中的最高級別對象,其由表(Table)、列(Column)、視圖(View)、函數、數據類型等組成。
社區兼容版
ClickHouse集群(Cluster)
在物理構成上,ClickHouse集群由多個ClickHouse Server實例組成,形成一個分布式數據庫。這些ClickHouse Server根據采購規格的不同,可能包含一個或多個副本(Replica)以及一個或多個分片(Shard)。
在邏輯構成上,一個ClickHouse集群可以包含多個數據庫(Database)對象。
副本配置(Edition)
ClickHouse集群包含如下副本。
雙副本版:每個節點包含兩個副本,當某個副本的服務不可用時,同一分片的另一個副本仍可持續提供服務。
單副本版:每個節點只有一個副本,當該副本的服務不可用時,將導致整個集群的不可用。若要集群繼續提供穩定服務,只能等待該副本完全恢復服務狀態。
雙副本版的資源以及對應的購買成本都是單副本版的2倍。
由于底層云盤提供高可靠保證,即便是單副本版也能確保數據不會丟失。
分片(Shard)
在超大規模海量數據處理場景下,單臺服務器的存儲與計算資源可能會成為瓶頸。為了進一步提高服務效率,云數據庫ClickHouse將海量數據分散存儲至多臺服務器上,每臺服務器只存儲和處理海量數據的一部分。在這種架構下,每臺服務器被稱為一個分片(Shard)。
副本(Replica)
為了在異常情況下保證數據的安全性和服務的高可用性,云數據庫ClickHouse提供了副本機制,將單臺服務器的數據冗余存儲在兩臺或多臺服務器上。
表(Table)
表用于存儲數據的基本結構。它由行和列組成,其中每一列表示一個字段,每一行表示一條記錄。
從數據分布角度來看,云數據庫ClickHouse的表可以分為兩種類型:本地表和分布式表。
表類型 | 說明 | 區別 |
本地表(Local Table) | 數據只會存儲在當前寫入的節點上,不會被分散到多臺服務器上。 |
|
分布式表(Distributed Table) | 本地表的集合。 它將多個本地表抽象為一張統一的表,對外提供寫入和查詢功能。當寫入數據時,數據會被自動分發到集合中的各個本地表中;當查詢數據時,集合中的各個本地表都會被分別查詢,并且把最終結果匯總后返回。 |
從存儲引擎角度來看,云數據庫ClickHouse的表也可以分為兩種類型:單機表和復制表。
表類型 | 說明 | 區別 |
單機表(Non-Replicated Table) | 數據只會存儲在當前服務器上,不會被復制到其他服務器,即只有一個副本。 |
|
復制表(Replicated Table) | 數據會被自動復制到多臺服務器上,形成多個副本。 |
Data part
Data part是指存儲在硬盤上的一個數據片段,它是ClickHouse表數據存儲的基本單位。每次向ClickHouse表寫入數據時,都會生成一個新的數據分片。每個數據分片都是自包含的,包括了該部分數據的所有列和索引,且保持著數據的有序性。數據分片的設計支持了高效的合并和壓縮操作,這對于ClickHouse的高性能查詢處理至關重要。
企業版
ClickHouse集群
ClickHouse集群包含若干單位計算資源和存儲資源,能夠提供ClickHouse引擎數據存儲和分析服務的PAAS服務。
Worker節點
Worker節點是ClickHouse集群內部的副本節點,參與引擎計算的實際資源。
CCU
CCU(ClickHouse Compute Unit)是ClickHouse集群計算資源的計量和計費單位,1 CCU對應資源為1 Vcpu 4 GiB。標準計費單位:CCU/分鐘。
計算資源自動彈性
計算資源自動彈性(Autoscaling)是計算資源按照CCU粒度進行資源彈性擴展,根據Mem的使用情況進行自動的CCU擴展。
彈性資源設置區間
彈性資源設置區間是用戶設置CCU使用區間,彈性擴縮必須保持在用戶設置的資源區間內,不能小于最小值且不能大于最大值。
存儲資源
存儲資源是企業版本采用的共享存儲方案,按需付費。