數據存儲
功能集 |
功能 |
功能描述 |
參考文檔 |
元數據存儲 |
寬表模型 |
寬表模型(WideColumn)是類Bigtable/HBase模型,可應用于元數據、大數據等多種場景。寬表模型通過數據表存儲數據,單表支持PB級數據存儲和千萬QPS。數據表具有Schema-Free、寬行、多版本數據以及生命周期管理特點,支持主鍵列自增、局部事務、原子計數器、過濾器、條件更新等功能。 |
|
多元索引 |
多元索引(Search Index)基于倒排索引和列式存儲,可以解決大數據的多維查詢和統計分析難題。當日常業務中有非主鍵列查詢、多列組合查詢、模糊查詢等多維查詢需求以及求最值、統計行數、數據分組等數據分析需求時,您可以將這些屬性作為多元索引中的字段并使用多元索引查詢與分析數據。 |
||
消息模型 |
消息(Timeline)模型是針對消息數據場景所設計的,能夠滿足消息數據場景對消息保序、海量消息存儲、實時同步的業務需求,同時支持全文檢索與多維度組合查詢。適用于IM、Feed流等消息場景。 |
||
物聯網存儲 |
時序模型 |
表格存儲的時序模型是針對時間序列數據的特點進行設計,適用于物聯網設備監控、設備采集數據、機器監控數據等場景,支持自動構建時序元數據索引、豐富的時序查詢能力等功能。時序模型通過時序表存儲時間序列數據,能提供高并發寫入和查詢以及PB級海量數據的低成本存儲。您還可以通過SQL查詢與分析時序數據。 |
|
分析模型 |
使用分析存儲(Analytical Store)功能,您可以低成本存儲時序數據以及快速查詢和分析時序數據。分析存儲功能主要用于時序數據長期存儲和分析場景。 |
時序分析存儲 | |
SQL查詢 |
數據映射 |
使用過程時請確保SQL中和數據表中字段數據類型相匹配。 |
SQL數據類型映射 |
DDL |
表格存儲支持的DDL操作,包括創建表的映射關系、創建多元索引的映射關系、更新映射表屬性列、刪除映射關系和查詢表的描述信息的操作。 |
DDL操作 | |
DQL |
表格存儲支持的DQL操作,包括查詢數據、聚合數據、全文檢索、多元索引數組和嵌套類型查詢、多元索引虛擬列、Join等操作。 |
DQL操作 | |
Database Administration |
表格存儲支持的Database Administration操作 ,包括查詢索引描述信息和列出表名稱列表的操作。 |
Database Administration | |
查詢優化 |
SQL查詢時支持通過索引選擇和計算下推實現數據查詢加速。您可以通過顯式訪問二級索引表進行索引查詢。對于多元索引,表格存儲提供了自動多元索引選擇策略和顯式訪問多元索引兩種方式。 多元索引提供了條件過濾、聚合、排序等功能,在創建多元索引后,系統能夠充分利用多元索引的計算能力,將部分SQL計算任務下推到多元索引執行,避免全表掃描,提高計算效率。 |
查詢優化 |
數據管理能力
功能集 |
功能 |
功能描述 |
參考文檔 |
數據管理 |
數據版本 |
最大版本數(Max Versions)表示數據表中的屬性列能夠保留數據的最大版本個數。當屬性列中數據的版本個數超過設置的最大版本數時,系統會自動異步刪除較早版本的數據。 為數據表配置最大版本數后,當您每次更新屬性列的值時,表格存儲均會為該值生成一個新版本,版本的值即為版本號(時間戳),單位為毫秒。 |
最大版本數 |
生命周期管理 |
數據生命周期是數據表的一個屬性,即數據的保存時間,單位為秒。當屬性列中數據的保留時間超過設置的TTL時,系統會自動異步清理超過該屬性列的數據。如果一行中所有屬性列中數據的保留時間均超過了TTL,則系統會自動異步清理該行數據。 |
數據生命周期 |
安全合規
功能集 |
功能 |
功能描述 |
參考文檔 |
訪問控制 |
身份管理 |
為確保您的阿里云賬號及云資源使用安全,如非必要都應避免直接使用阿里云賬號(即主賬號)來訪問表格存儲。推薦的做法是使用RAM身份(即RAM用戶和RAM角色)來訪問表格存儲。 |
身份管理 |
STS管理 |
相對于RAM提供的長效控制機制,STS提供的是一種臨時訪問授權,通過STS可以返回臨時的AccessKey和Token,這些信息可以直接發給臨時用戶用來訪問表格存儲。一般來說,從STS獲取的權限會受到更加嚴格的限制,并且擁有時間限制,因此即使這些信息泄露,對于系統的影響也很小。 |
RAM和STS介紹 | |
RAM Policy |
訪問控制RAM中的權限策略(RAM Policy)是一種基于用戶的授權策略,可以集中管理您的用戶(例如員工、系統或應用程序)以及控制用戶訪問資源的權限。 |
RAM Policy | |
Control Policy |
資源管理Resource Management中的資源目錄的管控策略(Control Policy)是一種基于資源結構(資源夾或成員)的訪問控制策略,可以統一管理資源目錄各層級內資源訪問的權限邊界。 如果希望對企業成員進行統一授權和管理,您可以開通資源目錄后通過資源目錄管控策略對企業成員所屬資源目錄進行權限配置和授權。 |
Control Policy | |
Network ACL |
表格存儲中的NetWork ACL是基于資源的網絡訪問控制功能,可以用于為單個實例配置網絡訪問方式。 |
Network ACL | |
Instance Policy |
表格存儲中的Instance Policy是基于資源的授權策略,可以用于為單個實例配置訪問權限。 |
Instance Policy | |
數據安全 |
服務端加密 |
為了保證表數據安全,表格存儲提供了數據落盤加密功能。您可以在創建數據表時配置數據表加密。 |
數據加密 |
傳輸加密 |
表格存儲支持TLS傳輸鏈路加密,表格存儲客戶端和服務端之間的通信會進行TLS數據傳輸加密。表格存儲支持通過自定義RAM Policy、Control Policy等方式限制用戶訪問表格存儲時使用的TLS版本。更高的TLS版本對應的傳輸加密算法更安全,推薦使用TLS 1.2及以上版本。 |
||
安全合規 |
審計日志 |
表格存儲審計日志集成了日志服務的日志查詢與分析、統計圖表、日志聚類等功能,支持通過日志記錄用戶對表格存儲實例中資源有修改影響的操作,例如創建數據表、創建時序表、創建索引等。審計日志可用于安全審計、合規性審計、故障排查等場景。 |
審計日志 |
監控與報警 |
監控與報警 |
通過查看表格存儲資源的監控信息,您可以了解資源的使用情況。通過為資源的重要監控指標設置報警規則,您還可以及時得知指標異常并快速處理異常。本文介紹了支持的監控項以及支持為監控指標設置的報警規則信息。 |
監控與報警 |
容災備份
功能集 |
功能 |
功能描述 |
參考文檔 |
備份 |
備份與恢復 |
為了防止由于誤刪、惡意篡改等導致重要數據不可用,您可以使用表格存儲數據備份功能備份實例中寬表數據,并在數據丟失或受損時及時恢復。 |
備份與恢復 |
高可用 |
同城冗余 |
為了實現實例數據的機房級容災,表格存儲提供了同城冗余功能。通過創建使用同城冗余的實例存儲數據,即使當由于斷網、斷電或者災難事件導致某個機房不可用時,表格存儲仍能繼續提供強一致性的服務。同城冗余功能確保了數據的高可用性和容災能力。 |
同城冗余 |
產品生態
功能集 |
功能 |
功能描述 |
參考文檔 |
數據可視化 |
DataV |
DataV可用于展示表格存儲數據表或者二級索引表中的數據,一般用于構建復雜的大數據處理分析展現的企業應用系統。 |
對接DataV |
Grafana |
Grafana可用于展示表格存儲數據表或者時序表中的數據。 |
對接Grafana | |
計算及分析生態對接 |
MaxCompute |
在同一個云賬號下實現表格存儲和MaxCompute之間的無縫連接。如果您在表格存儲中的數據有著獨特的結構,希望自定義開發邏輯來處理每一行數據,例如解析特定的JSON字符串,您可以使用用戶自定義函數UDF(User Defined Function)來處理表格存儲中的數據。 |
MaxCompute |
Spark |
使用Spark計算引擎時,支持通過E-MapReduce SQL或者DataFrame編程方式訪問表格存儲。 |
Spark/SparkSQL | |
Hive或者HadoopMR |
使用Hive或者HadoopMR訪問表格存儲中的數據。 |
Hive/HadoopMR | |
函數計算 |
通過函數計算訪問表格存儲,對表格存儲增量數據進行實時計算。 |
函數計算 | |
Flink |
通過實時計算Flink訪問表格存儲中的源表、維表或者結果表,實現大數據實時計算與分析。 目前數據表支持作為源表、維表或者結果表,時序表只支持作為結果表。 |
Flink | |
Presto |
使用PrestoDB對接表格存儲Tablestore后,基于PrestoDB on Tablestore您可以使用SQL查詢與分析Tablestore中的數據、寫入數據到Tablestore以及導入數據到Tablestore。 |
Presto | |
遷移同步 |
同步MySQL數據 |
您可以根據業務需求使用DataX、DTS、canal或者Tapdata Cloud工具將MySQL數據庫中的數據同步遷移到表格存儲(Tablestore)中。 |
同步MySQL數據 |
同步Kafka數據 |
基于Tablestore Sink Connector,您可以將Apache Kafka中的數據批量導入到表格存儲(Tablestore)的數據表或者時序表中。 |
同步Kafka數據 | |
同步Oracle數據 |
通過Tapdata Cloud的可視化界面,您可以將Oracle數據實時同步到表格存儲(Tablestore)中。 |
同步Oracle數據 | |
同步HBase數據 |
使用DataX將HBase數據庫中的全量數據同步到表格存儲(Tablestore)中。 |
同步HBase數據 | |
同步MaxCompute數據 |
如果需要將MaxCompute計算分析后的數據同步到表格存儲中存儲或者使用,您可以通過在DataWorks數據集成控制臺新建和配置離線同步任務來實現全量數據導出。全量數據導出到表格存儲后,您可以使用表格存儲查詢與分析數據。 |
同步MaxCompute數據 | |
同步到MaxCompute |
Tablestore中的增量數據及全量數據可以通過DataWorks的數據集成同步到MaxCompute中。 |
同步到MaxCompute | |
同步到OSS |
表格存儲中的全量數據以及增量數據可以通過DataWorks數據集成同步到對象存儲中備份和使用。 |
同步到OSS | |
同步到本地文件 |
表格存儲支持通過命令行工具或者DataX工具直接下載數據到本地文件。您也可以通過DataWorks工具將數據同步到OSS后再在OSS側下載數據到本地文件。 |
同步到本地文件 | |
數據湖投遞 |
數據湖投遞 |
表格存儲數據湖投遞可以全量備份或實時投遞數據到數據湖OSS中存儲,以滿足更低成本的歷史數據存儲,以及更大規模的離線和準實時數據分析需求。 |
數據湖投遞概述 |
數據湖計算分析 |
將表格存儲數據投遞到OSS后,使用EMR的JindoFS緩存模式連接OSS數據湖分析數據。 |
使用EMR | |
通道服務 |
通道服務 |
通道服務(Tunnel Service)是基于表格存儲數據接口上的全增量一體化服務。通道服務提供了增量、全量、增量加全量三種類型的分布式數據實時消費通道。通過為數據表建立數據通道,您可以簡單地實現對表中歷史存量和新增數據的消費處理。 |
通道服務 |
基礎產品能力
功能集 |
功能 |
功能描述 |
參考文檔 |
基礎概念 |
地域 |
地域(Region)是指阿里云物理數據中心所在的位置。表格存儲部署在多個地域中,您可以根據自身的業務需求創建不同地域中的表格存儲實例。 |
地域 |
實例 |
實例(Instance)是您使用和管理表格存儲服務的實體,每個實例相當于一個數據庫。表格存儲對應用程序的訪問控制和資源計量都在實例級別完成。 |
實例 | |
服務地址 |
每個表格存儲實例對應一個服務地址(Endpoint),應用程序進行表和數據操作時需要指定服務地址。 |
服務地址 | |
使用方式 |
控制臺 |
表格存儲通過控制臺完成時序模型和寬表模型的實例基礎操作、表操作、數據基本操作、SQL查詢相關操作等。 |
- |
SDK |
表格存儲提供了Java SDK、Go SDK、Python SDK、Node.js SDK、.NET SDK和PHP SDK的主流語言SDK供用戶使用。 |
- |
|
命令行工具 |
Tablestore CLI提供簡潔、方便的管理命令,支持Windows、Linux和Mac平臺。包括實例操作,寬表模型的數據表操作、數據操作、二級索引操作、多元索引操作、通道服務操作和SQL查詢以及時序模型的時序表操作、數據操作和SQL查詢功能。 |
- |
|
SQL |
通過SQL查詢功能,您可以對表格存儲中數據進行復雜的查詢和高效的分析,為多數據引擎提供統一的訪問接口。 |
- |