本文將介紹云原生數據倉庫AnalyticDB PostgreSQL版的典型場景及產品功能優勢。
典型場景
- 數據倉庫服務
您可以通過數據傳輸服務(DTS)或數據集成服務(DataX),將云數據庫(例如RDS、PolarDB)或自建數據庫批量同步到云原生數據倉庫AnalyticDB PostgreSQL版。云原生數據倉庫PostgreSQL版支持對海量數據的復雜ETL進行處理,這些操作任務也可以被DataWorks調度。同時它還支持高性能的在線分析能力,可以通過Quick BI、DataV、Tableau、帆軟等即時查詢數據,并將數據以報表形式展現。
- 大數據分析平臺
對于MaxCompute、Hadoop和Spark中保存的海量數據,可通過采用數據集成服務(DataX)或通過對象存儲服務(OSS),快速批量導入到云原生數據倉庫AnalyticDB PostgreSQL版,幫助您實現高性能分析處理和在線數據探索。
- 數據湖分析
云原生數據倉庫AnalyticDB PostgreSQL版可以通過外部表機制,高并行直接訪問海量云存儲OSS上的數據,構筑阿里云統一數據湖分析平臺。
產品功能優勢
針對主要的OLAP業務,云原生數據倉庫AnalyticDB PostgreSQL版具備以下優勢。
- ETL離線數據處理
面對復雜SQL優化和海量數據大規模聚合分析等挑戰,云原生數據倉庫AnalyticDB PostgreSQL版具有如下技術優勢:
- 支持標準SQL、OLAP窗口函數和存儲過程。
- ORCA分布式SQL優化器,復雜查詢免調優。
- MPP多節點全并行計算,PB級數據秒級響應。
- 基于列存儲的高性能大表掃描,極高壓縮比。
- 在線高性能查詢
面對任意維度數據即時探索和數據實時入庫更新等挑戰,云原生數據倉庫AnalyticDB PostgreSQL版具有如下技術優勢:
- 高吞吐數據寫入及更新(如INSERT、UPDATE、DELETE)。
- 行存儲及多種索引(如B-tree、Bitmap),點查詢毫秒級返回。
- 支持分布式事務,標準數據庫隔離級別,支持HTAP混合負載。
- 多模數據分析
面對多種非結構化數據源的挑戰,云原生數據倉庫AnalyticDB PostgreSQL版具有如下技術優勢:
- 支持PostGIS插件擴展,實現地理數據分析處理。
- 通過MADlib插件擴展,內置多種機器學習算法,實現AI Native DB。
- 支持通過向量檢索,實現非結構化數據(如圖片、語音、文本)的高性能檢索分析。
- 支持JSON等格式,支持日志等半結構化數據處理分析。