產品簡介
什么是AnalyticDB
AnalyticDB是阿里云自研的云原生實時數據倉庫,支持從OLTP數據庫和日志文件中實時寫入數據,并秒級完成PB級數據分析。AnalyticDB采用云原生存算分離的架構,存儲按量付費,計算彈性伸縮,同時具備離線處理與在線分析資源隔離的能力,滿足企業對于數據處理效率、成本控制、系統穩定性的要求。兼容MySQL、PostgreSQL和Spark生態。
AnalyticDB共有兩個引擎,分別為AnalyticDB for MySQL和AnalyticDB for PostgreSQL。
對比項 | AnalyticDB for MySQL | AnalyticDB for PostgreSQL | |
生態 | 高度兼容MySQL 高度兼容Spark | 100%兼容PostgreSQL 高度兼容Oracle | |
架構 | 計算存儲分離架構 | ||
擴展性 | 共同點 | 垂直變配 水平擴展 | |
差異 | 支持Multi-Cluster模型實現資源自動彈性 支持MIN-MAX模型實現資源分時彈性和自動彈性 | 支持定時任務實現定時的自動彈性變配 支持Serverless形態實現按需自動彈性變配 | |
重點功能 | 共同點 | 向量檢索 全文檢索 離線批處理 實時物化視圖 | |
差異 | 數據湖 Spark離線處理 查詢性能的智能診斷與調優 | RAG應用 時空分析 | |
應用場景 | 共同點 | 實時數倉 實時日志分析 商業智能報表 | |
差異 | 精準營銷 多源聯合分析 大數據存儲分析 離線數據加速 其它數據湖或數據倉庫業務遷移(Databricks/Athena/自建Spark/Presto等) | 一站式搭建大模型應用 企業專屬知識庫 GIS 時空大數據分析 離在線一體數據分析 其他云數據倉庫業務遷移(Greenplum、Redshift、Synapse、Snowflake、BigQuery等) | |
客戶行業 | 游戲、零售、汽車 | 零售、電商、教育 | |
節省成本 | 共同點 | 按實際數據量收取數據存儲費用 冷熱數據分離存儲,降低數據存儲的成本 根據規律的業務波峰波谷,自動定時彈性擴縮資源,既保障流量高峰的資源充足,又避免高峰過后的資源閑置浪費 | |
差異 | 根據業務的實際負載,自動彈性擴縮資源 | 根據實際業務需要,手動啟動或暫停實例 |
AnalyticDB for MySQL簡介
企業版是湖倉版和數倉版的融合升級版本,產品特性與湖倉版相同。它既支持彈性模式下的資源組隔離、資源靈活彈性、冷熱數據分層存儲等能力,也具備預留模式下的高吞吐實時寫入和高并發在線查詢能力。
企業版為多副本形態,底層為多副本存儲,具備分布式能力,提供高可用服務,適用于各類型企業的開發、測試和生產環境。
數據源
數據管道APS可以一鍵低成本接入數據庫、日志、大數據中的數據。
存儲層+計算層
支持自研引擎,羲和計算引擎和玄武存儲引擎。新增集成的開源引擎,Spark計算引擎和Hudi存儲引擎。可以借助開源的能力為您提供更豐富的數據分析場景。同時打通自研和開源引擎之間的互相訪問,提供更一體化的體驗。
存儲層:只需一份全量數據,滿足離線和在線場景。
在線分析場景需要數據盡量在高性能存儲介質上提高性能,離線場景需要數據盡量在低成本存儲介質上降低存儲成本。為滿足不同場景需求,首先將一份全量數據存儲在低成本高吞吐存儲介質中,低成本離線處理場景直接讀寫低成本存儲介質中的數據,可降低數據存儲和數據IO成本,保證高吞吐。其次將實時數據存儲在單獨的存儲IO節點(EIU)上,保證行級的數據實時性,同時對全量數據構建索引,并通過緩存能力對數據進行加速,滿足百毫秒級高性能在線分析場景。
計算層:羲和計算引擎,智能選擇計算模式。開源Spark計算引擎,滿足多種場景。
羲和計算引擎同時提供MPP和BSP兩種模式。MPP模式是一種流式計算模式,不適合離線處理低成本和高吞吐場景。BSP模式,通過DAG進行任務切分,分批調度,滿足有限資源下大數據量計算,支持計算數據落盤。羲和計算引擎提供自動切換能力,即當查詢使用MPP模式無法在一定耗時內完成時,系統會自動切換為BSP模式進行執行。
開源Spark計算引擎可以滿足更復雜的離線處理場景和機器學習場景。Spark計算層和存儲層互相打通,您可以使用計算層資源來處理存儲層數據,在創建和配置Spark資源組時更容易。
訪問層
訪問層通過統一計費單位、統一元數據和權限、統一開發語言、統一傳輸鏈路,提升開發效率。
更多關于云原生數據倉庫 AnalyticDB MySQL 版產品系列(基礎版、湖倉版、數倉版)的介紹,請參見產品系列。
AnalyticDB for PostgreSQL簡介
AnalyticDB for PostgreSQL分為存儲彈性模式和Serverless兩種產品形態。存儲彈性模式是基于ECS+ESSD云盤的Shared-Nothing架構采用MPP架構,Serverless是基于ECS+本地緩存+OSS遠端存儲的存儲計算分離的Shared-Storage架構。
AnalyticDB for PostgreSQL實例包含一個協調節點(又稱Master節點)和多個工作節點(又稱Segment節點)。協調節點負責集群的元數據管理、負載均衡等。工作節點負責數據處理,工作節點內部包含Orca優化器、自研的Laser執行引擎和Beam存儲引擎,實現查詢的高性能,同時結合IMV實時物化視圖組件,打造實時數倉。工作節點掛載的ESSD云盤負責熱數據存儲,而冷數據則存儲在OSS中,通過冷熱數據分層存儲,兼顧查詢性能和存儲成本。工作節點的計算資源和存儲資源,可獨立擴縮容。