本文介紹如何通過Alibaba Lindorm擴展云數據庫Cassandra的性能。
Alibaba Lindorm簡介
Alibaba Lindorm是一款適用于任何規模、多種模型的云原生數據庫服務,支持海量數據的低成本存儲處理和彈性按需付費,提供寬表、時序、搜索、文件等多種數據模型,兼容HBase、Cassandra、Phoenix、OpenTSDB、Solr、SQL等多種開源標準接口,是互聯網、IoT、車聯網、廣告、社交、監控、游戲、風控等場景首選數據庫,也是為阿里巴巴核心業務提供關鍵支撐的數據庫之一。
Alibaba Lindorm基于存儲計算分離、多模共享融合的云原生架構,具備彈性伸縮、低成本、簡單易用、開放、穩定等優勢,適合元數據、日志、賬單、標簽、消息、報表、維表、結果表、Feed流、用戶畫像、設備數據、監控數據、傳感器數據、小文件、小圖片等數據的存儲和分析。其核心能力包括:
- 融合多模:支持寬表、時序、搜索、文件四種模型,提供統一聯合查詢和獨立開源接口兩種方式,模型之間數據互融互通,幫助應用開發更加敏捷、靈活、高效。
- 極致性價比:支持千萬級高并發吞吐、毫秒級訪問延遲,并通過高密度低成本存儲介質、智能冷熱分離、自適應壓縮,大幅減少存儲成本。
- 云原生彈性:支持計算資源、存儲資源獨立彈性伸縮,并提供按需即時彈性、按使用量付費的Serverless服務。
- 開放數據生態:提供簡單易用的數據交換、處理、訂閱等能力,能夠高度兼容MySQL、Spark、Flink、Kafka等系統。
開源Cassandra挑戰
開源Cassandra是基于Amazon DynamoDB和Google Bigtable設計的一款分布式NoSQL數據庫,具備無中心、一致性可調、提供類SQL查詢語言CQL等優點。但在實際使用中,Cassandra存在一些難以解決的挑戰。比如Cassandra存儲和計算不分離,一旦需要擴容,需要搬遷數據,擴容持續時間長,無法快速應對業務突發流量。而Lindorm是存儲計算分離架構,可以實現快速彈性。
另外,Cassandra 需要定期對所有副本進行全量數據修復,否則會出現”幽靈key“等問題,但是修復過程會因為消耗大量系統資源從而影響服務穩定性。而Lindorm由底層的存儲組件負責一致性,當您的數據寫入時,就會按照您設定的副本數寫入,不會有數據不一致問題,也不用定期修復。
Lindorm For Cassandra特性
- 更強性能:相比開源Cassandra,Lindorm For Cassandra在大規模數據下吞吐量更高,延遲更低。
- 透明冷熱分離:Lindorm For Cassandra采用自由設置冷熱的存儲介質、壓縮算法,減少冷數據存儲成本,提升熱數據訪問性能,實現一體化冷熱分離、數據自動分層。
- 按需計費:Lindorm for Cassandra提供集群版和serverless版產品形態,serverless版采用serverless式免資源管理,根據業務需求量彈性響應,按請求次數、實際數據庫量計費,實現簡單易用、經濟高效、按需彈性的計費特性。
- 搜索寬表一體化:Lindorm for Cassandra 通過全文索引加速寬表引擎查詢,對外統一提供CQL語言的訪問方式。
- 豐富的數據通道:Lindorm for Cassandra具備豐富的數據通道,比如搜索引擎、在線事物數據庫、數倉、日志隊列等。
- 更多企業級特性:Lindorm for Cassandra具備更多的企業級特性,詳情請參見下圖。更多企業級特性請參考Lindorm產品首頁。