如何選擇阿里云存儲服務
本文從了解存儲服務、選型的諸多考慮維度、各種存儲服務的優勢及使用場景等方面向您完整闡述如何選擇合適的阿里云存儲服務。
介紹
阿里云提供了一系列低成本、高可靠、高可用的存儲服務,用于存儲、訪問、保護和分析您的數據。存儲服務的選型合適與否,會直接影響到系統性能及穩定性等。但做出最佳選擇,需要您對自己的業務系統的存儲需求非常清楚,同時對阿里云眾多存儲產品有全面的了解,并結合服務形態、業務發展、成本預算等維度進行綜合考慮。
這篇決策指南將引導您了解阿里云的存儲服務及在選型過程中需要考慮的關鍵因素,幫助您更好地選擇和使用合適的存儲服務。
了解存儲服務
數據是系統服務、數據分析以及機器學習的基石。一個卓越云架構,為了達到最佳的性能狀態,可能會同時使用多種存儲服務。
技術人員在大多數情況下,會根據已有、或者自己熟悉的存儲方案來選擇合適的云存儲服務。這樣更容易實現數據遷移。
例如阿里云提供的這些存儲服務,或許是您原本熟悉或正在使用的存儲方案:
文件存儲 NAS:跟NAS設備一樣,支持NFS和SMB協議文件系統,兼容POSIX標準,可根據操作系統(Linux/Unix、Windows)選擇合適的文件協議。
文件存儲 HDFS:完全兼容標準HDFS協議接口,使您無需對現有大數據分析應用做任何修改,即可使用具備無限容量及性能擴展、單一命名空間、高可靠和高可用的分布式文件系統。
選型考慮
如果您正在考慮選擇使用哪一款阿里云存儲服務,可能是因為您需將應用遷移上云,或在云上開發新應用。在遷移上云的場景下,對遷移源頭、使用場景、數據類型和可用網絡資源的了解和分析非常重要。
在作出最終選擇之前,建議您先從以下維度進行考慮:
存儲協議
阿里云的存儲服務支持多種主流的存儲協議,協議及支持的云產品如下表所示。
協議類型 | 支持的產品 |
iSCSI協議 | 塊存儲、云存儲網關 |
NFS協議 | 文件存儲NAS、文件存儲CPFS、云存儲網關 |
SMB協議 | 文件存儲NAS、云存儲網關 |
HTTP/HTTPS協議 | 對象存儲、表格存儲 |
HDFS協議 | 文件存儲HDFS |
DBFS協議 | 數據庫文件存儲DBFS |
您可根據需要的協議選擇存儲服務。
數據共享
不同的數據可能會以不同的方式在不同的地方被使用,有的只需要在任意一臺機器上進行分析處理即可,有的則需要在多臺終端機器之間進行共享,有的甚至需要進行大范圍的內容分發,您可根據不同的業務場景進行選擇。
共享方式 | 支持的產品 |
無需共享 | 塊存儲EBS |
多臺機器共享 | 文件存儲NAS、文件存儲CPFS、文件存儲HDFS、數據庫文件存儲DBFS |
大范圍分發 | 對象存儲OSS、表格存儲TableStore |
塊存儲EBS是裸磁盤,掛載到ECS后,通常無法進行共享讀取。
文件存儲NAS可由上萬個ECS或容器通過POSIX標準并發讀取相同文件。
OSS可由數百萬個客戶端通過SDK、RESTful API并發讀取文件。
性能
性能是在存儲服務選型時需要重點關注的因素,如IOPS、延遲、吞吐量等。您可以參考如下方法對業務進行評估:
您的業務是否對數據延時敏感?可接受的范圍是秒級、毫秒級或者微秒級?
您的業務訪問數據的頻率是否很高?每秒幾百次或者每秒上萬次甚至更高?
您的業務場景涉及大文件多還是小文件多?
您的業務數據是重讀還是重寫?
機器的性能通常需要與之匹配的存儲性能,才能發揮出最佳效果。除了單個云產品自身的性能外,您還可以通過產品之間的組合實現更好的性能效果,如使用云存儲網關+OSS組合,可以將OSS的對象結構和NAS文件系統的目錄/文件建立映射關系,讓您在享受OSS Bucket海量空間的同時,還能享受高性能的數據訪問體驗。
數據量
數據量是在存儲服務選型過程中的一個重要因素。如果您管理的是一個現有的、運行中的業務系統,那么您對數據量是有明確認識的。但是如果是一個發展中的業務,未來業務發展情況及可能帶來的數量增長往往存在不確定性,過于樂觀地評估數據有可能會導致選型方案的失誤,甚至提升系統重構的風險。所以建議您選擇沒有容量限制或者業務數據幾乎不會超出容量上限的存儲服務。同時您還需要考慮如下問題:
數據是否需要被滾動刪除?
是否有審計合規保留的要求?
對象存儲OSS提供無限容量、具備彈性擴展的存儲能力,文件存儲NAS可以提供GB~PB級別、塊存儲容量通常提供GB~TB級別數據存儲能力。值得一提的是,使用OSS-HDFS服務,您可以像在原生HDFS中那樣管理和訪問數據。
遷移/風險
如果您是將線下數據遷移上云,業務數據已經按照一定的數據格式放在了某個存儲介質上。此時進行存儲服務選型需要考慮的通常是兼容性。同時您可能還需要考慮如下因素:
數據傳輸:是否有現成的數據上云工具,如果沒有,該如何進行數據遷移?
系統改造成本:選擇不同的存儲服務,當前應用程序在存儲方面需要多少改造?
數據管理和生命周期:當前數據是怎么進行管理的,遷移到云上之后,是否可以直接利用云服務的功能自動化完成這些任務,如多版本、生命周期的管控策略,跨地域的復制。
安全合規:確保在遷移過程中的數據安全。通過合適的安全手段,如加密和權限控制來確保傳輸過程中的數據安全。
成本優化:注意在遷移過程中可能產生的任何費用。如:存儲費用、數據傳輸費用、或者其他附加服務。
請充分評估數據遷移方案和遷移過程中數據安全,以盡可能降低數據上云的阻礙,最大化上云的價值。
備份/數據保護
數據的高可用、高可靠是非常重要的。
塊存儲EBS的本地盤存儲在單臺物理機,數據可靠性取決于物理機的可靠性,存在單點故障風險。不建議在本地盤上存儲需要長期保存的業務數據。
塊存儲EBS的云盤三副本技術通過分布式文件系統為云服務器ECS提供穩定、高效、可靠的數據隨機訪問能力,為ECS實例實現最高可達99.9999999%的數據可靠性保證。
文件存儲NAS采用單可用區數據存儲機制,將用戶的數據在后端進行多副本存儲,每份數據都會存儲在同一個可用區內多個不同的設備上,并提供最高可達99.999999999%(11個9)的數據持久性和99.5%的服務可用性。
OSS采用多重冗余架構設計,數據設計持久性最高可達99.9999999999%(12個9),數據可用性最高可達99.995%。
除了阿里云提供的數據可用性保障外,您也可以結合云備份HBR主動對本地盤進行定期備份。此外,數據持久性無法解決誤刪除數據的場景,也建議使用云備份定期備份您的數據。
成本
除了基本的存儲費用,數據傳輸、數據備份等都會影響到整體的存儲成本。您可以參考如下方案進行成本優化:
根據業務的實際需要選擇存儲服務。
根據數據的實際使用頻率選擇合適的存儲類型,如OSS可選擇標準存儲、低頻冷存儲等。
可以結合賬單進行綜合分析。
您也需要避免因為僅追求較低的存儲成本而選擇了一個不合適或未經過充分評估的存儲服務,以免造成潛在的計算資源浪費、數據安全風險、系統改造風險、審計合規風險等。建議您在進行存儲技術選型時使用價格計算器評估各種存儲服務在未來一段確定的周期內所需要的存儲費用,并結合風險成本進行綜合評估。
選擇服務
如下表格根據常見的業務場景羅列了存儲服務選型建議。
存儲類型 | 應用場景 | 存儲服務或工具 |
塊存儲 | 適用于OLTP數據庫、NoSQL數據庫等IO密集型的高性能、低時延業務場景。 | |
文件存儲 | 主要應用于科學計算、容器數據持久化和企業在線生產應用的數據存儲。如:AI計算、基因計算、藥物計算、容器共享PV、日志數據持久化、CI/CD平臺、云桌面數據文件共享等。 | |
對象存儲 | 主要應用于基于對象API開發的互聯網應用程序的數據存儲。如:互聯網業務的音視頻存儲、什么是OSS-HDFS服務、云相冊、個人/企業網盤類應用。 |
除了選擇存儲服務,您還需要確定使用何種方式進行數據遷移。阿里云根據業務數據是否需要實時在線或支持離線提供了不同的遷移方案。遷移前,有兩個關鍵考慮因素:
遷移速度:如果數據經常變化并且時間敏感度很高,請選擇在線遷移方案。 如果是一次性的,并且數據的時間敏感度不高,可以選擇離線方案。
帶寬:當網絡無法打通,或者數據量特別大,基于現有的網絡帶寬很難在短時間內將數據上云,可以選擇離線遷移方案。
遷移方案 | 時間敏感度 | 更新頻率 | 存儲服務或工具 |
在線 | 高 | 高 | |
離線 | 低 | 低 |
使用
經過多維度的評估,您已經清楚如何根據現有業務數據要求進行存儲服務選型。為了讓您能夠更加快速地學習和了解存儲產品,我們為每個產品提供了學習路徑。
分類 | 產品名稱 | 學習路徑 |
塊存儲 | 塊存儲EBS | |
文件存儲 | 文件存儲NAS | |
文件存儲CPFS | ||
文件存儲HDFS | ||
OSS-HDFS | ||
文件存儲DBFS | ||
文件存儲CSG | ||
對象存儲 | 對象存儲OSS | |
存儲服務 | 日志服務 | |
表格存儲 | ||
網盤與相冊服務 |