GPU云服務器提供了GPU加速計算能力,實現GPU計算資源的即開即用和彈性伸縮。其作為阿里云彈性計算家族的一員,結合了GPU計算力與CPU計算力,滿足您在人工智能、高性能計算、專業圖形圖像處理等場景中的需求,例如,在并行運算方面,使用GPU云服務器可顯著提高計算效率。
為什么選擇GPU云服務器
阿里云GPU云服務器是基于GPU與CPU應用的計算服務器。GPU在執行復雜的數學和幾何計算方面有著獨特的優勢,特別是在浮點運算、并行運算等方面,GPU可以提供比CPU高百倍的計算能力。GPU的功能特性如下:
擁有大量擅長處理大規模并發計算的算術邏輯單元(Arithmetic and Logic Unit,即ALU)。
能夠支持多線程并行的高吞吐量運算。
邏輯控制單元相對簡單。
下表為您介紹GPU云服務器與自建GPU服務器的區別。
對比項 | GPU云服務器 | GPU自建服務器 |
靈活性 |
|
|
易用性 |
|
|
容災備份 |
|
|
安全性 |
|
|
成本 |
|
|
GPU實例規格族
實例是能夠為您的業務提供計算服務的最小單位,不同的實例規格可以提供的計算能力也不同。根據業務場景和使用場景,ECS實例可以分為多種實例規格族。GPU實例屬于ECS實例中的一類實例規格,GPU實例在提供GPU加速能力的同時,保留了與普通ECS實例一致的使用體驗。在創建ECS實例時,請選擇企業級異構計算規格族群、彈性裸金屬服務器和超級計算集群(SCC)實例規格族群下的GPU實例規格即可。關于GPU實例規格的更多信息,請參見實例規格族。
產品優勢
覆蓋范圍廣闊
阿里云GPU云服務器在全球17個地域實現規模部署,覆蓋范圍廣,結合彈性供應、彈性伸縮等交付方式,能夠很好地滿足您業務的突發需求。
超強計算能力
阿里云GPU云服務器配備業界超強算力的GPU計算卡,結合高性能CPU平臺,單實例可提供高達1000 TFLOPS的混合精度計算性能。
網絡性能出色
阿里云GPU云服務器實例的VPC網絡最大支持450萬的PPS及32 Gbit/s的內網帶寬。在此基礎上,超級計算集群產品中,節點間額外提供高達50 Gbit/s的RDMA網絡,滿足節點間數據傳輸的低延時高帶寬要求。
購買方式靈活
支持靈活的資源付費模式,包括包年包月、按量付費、搶占式實例、預留實例券、存儲容量單位包。您可以按需要購買,避免資源浪費。
說明部分GPU實例規格族不支持使用預留實例券。更多信息,請參見預留實例券屬性。
同時,阿里云也提供了神行工具包搭配GPU云服務器一起使用,神行工具包具有GPU計算服務增強能力,可以幫助您更方便、更高效地使用阿里云的云上GPU資源。更多信息,請參見神行工具包優勢。
產品計費
GPU云服務器的計費相關功能和云服務器ECS一致,其中,計算資源(vCPU、內存以及GPU)、鏡像、塊存儲、公網帶寬以及快照等資源涉及計費。
常見的計費方式如下所示:
包年包月:按一定時長購買資源,先付費后使用。
按量付費:按需開通和釋放資源,先使用后付費。
搶占式實例:通過競價模式搶占庫存充足的計算資源,相對按量付費實例有一定的折扣,但是存在回收機制。
預留實例券:搭配按量付費實例使用的抵扣券,承諾使用指定配置的實例(包括實例規格、地域和可用區等),以折扣價抵扣計算資源的賬單。
節省計劃:搭配按量付費實例使用的折扣權益計劃,承諾使用穩定數量的資源(以元/小時為單位衡量),以折扣價抵扣計算資源、系統盤等資源的賬單。
存儲容量單位包:搭配按量付費存儲產品使用的資源包,承諾使用指定容量的存儲資源,以折扣價抵扣塊存儲、NAS、OSS等資源的賬單。
關于GPU云服務器計費的更多介紹,請參見GPU云服務器計費。
關聯工具包
阿里云提供神行工具包供您更高效地使用GPU資源,神行工具包中的組件主要包括以下工具:
關于神行工具包的更多信息,請參見什么是神行工具包(DeepGPU)。
工具名稱 | 說明 |
阿里云自研的AI加速器,為生成式AI和大模型場景提供訓練和推理加速功能。 | |
阿里云開發的一種用于多GPU互聯的AI通信加速庫,在AI分布式訓練或多卡推理任務中用于提升通信效率。 | |
阿里云開發的大語言模型(Large Language Model,LLM)推理引擎,在處理大語言模型任務中為您提供高性能的大模型推理服務。 | |
阿里云推出的AI分布式訓練通信優化庫。可實現分布式訓練在兼容性、適用性和性能加速等方面的升級。 | |
阿里云推出的一個基于PyTorch深度學習框架研發的計算優化編譯器,可以實現無感的計算優化功能。 | |
阿里云基于內核虛擬GPU隔離的容器共享技術,隔離GPU資源,實現多個容器共用一張顯卡。 | |