ACK集群實現(xiàn)GPU成本優(yōu)化
更新時間:
通過使用阿里云cGPU技術(shù),您可以將GPU利用率不高的應(yīng)用容器化部署在一塊GPU卡上,實現(xiàn)資源利用率提升并且降低成本,且保持對高負載應(yīng)用的資源保障。
背景信息
阿里云GPU團隊推出了昊天cGPU方案:通過一個內(nèi)核驅(qū)動,為容器提供了虛擬的GPU設(shè)備節(jié)點,從而實現(xiàn)了顯存和算力的隔離;通過用戶態(tài)輕量的運行庫來配置容器內(nèi)的虛擬GPU設(shè)備節(jié)點。昊天cGPU在做到算力調(diào)度與顯存隔離的同時,也做到了無需替換CUDA靜態(tài)庫或動態(tài)庫;無需重新編譯CUDA應(yīng)用;CUDA,cuDNN等版本隨時升級無需適配等特性。
解決方案
在ACK服務(wù)中實現(xiàn)共享GPU,靈活拆分。
提高GPU利用率,降低TCO。
應(yīng)用無需修改,保障多個容器共享同一個GPU時,彼此互相隔離。
架構(gòu)圖
參考鏈接
有關(guān)ACK實現(xiàn)GPU成本優(yōu)化的詳情,請參見ACK實現(xiàn)GPU成本優(yōu)化。
文檔內(nèi)容是否對您有幫助?