云盒計算資源配置最佳實(shí)踐
本文介紹如何配置云盒計算資源,在滿足業(yè)務(wù)需求的同時,有效降低成本,并提升硬件風(fēng)險應(yīng)對能力。
背景信息
云盒的硬件設(shè)計中,各類硬件設(shè)備的保障如下:
網(wǎng)絡(luò)設(shè)備:采用雙機(jī)冗余雙上連設(shè)計,確保云盒內(nèi)網(wǎng)絡(luò)的高連續(xù)性,且不存在單點(diǎn)故障。
存儲設(shè)備:可以確保在兩臺存儲服務(wù)器同時宕機(jī)的情況下,數(shù)據(jù)的安全可靠。
計算設(shè)備:支持宕機(jī)遷移和熱遷移能力,在有充足冗余資源的情況下,可以確保業(yè)務(wù)連續(xù)性。
本文主要介紹如何選擇合適的計算SKU以滿足業(yè)務(wù)需求,同時配置一定的冗余資源來確保業(yè)務(wù)連續(xù)性。
計算資源配置建議
云盒內(nèi)的計算資源以標(biāo)準(zhǔn)的計算SKU的形式提供,SKU默認(rèn)配置了不同實(shí)例規(guī)格族的組合。您可以根據(jù)業(yè)務(wù)需求,選擇自身算力所對應(yīng)的SKU。在選擇計算SKU時,需要兼顧考慮成本和冗余算力配置。配置建議如下:
云盒支持的計算SKU請參見計算SKU規(guī)格說明。如果當(dāng)前SKU無法滿足您的業(yè)務(wù)需求,您也可以聯(lián)系阿里云技術(shù)支持來為您定制SKU。
合適的SKU配置,可以有效降低成本
選擇SKU時,需要根據(jù)業(yè)務(wù)需求的算力配置,來選擇合適的算力配比。
例如:您的業(yè)務(wù)需要100臺4 vCPU,8 GiB內(nèi)存的ECS實(shí)例,共計需要400 vCPU,800 GiB內(nèi)存的算力,由于所需ECS實(shí)例的vCPU和內(nèi)存配比要求為1:2,此時可以選擇最大實(shí)例規(guī)格為ecs.c6.26xlarge的SKU,該規(guī)格族的vCPU和內(nèi)存配比為1:2,在滿足需求的同時可以避免內(nèi)存浪費(fèi)。反之,如果選擇最大實(shí)例規(guī)格為ecs.g6.26xlarge的SKU,由于該規(guī)格族的vCPU和內(nèi)存配比1:4,則會出現(xiàn)內(nèi)存浪費(fèi)的情況。
根據(jù)業(yè)務(wù)需求選擇SKU時,可能會需要多種不同配比的ECS實(shí)例,此時可以選擇多種規(guī)格族混合的SKU,以減少資源浪費(fèi)。
例如:您的業(yè)務(wù)分別需要100臺4 vCPU,8 GiB內(nèi)存的ECS實(shí)例和100臺4 vCPU,16 GiB內(nèi)存的ECS實(shí)例,則不能因?yàn)楣灿嬓枰?00 vCPU,2400 GiB內(nèi)存的算力,而直接選擇包含8個最大實(shí)例規(guī)格為ecs.g6.26xlarge(單個104 vCPU,384 GiB內(nèi)存)的SKU。建議您根據(jù)兩種規(guī)格的vCPU和內(nèi)存配比,選擇兩種規(guī)格族混合的SKU,如同時包含最大實(shí)例規(guī)格為ecs.c6.26xlarge和ecs.g6.26xlarge的SKU。
冗余的算力配置,可以大幅提升硬件風(fēng)險應(yīng)對能力
云盒提供的IaaS層穩(wěn)定性,依賴于云上提前預(yù)測硬件故障的算法能力,以及宕機(jī)遷移和熱遷移能力。這些能力可以有效提升云盒IaaS層的故障和風(fēng)險應(yīng)對能力,但也需要一定的冗余資源,以便在硬件設(shè)備出現(xiàn)故障時及時遷移業(yè)務(wù)。
您可以參考以下兩種方式來提高云盒IaaS層的冗余資源,以確保業(yè)務(wù)連續(xù)性。
根據(jù)業(yè)務(wù)需求選擇SKU時,增加一定量的冗余資源。
由于這些冗余資源對于用戶來說是可見資源,隨時可以被用來創(chuàng)建ECS實(shí)例或其他云產(chǎn)品實(shí)例,因此該方式對于日常業(yè)務(wù)使用有一定的靈活性,但無法保證在硬件設(shè)備故障期間,一定存在可用的備機(jī)資源。
購買SLA增值服務(wù)包,為計算資源通過SLA保證。
SLA增值服務(wù)包會根據(jù)您當(dāng)前的資源配置情況,自動選擇合適的冗余資源。這些冗余資源對用戶來說是不可見資源,可以在硬件故障期間立即啟動,確保有可用的資源,以應(yīng)對硬件故障風(fēng)險,提升業(yè)務(wù)連續(xù)性。
云盒中的硬件設(shè)備出現(xiàn)故障時,業(yè)務(wù)會遷移到冗余資源上來確保業(yè)務(wù)連續(xù)性,同時阿里云會向您發(fā)送云盒維修事件通知,您需要授權(quán)同意阿里云上門更換并維修硬件設(shè)備。關(guān)于如何授權(quán)維修以及維修相關(guān)流程,請參見響應(yīng)云盒維修事件和云盒故障服務(wù)器維修流程。