向量檢索服務(wù)產(chǎn)品規(guī)格
本文介紹向量檢索服務(wù)DashVector的產(chǎn)品規(guī)格,以幫助用戶選擇貼合自身業(yè)務(wù)場景的實例規(guī)格。
實例類型
向量檢索服務(wù)DashVector當前支持四種實例(Cluster)類型,以支持不同的業(yè)務(wù)場景和需求:
性能型:適用于查詢QPS高、查詢延遲低的場景,同時性能型也是寫入效率最高的實例類型。對于高并發(fā)、大流量、低延遲場景,或?qū)懭胄视休^高的要求的場景,可選擇性能型實例。
存儲型(推薦):存儲型相對于性能型有5倍的存儲容量優(yōu)勢,能夠存儲和管理更多的向量數(shù)據(jù),適用于大規(guī)模數(shù)據(jù)量的場景。存儲型實例同樣也具備優(yōu)秀的技術(shù)指標,可滿足大部分場景需求,同時也是性價比最高的實例類型,推薦用戶選擇使用。
Serverless型:不限數(shù)據(jù)容量,基于用戶數(shù)據(jù)自動擴縮,按實際請求收費,適用于低頻QPS查詢(QPS<2),延遲不敏感等場景??傮w性能與存儲型實例接近。
免費試用:適用于測試、體驗場景,請勿用于線上生產(chǎn)環(huán)境。免費試用實例有效期為1個月,到期后可再次申請試用。免費實例有部分試用限制,詳情可參考約束與限制。
免費試用實例有效期為1個月,到期后免費試用實例將自動釋放,實例中的數(shù)據(jù)將被全部刪除并清空且不可恢復(fù),為了保證實例可持續(xù)使用,請您于創(chuàng)建免費試用實例之后的30個自然日內(nèi)將免費試用實例升級為付費實例。免費試用實例由于到期且沒有升級為付費實例而導(dǎo)致的數(shù)據(jù)被刪除的情況,阿里云將不承擔相關(guān)責任。
實例規(guī)格
向量檢索服務(wù)DashVector針對性能型和存儲型實例提供不同檔位的實例(Cluster)規(guī)格,不同規(guī)格的主要區(qū)別在于存儲容量的不同。Serverless實例與已有性能型和存儲型不同,無容量限制。
若您有更高規(guī)格需求,或有任何反饋、期望獲取更多技術(shù)支持,歡迎通過如下方式聯(lián)系我們:
官方釘釘群:25130022704
技術(shù)支持郵箱:dashvector@service.aliyun.com
存儲容量參考
實例類型 | 實例規(guī)格 | Doc容量參考(基于768維FP32向量數(shù)據(jù)) | Doc容量參考(基于1536維FP32向量數(shù)據(jù)) |
性能型 | P.small | 500,000 | 250,000 |
P.large | 1,000,000 | 500,000 | |
P.2xlarge | 2,000,000 | 1,000,000 | |
P.4xlarge | 4,000,000 | 2,000,000 | |
P.8xlarge | 8,000,000 | 4,000,000 | |
P.16xlarge | 16,000,000 | 8,000,000 | |
存儲型 | S.small | 2,500,000 | 1,250,000 |
S.large | 5,000,000 | 2,500,000 | |
S.2xlarge | 10,000,000 | 5,000,000 | |
S.4xlarge | 20,000,000 | 10,000,000 | |
S.8xlarge | 40,000,000 | 20,000,000 | |
S.16xlarge | 80,000,000 | 40,000,000 | |
Serverless型 | Serverless | 不限 | 不限 |
以上數(shù)據(jù)均已通過實際測試驗證,但僅供參考!
上述用于容量測試的Doc中不包含任何Fields,僅包含主鍵和向量數(shù)據(jù),主鍵為從零開始自增正整數(shù)轉(zhuǎn)字符串。大部分實際生產(chǎn)場景中,F(xiàn)ields是不可或缺的,F(xiàn)ields數(shù)據(jù)同樣會占用存儲空間,從而導(dǎo)致實際存儲的Doc數(shù)低于上述表格。
檢索性能參考
實例類型 | 實例規(guī)格 | topk=10 | topk=100 | topk=250 | topk=1000 | ||||
QPS | RT_p99 | QPS | RT_p99 | QPS | RT_p99 | QPS | RT_p99 | ||
性能型 | P.large(基于1百萬768維FP32向量數(shù)據(jù)) | 962.6 | <30ms | 429.7 | <30ms | 387.5 | <45ms | 134.7 | <250ms |
存儲型 | S.large(基于5百萬768維FP32向量數(shù)據(jù)) | 297.6 | <30ms | 112.5 | <30ms | 107.4 | <50ms | 37.1 | <300ms |
以上數(shù)據(jù)為基于Cohere數(shù)據(jù)集實測結(jié)果,但由于不同數(shù)據(jù)集的數(shù)據(jù)分布對性能有影響,上述數(shù)據(jù)僅供參考。
上述用于性能測試的Doc中不包含任何Fields,僅包含主鍵和向量數(shù)據(jù),主鍵為從零開始自增正整數(shù)轉(zhuǎn)字符串。
向量檢索服務(wù)DashVector會定時在后臺進行向量索引優(yōu)化,通常在寫入完成后4小時完成,屆時性能達到最優(yōu)狀態(tài)。
不同規(guī)格在寫滿數(shù)據(jù)情況下,QPS與上述表格中保持一致或更高,不因數(shù)據(jù)量的增加而下降。如,P.2xlarge規(guī)格,在寫滿2百萬768維FP32向量數(shù)據(jù)情況下,topk=100的QPS可達到600+。
副本數(shù)
向量檢索服務(wù)DashVector支持調(diào)整副本數(shù),可選范圍為1-5。副本之間數(shù)據(jù)完全相同,副本數(shù)越大,可支持的QPS越高,呈線性關(guān)系。同時副本數(shù)越大,服務(wù)可用性越高,建議對可用性有較高要求的生產(chǎn)環(huán)境選擇>=2的副本數(shù)。
需要注意,副本數(shù)的增加和減少不會影響存儲容量,僅影響QPS和可用性。
Serverless實例無副本概念,由系統(tǒng)管理。