日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

向量檢索服務(wù)產(chǎn)品規(guī)格

本文介紹向量檢索服務(wù)DashVector的產(chǎn)品規(guī)格,以幫助用戶選擇貼合自身業(yè)務(wù)場景的實例規(guī)格。

實例類型

向量檢索服務(wù)DashVector當前支持四種實例(Cluster)類型,以支持不同的業(yè)務(wù)場景和需求:

  • 性能型:適用于查詢QPS高、查詢延遲低的場景,同時性能型也是寫入效率最高的實例類型。對于高并發(fā)、大流量、低延遲場景,或?qū)懭胄视休^高的要求的場景,可選擇性能型實例。

  • 存儲型(推薦):存儲型相對于性能型有5倍的存儲容量優(yōu)勢,能夠存儲和管理更多的向量數(shù)據(jù),適用于大規(guī)模數(shù)據(jù)量的場景。存儲型實例同樣也具備優(yōu)秀的技術(shù)指標,可滿足大部分場景需求,同時也是性價比最高的實例類型,推薦用戶選擇使用。

  • Serverless型:不限數(shù)據(jù)容量,基于用戶數(shù)據(jù)自動擴縮,按實際請求收費,適用于低頻QPS查詢(QPS<2),延遲不敏感等場景??傮w性能與存儲型實例接近。

  • 免費試用:適用于測試、體驗場景,請勿用于線上生產(chǎn)環(huán)境。免費試用實例有效期為1個月,到期后可再次申請試用。免費實例有部分試用限制,詳情可參考約束與限制。

重要

免費試用實例有效期為1個月,到期后免費試用實例將自動釋放,實例中的數(shù)據(jù)將被全部刪除并清空且不可恢復(fù),為了保證實例可持續(xù)使用,請您于創(chuàng)建免費試用實例之后的30個自然日內(nèi)將免費試用實例升級為付費實例。免費試用實例由于到期且沒有升級為付費實例而導(dǎo)致的數(shù)據(jù)被刪除的情況,阿里云將不承擔相關(guān)責任。

實例規(guī)格

向量檢索服務(wù)DashVector針對性能型和存儲型實例提供不同檔位的實例(Cluster)規(guī)格,不同規(guī)格的主要區(qū)別在于存儲容量的不同。Serverless實例與已有性能型和存儲型不同,無容量限制。

說明

若您有更高規(guī)格需求,或有任何反饋、期望獲取更多技術(shù)支持,歡迎通過如下方式聯(lián)系我們:

  • 官方釘釘群:25130022704

  • 技術(shù)支持郵箱:dashvector@service.aliyun.com

存儲容量參考

實例類型

實例規(guī)格

Doc容量參考(基于768維FP32向量數(shù)據(jù))

Doc容量參考(基于1536維FP32向量數(shù)據(jù))

性能型

P.small

500,000

250,000

P.large

1,000,000

500,000

P.2xlarge

2,000,000

1,000,000

P.4xlarge

4,000,000

2,000,000

P.8xlarge

8,000,000

4,000,000

P.16xlarge

16,000,000

8,000,000

存儲型

S.small

2,500,000

1,250,000

S.large

5,000,000

2,500,000

S.2xlarge

10,000,000

5,000,000

S.4xlarge

20,000,000

10,000,000

S.8xlarge

40,000,000

20,000,000

S.16xlarge

80,000,000

40,000,000

Serverless型

Serverless

不限

不限

重要
  1. 以上數(shù)據(jù)均已通過實際測試驗證,但僅供參考!

  2. 上述用于容量測試的Doc中不包含任何Fields,僅包含主鍵和向量數(shù)據(jù),主鍵為從零開始自增正整數(shù)轉(zhuǎn)字符串。大部分實際生產(chǎn)場景中,F(xiàn)ields是不可或缺的,F(xiàn)ields數(shù)據(jù)同樣會占用存儲空間,從而導(dǎo)致實際存儲的Doc數(shù)低于上述表格。

檢索性能參考

實例類型

實例規(guī)格

topk=10

topk=100

topk=250

topk=1000

QPS

RT_p99

QPS

RT_p99

QPS

RT_p99

QPS

RT_p99

性能型

P.large(基于1百萬768維FP32向量數(shù)據(jù))

962.6

<30ms

429.7

<30ms

387.5

<45ms

134.7

<250ms

存儲型

S.large(基于5百萬768維FP32向量數(shù)據(jù))

297.6

<30ms

112.5

<30ms

107.4

<50ms

37.1

<300ms

重要
  1. 以上數(shù)據(jù)為基于Cohere數(shù)據(jù)集實測結(jié)果,但由于不同數(shù)據(jù)集的數(shù)據(jù)分布對性能有影響,上述數(shù)據(jù)僅供參考。

  2. 上述用于性能測試的Doc中不包含任何Fields,僅包含主鍵和向量數(shù)據(jù),主鍵為從零開始自增正整數(shù)轉(zhuǎn)字符串。

  3. 向量檢索服務(wù)DashVector會定時在后臺進行向量索引優(yōu)化,通常在寫入完成后4小時完成,屆時性能達到最優(yōu)狀態(tài)。

  4. 不同規(guī)格在寫滿數(shù)據(jù)情況下,QPS與上述表格中保持一致或更高,不因數(shù)據(jù)量的增加而下降。如,P.2xlarge規(guī)格,在寫滿2百萬768維FP32向量數(shù)據(jù)情況下,topk=100的QPS可達到600+。

副本數(shù)

向量檢索服務(wù)DashVector支持調(diào)整副本數(shù),可選范圍為1-5。副本之間數(shù)據(jù)完全相同,副本數(shù)越大,可支持的QPS越高,呈線性關(guān)系。同時副本數(shù)越大,服務(wù)可用性越高,建議對可用性有較高要求的生產(chǎn)環(huán)境選擇>=2的副本數(shù)

說明
  • 需要注意,副本數(shù)的增加和減少不會影響存儲容量,僅影響QPS和可用性。

  • Serverless實例無副本概念,由系統(tǒng)管理。