向量檢索版針對用戶實例預算問題,提供了資源計算器,新接入的實例可通過計算器對實例資源進行預算參考。切換向量檢索版,單擊創建實例,在右側會展示規格計算器。
單擊規格計算器:
基礎情況:
實例所在區域:用戶需要創建引擎的區域。
是否有容災需求:用戶是否需要容災需求,可下拉選擇:有、無。
向量數據情況:
向量數據條數:用戶要寫入引擎向量數據doc數。
向量維度:用戶寫入引擎的向量維度。
向量算法:可根據需求進行選擇,目前支持三種算法:
HNSW:基于圖的向量檢索算法,召回率極高且性能很好,內存及存儲占用與Linear相當,在低維度和高維度向量數據集上均有很好的表現,適用于大多數向量檢索場景。
QC:基于量化聚類的向量檢索算法,召回結果正確率極高,占用資源較少,性能較好,在低維度向量數據集上有更好表現,內存及儲存占用一般只有Linear和HNSW的1/4,適用于對召回率沒有嚴苛要求的大數據量檢索場景。
Linear:線性檢索,即暴力檢索,召回結果完全正確,占用資源多性能較差,通常適用于小數據集上(1W條數據量以內)的精確檢索。
查詢情況:
平均QPS:用戶接入引擎的流量QPS
期望搜索平均響應時間:用戶期望召回結果的平均耗時,單位下拉可選,s或ms。
上述填寫完畢,點擊運行計算:
運算后,平臺會推薦出需要購買的查詢節點以及數據節點的規格及副本數,如下:
用戶可根據推薦的規格資源進行購買機器。
文檔內容是否對您有幫助?