實例相關
名稱 | 解釋 |
副本數 | 單張表的全量索引數據冗余的份數(可用于查詢)。 |
網絡信息 | 包括專有網絡(VPC)、公網訪問等信息。 |
API入口 | SDK操作實例時使用。 |
查詢測試 | 通過控制臺對實例表數據進行檢索。 |
變更歷史 | 記錄用戶各項運維操作的歷史記錄和變更進度。 |
指標監控 | 展示查詢節點和數據節點資源指標。 |
報警管理 | 與實例相關指標的報警指標、報警規則、報警聯系人配置。 |
表相關
表基礎信息
名稱 | 解釋 |
數據分片 | 索引數據存儲的數據節點個數。 設置分片數時,各索引表分片數需保持一致。要求至少一個索引表分片數為1,其余索引表分片數一致。 |
數據更新資源數 | 數據更新所用資源數,每個索引默認免費提供2個4核8G的更新資源,超出免費額度的資源將產生費用。 |
場景模板 | 向量檢索版提供3類模板供用戶配置數據:
|
數據處理 | 在選擇向量-圖片搜索或向量-文本語義搜索時,需要選擇數據處理方式,向量檢索版提供兩種數據處理方式:
|
索引重建 | 將MaxCompute或OSS上的數據構建成索引的過程就叫做索引重建,產出的索引稱為全量索引,索引的版本稱為全量版本。 |
數據源信息
名稱 | 解釋 |
MaxCompute數據源 | 全量數據源,原始數據按照分區存儲在MaxCompute中,增量數據可通過API推送。 |
API數據源 | 實時增量數據源,通過API推送進行數據更新。 |
OSS數據源 | 全量數據源,原始數據按照OSS的Bucket存儲在OSS中,增量數據可通過API推送。 |
字段和索引
名稱 | 解釋 |
字段 | 字段是文檔的組成單元,包含字段名稱和字段內容。 |
多值字段 | 一個字段含有多個不同的值,每個值都是獨立的。 |
主鍵 | 唯一標識一篇文檔的字段。 |
文檔 | 文檔是可搜索的結構化數據單元,文檔包含一個或多個字段,但必須有主鍵字段,向量檢索版實例通過主鍵值來確定唯一的文檔。主鍵重復則文檔會被覆蓋。 |
字段類型 | 每個字段所屬的類型(數值、浮點、字符串等)。 |
向量字段 | 存儲向量的字段,字段類型為多值Float。 |
需要embedding字段 | 存儲需要被Embedding的字段(如文本、或者base64的圖片),字段類型為String或Text。 |
多值分隔符 | 默認使用ha3分割符 |
向量索引的包含字段 | 每個向量索引可包含3個字段:
|
向量維度 | 可理解為生成的向量數組的長度。 |
距離類型 | 在向量空間中,計算兩個向量之間距離的不同方法或度量方式。 |
向量索引算法 | 向量索引算法是一種用于快速搜索和檢索大規模向量數據的算法。在向量檢索中,常用的方法是計算兩個向量之間的距離,并根據距離的大小來進行排序和檢索。 |
實時索引 | 實時的向量數據Build索引。 |
普通索引 | 非向量索引,包括關鍵字索引。 |
運維相關
名稱 | 解釋 |
索引重建 | 在不變更數據來源、字段配置、索引結構的情況下,重新進行一次索引的全量構建。 |
停止使用/恢復使用 | 停止/啟用表。 |
FSM觸發和執行機制
變更類型 | 允許重復觸發 | 說明 |
ha3_biz_apend | 否 | 由系統自動觸發,有且僅有一個,該變更直到實例正確添加索引表并成功構建索引后才會結束。 |
update_biz_depend_index_fsm | 否 | 由系統自動觸發有且僅有一個,該變更直到索引表成功構建索引才會自動結束。 |
multi_biz_activate | 否 | 可以理解為實例初始化, 一個實例有且僅有一個,該變更直到實例正確添加索引表并成功構建索引后才會自動結束。 |
自動觸發全量 | 是 | 檢測新的數據分區后自動執行,最新的變更和歷史變更并存。 |
手動觸發全量 | 是 | 最新的變更和歷史變更并存。 |
在線資源 | 是 | 針對同一個Zone的情況下,最新的變更執行前會終止所有舊的變更。 |
FSM:有限狀態機(Finite State Machine,簡稱FSM)又稱有限狀態自動機或簡稱狀態機,是表示有限個狀態以及在這些狀態之間的轉移和動作等行為的數學模型。
重復觸發:是否允許多次觸發該變更類型。