日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

Vector

更新時間: 2024-10-16 14:37:34

TairVector是Tair自研的擴展數據結構,提供高性能、實時,集存儲、檢索于一體的向量數據庫服務。

TairVector簡介

TairVector采用多層Hash的數據結構,如下所示:TairVector數據結構TairVector提供了HNSW(Hierarchical Navigable Small World)和暴力搜索(Flat Search)兩種索引算法:

  • HNSW:以圖結構構建向量檢索的索引,支持異步空間回收,可以在保證高查詢精度的同時,均衡實時更新的性能表現。

  • 暴力搜索:具有100%查詢精度,插入數據速度快,適用于小規模數據集。

同時,TairVector支持歐式距離(Euclidean distance)、向量內積(Internal product)、余弦距離(Cosine distance)和Jaccard距離(Jaccard distance)等多種距離函數。相對于傳統的向量檢索服務,TairVector的優勢如下:

  • 所有數據均在內存中,支持實時更新索引,具有更短的讀寫時延。

  • 優化內存數據結構,占用空間更小。

  • 開箱即用,以云服務的方式整體申請即可使用,整體架構簡單高效,沒有復雜組件依賴。

  • 支持向量檢索與全文檢索組合的混合檢索。

  • 支持創建標量(標簽屬性等)倒排索引,并提供先標量后向量的KNN檢索特性。

發布記錄

  1. 2022年10月13日隨Tair內存型(兼容Redis 6.0)首次發布TairVector。

  2. 2022年11月22日發布6.2.2.0版本,新增支持Jaccard距離函數、TVS.GETINDEX命令支持統計每個索引的內存占用(index_data_sizeattribute_data_size)。

  3. 2022年12月26日發布6.2.3.0版本,支持集群代理模式,新增FLOAT16的向量數據類型,新增TVS.MINDEXKNNSEARCHTVS.MINDEXMKNNSEARCH命令。

  4. 2023年07月04日發布6.2.8.2版本,支持余弦距離、支持HNSW索引垃圾自動回收。

  5. 2023年08月03日發布23.8.0.0版本,支持對Index中的key級別設置TTL(新增TVS.HEXPIREATTVS.HPEXPIREAT等命令),支持對指定Key列表進行向量近鄰查詢(新增TVS.GETDISTANCE命令),支持全文檢索(更新TVS.CREATEINDEXTVS.KNNSEARCH等命令),可以實現向量檢索與全文檢索組合的混合檢索。

  6. 2024年06月06日發布24.5.1.0版本,新增TVS.KNNSEARCHFIELDTVS.MINDEXKNNSEARCHFIELD命令,支持在近鄰查詢時返回標簽屬性信息。

  7. 2024年07月22日發布24.7.0.0版本,支持在稀疏向量中使用HNSW索引。

最佳實踐

前提條件

實例的存儲介質為內存型(兼容Redis 6.0及以上)。

說明

內存型(兼容Redis 5.0)實例暫不支持升級至內存型(兼容Redis 6.0),如需使用請新建實例。

注意事項

  • 操作對象為Tair實例中的TairVector數據。

  • TairVector數據結構的index_name、Key等暫不支持Redis的Hashtags特性。

  • TairVector暫不支持MOVE等特性。

  • 若業務場景對數據持久化要求較高,建議開啟半同步功能,將#no_loose_tsync-repl-mode參數的值改為semisync,具體操作請參見設置實例參數

命令列表

表 1. TairVector命令

類型

命令

語法

說明

索引元數據操作

TVS.CREATEINDEX

TVS.CREATEINDEX index_name dims algorithm distance_method [algo_param_key alog_param_value] ...

創建一個向量索引空間,同時指定構建索引和查詢的具體算法,以及距離函數。該對象僅能通過TVS.DELINDEX命令刪除。

TVS.GETINDEX

TVS.GETINDEX index_name

查詢指定的向量索引,獲取該向量索引的元數據信息。

TVS.DELINDEX

TVS.DELINDEX index_name

刪除指定的向量索引及該索引內的所有數據。

TVS.SCANINDEX

TVS.SCANINDEX cursor [MATCH pattern] [COUNT count]

掃描Tair實例中所有符合條件的向量索引。

向量數據操作

TVS.HSET

TVS.HSET index_name key attribute_key attribute_value [attribute_key attribute_value] ...

往向量索引中插入數據記錄(key),若該記錄已存在則更新并覆蓋原記錄。

TVS.HGETALL

TVS.HGETALL index_name key

查詢指定向量索引中的key對應的所有數據記錄。

TVS.HMGET

TVS.HMGET index_name key attribute_key [attribute_key ...]

查詢指定向量索引的key中對應的attribute_key所對應的數值。

TVS.DEL

TVS.DEL index_name key [key ...]

在指定向量索引中,刪除指定數據記錄(key)。

TVS.HDEL

TVS.HDEL index_name key attribute_key [attribute_key ...]

在向量索引的數據記錄(key)中,刪除指定的attribute_key與其數值。

TVS.SCAN

TVS.SCAN index_name cursor [MATCH pattern] [COUNT count] [FILTER filter_string] [VECTOR vector] [MAX_DIST max_distance]

在指定向量索引中,掃描符合條件的數據記錄(key)。

TVS.HINCRBY

TVS.HINCRBY index_name key attribute_key num

在指定向量索引中,將指定數據記錄(key)的attribute_key的值增加num,num為一個整數。

TVS.HINCRBYFLOAT

TVS.HINCRBYFLOAT index_name key attribute_key num

在指定向量索引中,將指定數據記錄(key)的attribute_key的值增加num,num為一個浮點數。

TVS.HPEXPIREAT

TVS.HPEXPIREAT index_name key milliseconds-timestamp

在指定向量索引中,為指定數據記錄(key)設置絕對過期時間,精確到毫秒。

TVS.HPEXPIRE

TVS.HPEXPIRE index_name key milliseconds-timestamp

在指定向量索引中,為指定數據記錄(key)設置相對過期時間,精確到毫秒。

TVS.HEXPIREAT

TVS.HEXPIREAT index_name key timestamp

在指定向量索引中,為指定數據記錄(key)設置絕對過期時間,精確到秒。

TVS.HEXPIRE

TVS.HEXPIRE index_name key timestamp

在指定向量索引中,為指定數據記錄(key)設置相對過期時間,精確到秒。

TVS.HPTTL

TVS.HPTTL index_name key

在指定向量索引中,查看指定數據記錄(key)的剩余過期時間,精確到毫秒。

TVS.HTTL

TVS.HTTL index_name key

在指定向量索引中,查看指定數據記錄(key)的剩余過期時間,精確到秒。

TVS.HPEXPIRETIME

TVS.HPEXPIRETIME index_name key

在指定向量索引中,查看指定數據記錄(key)的絕對過期時間,精確到毫秒。

TVS.HEXPIRETIME

TVS.HEXPIRETIME index_name key

在指定向量索引中,查看指定數據記錄(key)的絕對過期時間,精確到秒。

向量近鄰查詢

TVS.KNNSEARCH

TVS.KNNSEARCH index_name topN vector [filter_string] [param_key param_value]

在指定向量索引中,對指定的向量(VECTOR)進行近鄰查詢,最多可返回topN條。

TVS.KNNSEARCHFIELD

TVS.KNNSEARCHFIELD index_name topN vector field_count field_name [field_name ...] [filter_string] [param_key param_value]

在指定向量索引中,對指定的向量(VECTOR)進行近鄰查詢,檢索邏輯與TVS.KNNSEARCH相同,額外支持返回標簽屬性。

TVS.GETDISTANCE

TVS.GETDISTANCE index_name vector key_count key [key, ...] [TOPN topN] [FILTER filter_string] [MAX_DIST max_distance]

在指定向量索引中,針對指定Key列表,進行向量(VECTOR)近鄰查詢。

TVS.MKNNSEARCH

TVS.MKNNSEARCH index_name topN vector_count vector [vector ...] [filter_string] [param_key param_value]

在指定向量索引中,批量對多條向量(VECTOR)進行近鄰查詢。

TVS.MINDEXKNNSEARCH

TVS.MINDEXKNNSEARCH index_count index_name [index_name ...] topN vector [filter_string] [param_key param_value]

在多個向量索引中,對指定的向量(VECTOR)進行近鄰查詢。

TVS.MINDEXKNNSEARCHFIELD

TVS.MINDEXKNNSEARCHFIELD index_count index_name [index_name ...] topN vector field_count field_name [field_name ...] [filter_string] [param_key param_value]

在多個向量索引中,對指定的向量(VECTOR)進行近鄰查詢,支持返回標簽屬性。

TVS.MINDEXMKNNSEARCH

TVS.MINDEXMKNNSEARCH index_count index_name [index_name ...] topN vector_count vector [vector ...] [filter_string] [param_key param_value]

在多個向量索引中,批量對多條向量(VECTOR)進行近鄰查詢。

說明

本文的命令語法定義如下:

  • 大寫關鍵字:命令關鍵字。

  • 斜體:變量。

  • [options]:可選參數,不在括號中的參數為必選。

  • A|B:該組參數互斥,請進行二選一或多選一。

  • ...:前面的內容可重復。

TVS.CREATEINDEX

類別

說明

語法

TVS.CREATEINDEX index_name dims algorithm distance_method [algo_param_key alog_param_value] ...

時間復雜度

O(1)

命令描述

創建一個向量索引空間,同時指定構建索引和查詢的具體算法,以及距離函數。該對象僅能通過TVS.DELINDEX命令刪除。

選項

  • index_name:向量索引名稱。

  • dims:向量維度,插入該索引的向量需具有相同的向量維度,取值范圍為[1, 32768]。

  • algorithm:構建、查詢索引的算法,取值如下:

    • FLAT:不單獨構建索引,采用暴力搜索的方式執行查詢,適合1萬條以下的小規模數據集。

    • HNSW:采用HNSW圖結構構建整個索引,并通過該算法進行查詢,適合大規模的數據集。

  • distance_method:計算向量距離函數,取值如下:

    • L2:平方歐氏距離。

    • IP:向量內積,距離值為1-向量內積

    • COSINE:余弦距離,距離值為1-向量余弦值。使用余弦距離會將寫入的向量轉化為單元向量(L2正則化),因此查詢得到的向量結果可能不是原始向量值。

    • JACCARD:Jaccard距離,距離值為1-Jaccard系數,且需指定向量數據類型(data_type)為BINARY

  • algo_param_keyalog_param_value

    • data_type:(稠密)向量的數據類型,取值說明如下。

      • FLOAT32(默認):4字節的單精度浮點數。

      • FLOAT16:2字節的半精度浮點數(IEEE 754-2008標準),可節省向量存儲空間,但會損失一定的精度,FLOAT16能表示的最大數值范圍為[-65519, 65519]。

      • BINARY:二進制向量,僅能包含0或1,僅支持Jaccard距離函數。

    • HNSW索引的特定參數,取值說明如下:

      • ef_construct:使用HNSW算法構建索引時,動態列表的長度。默認為100,取值范圍為[1,1000],該值越大則ANN查詢精度越高,同時性能開銷越大。

      • M:圖索引結構中,每一層的最大出邊數量。默認為16,取值范圍為[1,100]。該值越大則ANN查詢精度越高,同時性能開銷越大。

      • auto_gc:自動回收索引空間,取值為false(默認,表示關閉)、true(表示開啟),該功能要求實例的小版本為6.2.8.2及以上。HNSW索引的向量刪除采用標記刪除的方式,開啟該功能后,支持索引空間的自動回收,可有效降低內存占用,但該功能會影響該索引近鄰查詢的性能,推薦對內存占用量敏感的場景使用該功能。

    • HybridIndex(混合索引)的特定參數,取值說明如下:

      • 如需對指定標簽字段創建倒排索引,需提前指定字段名稱與對應的數據類型。

        語法為inverted_index_<field_name> int|long|float|double|string,對field_name字段建立倒排索引,支持的類型為Int、Long、Float、Double和String,field_name字段和數據類型關鍵字需小寫。

        例如希望對productname字段(String類型)創建倒排索引的示例為inverted_index_productname string

      • lexical_algorithm:全文檢索算法。

        • bm25:BM25(Okapi BM25)算法,您可傳入原始文本,由Tair向量服務構建索引。

        • vector:Vector算法,適用于稀疏向量。

          您需要對原始文本進行編碼(Embedding),傳入稀疏向量。數據格式為"[[2,0.221],[42,09688],...]",其中Key為Indices,類型為uint32_t,Value為該Index的詞頻概覽,類型為Float。

      • lexical_algorithm設置為bm25,您還可以設置如下參數。

        • analyzer:分詞器,當前支持jieba(默認)、ik_smart

        • k1:BM25算法中控制詞頻飽和度,默認為1.2,取值范圍需大于0。

        • b:BM25算法中控制文檔長度的影響,默認為0.75,取值范圍為[0,1]。

      • lexical_algorithm設置為vector,您還可以設置如下參數。

        • lexical_use_hnsw:稀疏向量是否使用HNSW索引,取值:1(使用HNSW索引)、0(默認,使用倒排索引)。

        • lexical_hnsw_m:當lexical_use_hnsw為1時,該參數為HNSW索引的M參數,作用與說明請參見HNSW索引的特定參數

        • lexical_hnsw_ef_construct:當lexical_use_hnsw為1時,該參數為HNSW索引的ef_construct參數,作用與說明請參見HNSW索引的特定參數

      • hybrid_ratio:該索引在查詢時向量檢索的默認權重,默認為0.5,取值范圍為[0,1],Float類型,全文檢索的權重為1-hybrid_ratio

返回值

  • 執行成功:返回OK。

  • 其他情況返回相應的異常信息。

示例

命令示例:

# 創建向量存儲結構:向量維度為2、索引類型為HNSW、距離函數為Jaccard、向量數據類型為BINARY。
TVS.CREATEINDEX index_name0 2 HNSW JACCARD data_type BINARY

# 創建向量存儲結構:向量維度為2、索引類型為HNSW、距離函數為L2、向量數據類型為FLOAT32。
TVS.CREATEINDEX index_name1 2 HNSW L2 

# 創建向量存儲結構:向量維度為2、索引類型為FLAT、距離函數為IP、向量數據類型為FLOAT32。
TVS.CREATEINDEX index_name2 2 FLAT IP 

# 創建向量存儲結構:向量維度為2、索引類型為FLAT、距離函數為Jaccard、向量數據類型為BINARY。
TVS.CREATEINDEX index_name3 2 FLAT JACCARD data_type BINARY

# 創建向量存儲結構:向量維度為2、索引類型為HNSW、距離函數為IP、向量數據類型為FLOAT32、全文檢索算法為BM25,指定productname字段(String類型)為倒排索引。
TVS.CREATEINDEX index_name4 2 HNSW IP lexical_algorithm bm25 inverted_index_productname string

# 創建稀疏向量存儲結構:向量維度為2、距離函數為IP、使用HNSW索引。
TVS.CREATEINDEX index_name5 2 HNSW IP lexical_algorithm vector lexical_use_hnsw 1 lexical_hnsw_m 8 lexical_hnsw_ef_construct 100

返回示例均為如下:

OK

TVS.GETINDEX

類別

說明

語法

TVS.GETINDEX index_name

時間復雜度

O(1)

命令描述

查詢指定的向量索引,獲取該向量索引的元數據信息。

選項

  • index_name:向量索引名稱。

返回值

  • 執行成功:返回該向量索引的元數據信息。

  • 若指定的向量索引不存在,返回(empty array)

  • 其他情況返回相應的異常信息。

示例

請提前執行如下命令:

TVS.CREATEINDEX my_index 2 HNSW L2 auto_gc true lexical_algorithm bm25
TVS.HSET my_index key0 VECTOR [1,2] creation_time 1730
TVS.HSET my_index key1 VECTOR [3,4] creation_time 1740
TVS.HSET my_index key2 VECTOR [5,6] creation_time 1750

命令示例(以HNSW算法的向量索引為例):

TVS.GETINDEX my_index

返回示例:

 1) "lexical_term_count"   // 全文索引分詞數,Int類型。
 2) "0"
 3) "lexical_record_count" // 全文索引文檔數,Int類型。
 4) "0"
 5) "lexical_algorithm"    // 全文索引算法。
 6) "bm25"
 7) "auto_gc"              // HNSW算法模式下,是否開啟自動回收索引空間。
 8) "1"
 9) "dimension"            // 向量維度。
10) "2"
11) "attribute_data_size"  // 屬性信息內存占用(單位:字節)。
12) "3720"
13) "distance_method"      // 向量距離函數。
14) "L2"
15) "data_type"            // 向量數據類型。
16) "FLOAT32"
17) "algorithm"            // 索引算法。
18) "HNSW"
19) "index_data_size"      // 向量數據內存占用(單位:字節)。
20) "105128040"
21) "M"                    // HNSW算法模式下,圖索引結構中,每一層的最大出邊數量。
22) "16"
23) "data_count"           // 用戶記錄數。
24) "3"
25) "current_record_count" // 總向量數。
26) "3"
27) "ef_construct"         // HNSW算法模式下,動態列表的長度。
28) "100"
29) "inverted_index_productname" // 倒排索引信息:字段名稱、數據類型、數量。
30) "field: productname, type: string, size: 1"
31) "delete_record_count"  // 待回收的向量數。
32) "0"

TVS.DELINDEX

類別

說明

語法

TVS.DELINDEX index_name

時間復雜度

O(N),N為該向量索引中Key的數量。

命令描述

刪除指定的向量索引及該索引內的所有數據。

選項

  • index_name:向量索引名稱。

返回值

  • 執行成功:刪除向量索引,并返回1。

  • 若指定索引不存在,返回0。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.DELINDEX index_name0

返回示例:

 (integer) 1

TVS.SCANINDEX

類別

說明

語法

TVS.SCANINDEX cursor [MATCH pattern] [COUNT count]

時間復雜度

O(N),N為Tair實例中向量索引數量。

命令描述

掃描Tair實例中所有符合條件的向量索引。

選項

  • cursor:指定本次掃描的游標,從0開始。

  • pattern:模式匹配。

  • count:指定本次掃描的數量,默認為10,但無法保證每次迭代都返回精準的元素數量。

返回值

  • 執行成功,返回一個數組:

    • 第一個元素:下次查詢的游標,若已掃描完成,則返回0。

    • 第二個元素:本次查詢的向量索引( index_name)名稱。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.SCANINDEX 0

返回示例:

1) "0"
2) 1) "index_name1"
   2) "index_name0"
   3) "index_name2"
   4) "index_name3"

帶Pattern的查詢示例:

TVS.SCANINDEX 0 MATCH **name[0|1]

返回示例:

1) "0"
2) 1) "index_name1"
   2) "index_name0"

TVS.HSET

類別

說明

語法

TVS.HSET index_name key attribute_key attribute_value [attribute_key attribute_value] ...

時間復雜度

若本次插入、更新數據無需創建或更新向量值,則時間復雜度為O(1);否則時間復雜度為O(log(N)),N為該向量索引中Key的數量。

命令描述

往向量索引中插入數據記錄(key),若該記錄已存在則更新并覆蓋原記錄。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識,該對象可通過TVS.DEL命令刪除。

  • attribute_keyattribute_value:該條記錄的數值,為Key-value格式。

    • 插入向量數據:需要將attribute_key設置為VECTOR關鍵字(必須大寫),對應的attribute_value則需要為該向量索引指定維度(dims)的向量數據字符串,例如VECTOR [1,2]。一個Key僅支持寫入一個VECTOR數據,若重復寫入會更新并覆蓋原數據。

    • 插入文本數據:在創建索引時已制定HybridIndex相關參數,需要將attribute_key設置為TEXT關鍵字(必須大寫),對應的attribute_value可以是文本格式(Text),例如"TairVector是Tair自研的向量數據庫服務",也可以是向量化(Embedding)后的數據,例如"[[2,0.221],[42,09688],...]"

    • 插入其他屬性:可以自定義額外屬性或信息,例如create_time 1663637425(創建時間)、location Hangzhou(地點)等。

返回值

  • 執行成功:返回新增的數據記錄數量,若更新已有的字段則返回0。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HSET my_index key5 VECTOR [7,8] TEXT "TairVector是Tair自研的向量數據庫服務" create_time 1800

返回示例:

(integer) 3

TVS.HGETALL

類別

說明

語法

TVS.HGETALL index_name key

時間復雜度

O(1)

命令描述

查詢指定向量索引中的key對應的所有數據記錄。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

返回值

  • 執行成功:返回該key的所有數據記錄。

  • 若指定的向量索引或key不存在,返回(empty array)

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HGETALL index_name0 key0

返回示例:

1) "VECTOR"
2) "[1,2]"
3) "location"
4) "Hangzhou"
5) "create_time"
6) "1663637425"

TVS.HMGET

類別

說明

語法

TVS.HMGET index_name key attribute_key [attribute_key ...]

時間復雜度

O(1)

命令描述

查詢指定向量索引的key中對應的attribute_key所對應的數值。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

  • attribute_key:待操作的屬性Key,支持指定多個。若需查詢向量數據,需傳入VECTOR關鍵字(必須大寫)。若需查詢全文索引中原生文本數據,需傳入TEXT關鍵字(必須大寫)。

返回值

  • 執行成功:返回attribute_key對應的數值。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HMGET index_name0 key0 create_time location VECTOR TEXT

返回示例:

1) "1800"
2) "[7,8]"
3) "TairVector是Tair自研的向量數據庫服務"

TVS.DEL

類別

說明

語法

TVS.DEL index_name key [key ...]

時間復雜度

O(1)

命令描述

在指定向量索引中,刪除指定數據記錄(key)。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識,支持指定多個。

返回值

  • 執行成功:刪除指定數據記錄(key),并返回刪除key的數量。

  • 若指定索引不存在,返回0。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.DEL index_name0 keyV

返回示例:

 (integer) 1

TVS.HDEL

類別

說明

語法

TVS.HDEL index_name key attribute_key [attribute_key ...]

時間復雜度

O(1)

命令描述

在向量索引的數據記錄(key)中,刪除指定的attribute_key與其數值。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識,支持指定多個。

  • attribute_key:待操作的屬性Key,支持指定多個。若需刪除向量數據,需傳入VECTOR關鍵字(必須大寫)。若需刪除全量索引數據,需傳入TEXT關鍵字(必須大寫)。

返回值

  • 執行成功:刪除指定數據,并返回刪除attribute_key的數量。

  • 若指定索引不存在,返回0。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HDEL index_name0 keyc VECTOR

返回示例:

 (integer) 1

TVS.SCAN

類別

說明

語法

TVS.SCAN index_name cursor [MATCH pattern] [COUNT count] [FILTER filter_string] [VECTOR vector] [MAX_DIST max_distance]

時間復雜度

O(N),N為該向量索引中Key的數量。

命令描述

在指定向量索引中,掃描符合條件的數據記錄(key)。

選項

  • index_name:向量索引名稱。

  • cursor:指定本次掃描的游標,從0開始。

  • pattern:模式匹配。

  • count:指定本次掃描的數量,默認為10,但無法保證每次迭代都返回精準的元素數量。

  • filter_string:過濾條件。

    • 支持+-*/<>!=()&&||等操作符,暫不支持比較字符串之間的大小。如需輸入字符串,請輸入轉義字符(\),例如create_time > 1663637425 && location == \"Hangzhou\"。

    • 操作符兩側必須用空格隔開,例如"creation_time > 1735"。

    • 不支持flag == true類型的比較,即不支持true、false布爾類型,可以替換為flag == \"true\",當成字符串傳遞即可。

  • vector:查詢向量,需要配合max_distance參數使用。

  • max_distance:最大距離限制,必須配合vector參數使用。填寫這兩個參數后,返回結果與vector參數的距離將小于max_distance參數。

返回值

  • 執行成功,返回一個數組:

    • 第一個元素:下次查詢的游標,若已掃描完成,則返回0。

    • 第二個元素:本次查詢的數據記錄(key)名稱。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.SCAN index_name0 0

返回示例:

1) "0"
2) 1) "key0"
   2) "keyV"

TVS.HINCRBY

類別

說明

語法

TVS.HINCRBY index_name key attribute_key num

時間復雜度

O(1)

命令描述

在指定向量索引中,將指定數據記錄(key)的attribute_key的值增加num,num為一個整數。

若指定的attribute_key不存在則自動新建并賦予該值,若該記錄已存在則更新并覆蓋原值。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

  • attribute_key:待操作的屬性Key。

  • num:需要為attribute_key的value增加的整數值。

返回值

  • 執行成功:添加num后的值。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HINCRBY index_name0 key0 tv01 20 

返回示例:

(integer) 20

TVS.HINCRBYFLOAT

類別

說明

語法

TVS.HINCRBYFLOAT index_name key attribute_key num

時間復雜度

O(1)

命令描述

在指定向量索引中,將指定數據記錄(key)的attribute_key的值增加num,num為一個浮點數。

若指定的attribute_key不存在則自動新建并賦予該值,若該記錄已存在則更新并覆蓋原值。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

  • attribute_key:待操作的屬性Key。

  • num:需要為attribute_key的value增加的值,類型為Float。

返回值

  • 執行成功:添加num后的值。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HINCRBYFLOAT index_name0 key0 tv02 9.34

返回示例:

"9.34"

TVS.HPEXPIREAT

類別

說明

語法

TVS.HPEXPIREAT index_name key milliseconds-timestamp

時間復雜度

O(1)

命令描述

在指定向量索引中,為指定數據記錄(key)設置絕對過期時間,精確到毫秒。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

  • milliseconds-timestamp:精確到毫秒的UNIX時間戳 (Unix timestamp)。若該時間早于當前時間,則該key會立即過期。

返回值

  • key存在且設置成功:1。

  • key不存在:0。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HPEXPIREAT index_name0 key1 16914619090000

返回示例:

(integer) 1

TVS.HPEXPIRE

類別

說明

語法

TVS.HPEXPIRE index_name key milliseconds-timestamp

時間復雜度

O(1)

命令描述

在指定向量索引中,為指定數據記錄(key)設置相對過期時間,精確到毫秒。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

  • milliseconds-timestamp:相對過期時間,單位為毫秒。

返回值

  • key存在且設置成功:1。

  • key不存在:0。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HPEXPIRE index_name0 key1 1000

返回示例:

(integer) 1

TVS.HEXPIREAT

類別

說明

語法

TVS.HEXPIREAT index_name key timestamp

時間復雜度

O(1)

命令描述

在指定向量索引中,為指定數據記錄(key)設置絕對過期時間,精確到秒。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

  • timestamp:精確到秒的UNIX時間戳 (Unix timestamp)。若該時間早于當前時間,則該key會立即過期。

返回值

  • key存在且設置成功:1。

  • key不存在:0。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HPEXPIREAT index_name0 key2 1691466981

返回示例:

(integer) 1

TVS.HEXPIRE

類別

說明

語法

TVS.HEXPIRE index_name key timestamp

時間復雜度

O(1)

命令描述

在指定向量索引中,為指定數據記錄(key)設置相對過期時間,精確到秒。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

  • timestamp:相對過期時間,單位為秒。

返回值

  • key存在且設置成功:1。

  • key不存在:0。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HPEXPIREAT index_name0 key2 100

返回示例:

(integer) 1

TVS.HPTTL

類別

說明

語法

TVS.HPTTL index_name key

時間復雜度

O(1)

命令描述

在指定向量索引中,查看指定數據記錄(key)的剩余過期時間,精確到毫秒。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

返回值

  • key存在且設置了過期時間:剩余過期時間,單位為毫秒。

  • key存在但未設置過期時間:-1。

  • keyindex_name不存在:-2。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HPTTL index_name0 key2

返回示例:

(integer) 65417

TVS.HTTL

類別

說明

語法

TVS.HTTL index_name key

時間復雜度

O(1)

命令描述

在指定向量索引中,查看指定數據記錄(key)的剩余過期時間,精確到秒。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

返回值

  • key存在且設置了過期時間:剩余過期時間,單位為秒。

  • key存在但未設置過期時間:-1。

  • keyindex_name不存在:-2。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HTTL index_name0 key2

返回示例:

(integer) 58

TVS.HPEXPIRETIME

類別

說明

語法

TVS.HPEXPIRETIME index_name key

時間復雜度

O(1)

命令描述

在指定向量索引中,查看指定數據記錄(key)的絕對過期時間,精確到毫秒。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

返回值

  • key存在且設置了過期時間:絕對過期時間(Unix timestamp),單位為毫秒。

  • key存在但未設置過期時間:-1。

  • keyindex_name不存在:-2。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HPEXPIRETIME index_name0 key2

返回示例:

(integer) 1691473985764

TVS.HEXPIRETIME

類別

說明

語法

TVS.HEXPIRETIME index_name key

時間復雜度

O(1)

命令描述

在指定向量索引中,查看指定數據記錄(key)的絕對過期時間,精確到秒。

選項

  • index_name:向量索引名稱。

  • key:該記錄的主鍵標識。

返回值

  • key存在且設置了過期時間:絕對過期時間(Unix timestamp),單位為秒。

  • key存在但未設置過期時間:-1。

  • keyindex_name不存在:-2。

  • 其他情況返回相應的異常信息。

示例

命令示例:

TVS.HEXPIRETIME index_name0 key2

返回示例:

(integer) 1691473985

TVS.KNNSEARCH

類別

說明

語法

TVS.KNNSEARCH index_name topN vector [filter_string] [param_key param_value]

時間復雜度

  • HNSW算法:O(log(N))

  • FLAT算法:O(N)

N為該向量索引中Key的數量。

命令描述

在指定向量索引中,對指定的向量(VECTOR)進行近鄰查詢,最多可返回topN條。

選項

  • index_name:向量索引名稱。

  • topN:查詢返回的數量,取值范圍為[1,10000]。

  • vector:執行近鄰查詢的向量值。若您僅希望執行全文檢索(索引為混合索引),可在該字段傳入""

  • filter_string:過濾條件。

    • 支持+-*/<>!=()&&||等操作符,暫不支持比較字符串之間的大小。如需輸入字符串,請輸入轉義字符(\),例如"create_time > 1663637425 && location == \"Hangzhou\""

    • 操作符兩側必須用空格隔開,例如"creation_time > 1735"

    • 不支持flag == true類型的比較,即不支持true、false布爾類型,可以替換為flag == \"true\",當成字符串傳遞即可。

  • param_keyparam_value:查詢的運行參數,取值如下。

    • ef_search:查詢索引的時候,動態列表的長度,默認為100,取值范圍為[1,1000],該值越大則查詢精度越高,同時性能開銷越大。該參數為HNSW算法的特定參數。

      sparse_ef_search:在創建混合索引時,如果稀疏向量使用了HNSW索引,則請使用sparse_ef_search參數為稀疏向量HNSW索引的ef_search參數。

    • MAX_DIST:最大距離限制,Float類型,若某Key與待查詢向量的距離大于該值,則會過濾,不會返回。

    • TEXT:執行查詢的文本(混合檢索),可傳入文本類型或向量類型,若不傳入該字段或在該字段傳入"",表示不進行全文檢索,僅執行向量檢索。

    • hybrid_ratio:本次查詢時向量檢索的權重,默認為TVS.CREATEINDEX設置的hybrid_ratio值,取值范圍為[0,1],Float類型,全量檢索的權重為1-hybrid_ratio

    • 默認情況下,系統使用先執行KNN向量檢索、再執行標量檢索的后置過濾(PostFilter)策略。

      • vector_filter_count:向量檢索過濾的最大數量,默認為10000。

        在PostFilter策略中,當向量檢索結果過濾超過vector_filter_count條記錄,但仍未到達足夠返回的數據量時,系統會終止向量檢索遍歷。

      • fulltext_filter_count:全文檢索過濾的最大數量,默認為10000。

        在PostFilter策略中,當全文檢索結果過濾超過fulltext_filter_count條記錄,但仍未到達足夠返回的數據量時,系統會終止全文檢索遍歷。

      • 若您希望系統先執行倒排索引的標量檢索,再執行KNN向量檢索的前置過濾(PreFilter)策略,您可以在查詢中增加search_policy scala參數。

        同時提供ivf_filter_count參數,即倒排索引過濾的最大數量,默認為10000。在PreFilter策略中,當倒排索引過濾的結果超過ivf_filter_count條記錄時,系統會自動退化為PostFilter策略。

      說明

      在絕大多數情況下,上述默認參數可以在確保準確性的前提下保證系統的延遲。您可以在特定請求中調整上述參數,但上述參數越大,請求延遲也可能越大。

返回值

  • 執行成功:按距離近到遠的順序返回近鄰的key及與該目標向量的距離。

  • 若指定的向量索引不存在,返回(empty array)

  • 其他情況返回相應的異常信息。

示例

請提前執行如下命令:

TVS.CREATEINDEX my_index_k 2 HNSW L2 inverted_index_productname string
TVS.HSET my_index_k key0 VECTOR [1,2] creation_time 1730 productname "Aliyun"
TVS.HSET my_index_k key1 VECTOR [3,4] creation_time 1740 productname "other"
TVS.HSET my_index_k key2 VECTOR [5,6] creation_time 1750 productname "Aliyun"

命令示例1:

TVS.KNNSEARCH my_index_k 2 [3,3.1] "creation_time > 1735"

返回示例1:

1) "key1"
2) "0.81000018119812012"
3) "key2"
4) "12.410000801086426"

命令示例2:

TVS.KNNSEARCH my_index_k 2 [3,3.1]  "creation_time > 1735 && productname ==  \"Aliyun\"" search_policy scala ivf_filter_count 15000

返回示例2:

1) "key2"
2) "12.410000801086426"

TVS.KNNSEARCHFIELD

類別

說明

語法

TVS.KNNSEARCHFIELD index_name topN vector field_count field_name [field_name ...] [filter_string] [param_key param_value]

時間復雜度

  • HNSW算法:O(log(N))

  • FLAT算法:O(N)

N為該向量索引中Key的數量。

命令描述

在指定向量索引中,對指定的向量(VECTOR)進行近鄰查詢,檢索邏輯與TVS.KNNSEARCH相同,額外支持返回標簽屬性。

選項

  • index_name:向量索引名稱。

  • topN:查詢返回的數量,取值范圍為[1,10000]。

  • vector:執行近鄰查詢的向量值。若您僅希望執行全文檢索(索引為混合索引),可在該字段傳入""

  • field_count:返回結果中標簽屬性的數量,若希望返回所有標簽,可以設置field_count為0。

  • field_name:標簽名稱,數量需要與field_count保持一致。

  • filter_string:過濾條件,更多信息請參見TVS.KNNSEARCH中的說明。

  • param_keyparam_value:查詢的運行參數,更多信息請參見TVS.KNNSEARCH中的說明。

返回值

  • 執行成功:按距離近到遠的順序返回近鄰的key及與該目標向量的距離,以及對應的標簽屬性鍵值對。

  • 若指定的向量索引不存在,返回(empty array)

  • 其他情況返回相應的異常信息。

示例

請提前執行如下命令:

TVS.CREATEINDEX my_index_k 2 HNSW L2
TVS.HSET my_index_k key0 VECTOR [1,2] creation_time 1730
TVS.HSET my_index_k key1 VECTOR [3,4] creation_time 1740
TVS.HSET my_index_k key2 VECTOR [5,6] creation_time 1750

命令示例:

TVS.KNNSEARCHFIELD my_index_k 2 [3,3.1] 0 "creation_time > 1735"

返回示例:

1) 1) "key1"
   2) "0.81000018119812012"
   3) "VECTOR"
   4) "[3,4]"
   5) "creation_time"
   6) "1740"
2) 1) "key2"
   2) "12.410000801086426"
   3) "VECTOR"
   4) "[5,6]"
   5) "creation_time"
   6) "1750"

TVS.GETDISTANCE

類別

說明

語法

TVS.GETDISTANCE index_name vector key_count key [key, ...] [TOPN topN] [FILTER filter_string] [MAX_DIST max_distance]

時間復雜度

  • HNSW算法:O(log(N))

  • FLAT算法:O(N)

N為該向量索引中Key的數量。

命令描述

在指定向量索引中,針對指定Key列表,進行向量(VECTOR)近鄰查詢。

選項

  • index_name:向量索引名稱。

  • vector:執行近鄰查詢的向量值。

  • key_count:候選Key的數量。

  • key:Key名稱,Key的數量需要與key_count一致。

  • TOPN:查詢返回的數量,默認為key_count,取值范圍為[1,key_count]。

  • FILTER:過濾條件。

    • 支持+-*/<>!=()&&||等操作符,暫不支持比較字符串之間的大小。如需輸入字符串,請輸入轉義字符(\),例如create_time > 1663637425 && location == \"Hangzhou\"

    • 操作符兩側必須用空格隔開,例如"creation_time > 1735"

    • 不支持flag == true類型的比較,即不支持true、false布爾類型,可以替換為flag == \"true\",當成字符串傳遞即可。

  • MAX_DIST:最大距離限制,若某Key與待查詢向量的距離大于該值,則會過濾,不會返回。

返回值

  • 執行成功:默認按Key的順序返回對應距離,若指定了TOPN,則按距離近到遠的順序返回近鄰Key與對應距離。

  • 若指定的向量索引不存在,返回(empty array)

  • 其他情況返回相應的異常信息。

示例

請提前執行如下命令:

TVS.CREATEINDEX my_index_k 2 HNSW L2
TVS.HSET my_index_k key0 VECTOR [1,2] creation_time 1730
TVS.HSET my_index_k key1 VECTOR [3,4] creation_time 1740
TVS.HSET my_index_k key2 VECTOR [5,6] creation_time 1750

命令示例:

TVS.GETDISTANCE my_index_k [1,1] 2 key1 key2

返回示例:

1) "key1"
2) "13"
3) "key2"
4) "41"

TVS.MKNNSEARCH

類別

說明

語法

TVS.MKNNSEARCH index_name topN vector_count vector [vector ...] [filter_string] [param_key param_value]

時間復雜度

  • HNSW算法:vector_count * O(log(N))

  • FLAT算法:vector_count * O(N)

N為該向量索引中Key的數量。

命令描述

在指定向量索引中,批量對多條向量(VECTOR)進行近鄰查詢。

選項

  • index_name:向量索引名稱。

  • topN:每條向量查詢返回的數量,取值范圍為[1,10000]。

  • vector_count :查詢的向量數。

  • vector:執行近鄰查詢的向量值。若您僅希望執行全文檢索(索引為混合索引),可在該字段傳入""

  • filter_string:過濾條件,更多信息請參見TVS.KNNSEARCH中的說明。

  • param_keyparam_value:查詢的運行參數,更多信息請參見TVS.KNNSEARCH中的說明。

返回值

  • 執行成功:按向量查詢順序返回多個查詢結果數組,每個數組中按距離近到遠的順序返回近鄰的key及與該目標向量的距離。

  • 若指定的向量索引不存在,返回(empty array)

  • 其他情況返回相應的異常信息。

示例

請提前執行如下命令:

TVS.CREATEINDEX my_index_m 2 HNSW L2
TVS.HSET my_index_m key0 VECTOR [1,2] creation_time 1730
TVS.HSET my_index_m key1 VECTOR [3,4] creation_time 1740
TVS.HSET my_index_m key2 VECTOR [5,6] creation_time 1750

命令示例:

TVS.MKNNSEARCH my_index_m 2 2 [3,4] [5,6] "creation_time > 1735"

返回示例:

1) 1) "key1"
   2) "0"
   3) "key2"
   4) "8"
2) 1) "key2"
   2) "0"
   3) "key1"
   4) "8"

TVS.MINDEXKNNSEARCH

類別

說明

語法

TVS.MINDEXKNNSEARCH index_count index_name [index_name ...] topN vector [filter_string] [param_key param_value]

時間復雜度

  • HNSW算法:index_count * O(log(N))

  • FLAT算法:index_count * O(N)

N為該向量索引中Key的數量。

命令描述

在多個向量索引中,對指定的向量(VECTOR)進行近鄰查詢。

選項

  • index_count:向量索引的數量。

  • index_name:向量索引名稱。

  • topN:查詢返回的數量,取值范圍為[1,10000],默認會查詢出每個向量索引的topN個結果,并將所有查詢結果進行聚合,返回距離最近的topN個結果。

  • vector:執行近鄰查詢的向量值。

  • filter_string:過濾條件,更多信息請參見TVS.KNNSEARCH中的說明。

  • param_keyparam_value:查詢的運行參數,更多信息請參見TVS.KNNSEARCH中的說明。

返回值

  • 執行成功:按距離近到遠的順序返回近鄰的key及與該目標向量的距離。

  • 若指定的向量索引不存在,返回(empty array)

  • 其他情況返回相應的異常信息。

示例

請提前執行如下命令:

TVS.CREATEINDEX my_index_mk 2 HNSW L2
TVS.HSET my_index_mk key0 VECTOR [1,2] creation_time 1730
TVS.HSET my_index_mk key1 VECTOR [3,4] creation_time 1740
TVS.HSET my_index_mk key2 VECTOR [5,6] creation_time 1750
TVS.CREATEINDEX my_index_mx 2 HNSW L2
TVS.HSET my_index_mx key5 VECTOR [8,7] creation_time 1730
TVS.HSET my_index_mx key6 VECTOR [6,5] creation_time 1740
TVS.HSET my_index_mx key7 VECTOR [4,3] creation_time 1750

命令示例:

TVS.MINDEXKNNSEARCH 2 my_index_mk my_index_mx 2 [0,0]

返回示例:

1) "key0"
2) "5"
3) "key7"
4) "25"

TVS.MINDEXKNNSEARCHFIELD

類別

說明

語法

TVS.MINDEXKNNSEARCHFIELD index_count index_name [index_name ...] topN vector field_count field_name [field_name ...] [filter_string] [param_key param_value]

時間復雜度

  • HNSW算法:index_count * O(log(N))

  • FLAT算法:index_count * O(N)

N為該向量索引中Key的數量。

命令描述

在多個向量索引中,對指定的向量(VECTOR)進行近鄰查詢,支持返回標簽屬性。

選項

  • index_count:向量索引的數量。

  • index_name:向量索引名稱。

  • topN:查詢返回的數量,取值范圍為[1,10000],默認會查詢出每個向量索引的topN個結果,并將所有查詢結果進行聚合,返回距離最近的topN個結果。

  • vector:執行近鄰查詢的向量值。

  • field_count:返回結果中標簽屬性的數量,若希望返回所有標簽,可以設置field_count為0。

  • field_name:標簽名稱,數量需要與field_count保持一致。

  • filter_string:過濾條件,更多信息請參見TVS.KNNSEARCH中的說明。

  • param_keyparam_value:查詢的運行參數,更多信息請參見TVS.KNNSEARCH中的說明。

返回值

  • 執行成功:按距離近到遠的順序返回近鄰的key及與該目標向量的距離,以及對應的標簽屬性鍵值對。

  • 若指定的向量索引不存在,返回(empty array)

  • 其他情況返回相應的異常信息。

示例

請提前執行如下命令:

TVS.CREATEINDEX my_index_mk 2 HNSW L2
TVS.HSET my_index_mk key0 VECTOR [1,2] creation_time 1730
TVS.HSET my_index_mk key1 VECTOR [3,4] creation_time 1740
TVS.HSET my_index_mk key2 VECTOR [5,6] creation_time 1750
TVS.CREATEINDEX my_index_mx 2 HNSW L2
TVS.HSET my_index_mx key5 VECTOR [8,7] creation_time 1730
TVS.HSET my_index_mx key6 VECTOR [6,5] creation_time 1740
TVS.HSET my_index_mx key7 VECTOR [4,3] creation_time 1750

命令示例:

TVS.MINDEXKNNSEARCHFIELD 2 my_index_mk my_index_mx 2 [0,0] 0

返回示例:

1) 1) "key0"
   2) "5"
   3) "my_index_mk"
   4) "VECTOR"
   5) "[1,2]"
   6) "creation_time"
   7) "1730"
2) 1) "key1"
   2) "25"
   3) "my_index_mk"
   4) "VECTOR"
   5) "[3,4]"
   6) "creation_time"
   7) "1740"

TVS.MINDEXMKNNSEARCH

類別

說明

語法

TVS.MINDEXMKNNSEARCH index_count index_name [index_name ...] topN vector_count vector [vector ...] [filter_string] [param_key param_value]

時間復雜度

  • HNSW算法:index_count * vector_count * O(log(N))

  • FLAT算法:index_count * vector_count * O(N)

N為該向量索引中Key的數量。

命令描述

在多個向量索引中,批量對多條向量(VECTOR)進行近鄰查詢。

選項

  • index_count:向量索引的數量。

  • index_name:向量索引名稱。

  • topN:每條向量查詢返回的數量,取值范圍為[1,10000],默認會查詢出每個向量索引的topN個結果,并將所有查詢結果進行聚合,返回距離最近的topN個結果。

  • vector_count :查詢的向量數。

  • vector:執行近鄰查詢的向量值。

  • filter_string:過濾條件,更多信息請參見TVS.KNNSEARCH中的說明。

  • param_keyparam_value:查詢的運行參數,更多信息請參見TVS.KNNSEARCH中的說明。

返回值

  • 執行成功:按向量查詢順序返回多個查詢結果數組,每個數組中按距離近到遠的順序返回近鄰的key及與該目標向量的距離。

  • 若指定的向量索引不存在,返回(empty array)

  • 其他情況返回相應的異常信息。

示例

請提前執行如下命令:

TVS.CREATEINDEX my_index_mk 2 HNSW L2
TVS.HSET my_index_mk key0 VECTOR [1,2] creation_time 1730
TVS.HSET my_index_mk key1 VECTOR [3,4] creation_time 1740
TVS.HSET my_index_mk key2 VECTOR [5,6] creation_time 1750
TVS.CREATEINDEX my_index_mx 2 HNSW L2
TVS.HSET my_index_mx key5 VECTOR [8,7] creation_time 1730
TVS.HSET my_index_mx key6 VECTOR [6,5] creation_time 1740
TVS.HSET my_index_mx key7 VECTOR [4,3] creation_time 1750

命令示例:

TVS.MINDEXMKNNSEARCH 2 my_index_mk my_index_mx 2 2 [0,0] [3,3]

返回示例:

1) 1) "key0"
   2) "5"
   3) "key7"
   4) "25"
2) 1) "key1"
   2) "1"
   3) "key7"
   4) "1"

上一篇: Search分詞器 下一篇: Vector全局索引
阿里云首頁 云數據庫 Tair(兼容 Redis) 相關技術圈