背景介紹
在大多數業務場景中,單純使用向量進行相似性檢索并無法滿足業務需求,通常需要在滿足特定過濾條件、或者特定的“標簽”的前提下,再進行相似性檢索。
向量檢索服務DashVector支持條件過濾和向量相似性檢索相結合,在精確滿足過濾條件的前提下進行高效的向量檢索。
條件過濾檢索示例
需要使用您的api-key替換示例中的 YOUR_API_KEY、您的Cluster Endpoint替換示例中的YOUR_CLUSTER_ENDPOINT,代碼才能正常運行。
本示例需要參考新建Collection-使用示例提前創建好名稱為
quickstart
的Collection。
插入帶有Field的數據
import dashvector
import numpy as np
client = dashvector.Client(
api_key='YOUR_API_KEY',
endpoint='YOUR_CLUSTER_ENDPOINT'
)
collection = client.get(name='quickstart')
ret = collection.insert([
('1', np.random.rand(4), {'name':'zhangsan', 'age': 10, 'male': True, 'weight': 35.0}),
('2', np.random.rand(4), {'name':'lisi', 'age': 20, 'male': False, 'weight': 45.0}),
('3', np.random.rand(4), {'name':'wangwu', 'age': 30, 'male': True, 'weight': 75.0}),
('4', np.random.rand(4), {'name':'zhaoliu', 'age': 5, 'male': False, 'weight': 18.0}),
('5', np.random.rand(4), {'name':'sunqi', 'age': 40, 'male': True, 'weight': 70.0})
])
assert ret
在新建Collection-使用示例中,創建了名稱為quickstart
的Collection,該Collection定義了3個Field({'name': str, 'weight': float, 'age': int}
)。DashVector具有Schema Free的特性,因此可以在插入Doc時,隨意指定創建Collection時未定義的Field,如上述示例中的male
Field。
通過filter進行條件過濾檢索
import dashvector
client = dashvector.Client(
api_key='YOUR_API_KEY',
endpoint='YOUR_CLUSTER_ENDPOINT'
)
collection = client.get(name='quickstart')
# 要求年齡(age)大于18,并且體重(weight)大于65.0的男性(male=true)
docs = collection.query(
[0.1, 0.1, 0.1, 0.1],
topk=10,
filter = 'age > 18 and weight > 65.0 and male = true'
)
print(docs)
DashVector支持的數據類型
當前DashVector支持Python的4種基礎數據類型:
str
float
int
bool
Python的int類型可表達無限大小的整數,當前DashVector僅支持32位整數,范圍為-2,147,483,648~2,147,483,647,需要用戶自行保證數據未溢出。
比較運算符
通過Field 比較運算符 常量
的組合生成比較表達式,說明及示例如下:
符號 | 描述 | 支持數據類型 | 表達式示例 | 示例解釋 |
< | 小于 |
|
|
|
<= | 小于或等于 |
|
|
|
= | 等于 |
|
|
|
!= | 不等于 |
|
|
|
>= | 大于或等于 |
|
|
|
> | 大于 |
|
|
|
成員運算符
通過Field 成員運算符 常量
的組合生成比較表達式,說明及示例如下:
符號 | 描述 | 支持數據類型 | 表達式示例 | 示例解釋 |
in | 包含 |
|
|
|
not in | 不包含 |
|
|
|
字符串運算符
通過Field 字符串運算符 常量
的組合生成匹配表達式,說明及示例如下:
符號 | 描述 | 支持數據類型 | 表達式示例 | 示例解釋 |
like | 前綴匹配 |
|
|
|
邏輯運算符
邏輯運算符用于組合多個表達式。
符號 | 描述 | 示例 | 示例解釋 |
and | 與 | expr1 and expr2 | expr1、expr2同時為 |
or | 或 | expr1 or expr2 | expr1、expr2同時為 |
可通過括號()
組合邏輯運算符,()
擁有更高優先級,如:expr1 and (expr2 or expr3)
,會優先計算(expr2 or expr3)