日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

向量檢索

更新時(shí)間:

KnnVectorQuery使用數(shù)值向量進(jìn)行近似最近鄰查詢,可以在大規(guī)模數(shù)據(jù)集中找到最相似的數(shù)據(jù)項(xiàng)。

前提條件

注意事項(xiàng)

  • 表格存儲(chǔ)Python SDK5.4.4版本開始支持向量檢索功能,請(qǐng)確保已安裝正確的表格存儲(chǔ)Python SDK版本。

    說明

    關(guān)于Python SDK歷史迭代版本的更多信息,請(qǐng)參見Python SDK歷史迭代版本

  • 向量字段類型的個(gè)數(shù)、維度等存在限制。更多信息,請(qǐng)參見多元索引限制

  • 由于多元索引服務(wù)端是多分區(qū)的,多元索引服務(wù)端的每個(gè)分區(qū)均會(huì)返回自身最鄰近的TopK個(gè)值并在協(xié)調(diào)節(jié)點(diǎn)進(jìn)行匯總,因此如果要使用Token翻頁(yè)獲取所有數(shù)據(jù),則獲取到的總行數(shù)與多元索引服務(wù)端的分區(qū)數(shù)有關(guān)。

參數(shù)

參數(shù)

是否必選

說明

field_name

向量字段名稱。

top_k

查詢最鄰近的topK個(gè)值。關(guān)于最大值的說明請(qǐng)參見多元索引限制

重要
  • K值越大,召回率越好,但是查詢延遲和費(fèi)用越高。

  • 當(dāng)top_k的值小于SearchQuerylimit的值時(shí),服務(wù)端會(huì)自動(dòng)把top_k的值放大到limit的值。

float32_query_vector

要查詢相似度的向量。

filter

查詢過濾器,支持組合使用任意的非向量檢索的查詢條件。

示例

以下示例用于查詢表中與指定向量最鄰近的10個(gè)向量數(shù)據(jù),并且最鄰近的向量需要滿足col_keyword列值等于"0"且col_long列值在050之間的條件。

def knn_vector_query(client):
    filter_query = BoolQuery(
        must_queries=[
            TermQuery(field_name='col_keyword', column_value="0"),
            RangeQuery(field_name='col_long', range_from=0, range_to=50),
        ]
    )
    query = KnnVectorQuery(field_name='col_vector', top_k=10, float32_query_vector=[1.0, 1.1, 1.2, -1.3], filter=filter_query)
    # 按照分?jǐn)?shù)排序。
    sort = Sort(sorters=[ScoreSort(sort_order=SortOrder.DESC)])
    search_query = SearchQuery(query, limit=10, get_total_count=False, sort=sort)
    search_response = client.search(
        table_name='<TABLE_NAME>',
        index_name='<SEARCH_INDEX_NAME>',
        search_query=search_query,
        columns_to_get=ColumnsToGet(column_names=["col_keyword", "col_long"], return_type=ColumnReturnType.SPECIFIED)
    )
    print("requestId:", search_response.request_id)
    for row in search_response.rows:
        print(row)

相關(guān)文檔

常見問題

如何優(yōu)化表格存儲(chǔ)的向量檢索效果