使用多元索引查詢數據時,通過預先定義排序方式或者查詢時指定排序方式,您可以按照指定排列方式獲取到返回數據。當返回結果行數較多時,通過使用跳轉翻頁或者連續翻頁可以快速定位到所需數據。
使用場景
分類 | 使用方式 | 功能 | 使用場景 |
排序 | 創建時指定排序方式 | 多元索引默認按照設置的索引預排序(IndexSort)方式進行排序,用于確定數據的默認返回順序。 | |
查詢時指定排序方式 | 按照查詢結果的相關性(BM25算法)分數進行排序,適用于有相關性的場景,例如全文檢索等。 | ||
按照主鍵進行排序,適用于按照事物標識排序的場景。 | |||
按照字段值進行排序,適用于電商、社交媒資等按照事物屬性排序的場景,例如商品銷量、瀏覽量等。 | |||
根據地理點距離進行排序,適用于地圖、物流等按照距離排序事物的場景,例如某個位置周邊餐廳按距離排序等。 | |||
翻頁 | 查詢時指定翻頁方式 | 返回結果行數小于100000行時用于跳轉翻頁。 | |
用于連續翻頁,默認只能向后翻頁。由于在一次查詢的翻頁過程中token長期有效,您可以通過緩存并使用之前的token實現向前翻頁。 |
索引預排序
多元索引默認按照設置的索引預排序(IndexSort)方式進行排序,使用多元索引查詢數據時,IndexSort決定了數據的默認返回順序。
在創建多元索引時,您可以自定義IndexSort,如果未自定義IndexSort,則IndexSort默認為主鍵排序。
索引預排序只支持PrimaryKeySort (按照主鍵排序)和FieldSort(按照字段值排序)兩種方式。
含有Nested類型字段的多元索引不支持索引預排序。
創建多元索引后,如果要修改多元索引的IndexSort,您可以使用動態修改schema功能實現。具體操作,請參見動態修改schema。
查詢時排序
只有enable_sort_and_agg設置為true的字段才能進行排序。
在每次查詢時,可以指定排序方式,多元索引支持如下四種排序方式(Sorter)。您也可以使用多個Sorter,實現先按照某種方式排序,再按照另一種方式排序的需求。
ScoreSort
按照查詢結果的相關性(BM25算法)分數進行排序,適用于有相關性的場景,例如全文檢索等。
如果需要按照相關性打分進行排序,必須手動設置ScoreSort,否則會按照索引設置的IndexSort進行排序。
'sort' => array(
array(
'score_sort' => array(
'order' => SortOrderConst::SORT_ORDER_DESC
)
),
)
PrimaryKeySort
按照主鍵進行排序。
'sort' => array(
array(
'pk_sort' => array(
'order' => SortOrderConst::SORT_ORDER_ASC
)
),
)
FieldSort
按照列值進行排序。
'sort' => array(
array(
'field_sort' => array(
'field_name' => 'keyword',
'order' => SortOrderConst::SORT_ORDER_ASC,
'mode' => SortModeConst::SORT_MODE_AVG,
)
),
)
GeoDistanceSort
根據地理點距離進行排序。
'sort' => array(
array(
'geo_distance_sort' => array(
'field_name' => 'geo',
'order' => SortOrderConst::SORT_ORDER_ASC,
'distance_type' => GeoDistanceTypeConst::GEO_DISTANCE_PLANE,
'points' => array('0.6,0.6')
)
),
)
多類型組合排序
先按照某列進行排序,再按照另一列進行排序。
'sort' => array(
array(
'field_sort' => array(
'field_name' => 'keyword',
'order' => SortOrderConst::SORT_ORDER_ASC,
'mode' => SortModeConst::SORT_MODE_AVG,
)
),
array(
'pk_sort' => array(
'order' => SortOrderConst::SORT_ORDER_ASC
)
),
)
翻頁方式
在獲取返回結果時,可以使用limit和offset或者使用token進行翻頁。
使用limit和offset翻頁
當需要獲取的返回結果行數小于100000行時,可以使用limit和offset進行翻頁,即limit+offset<=100000,其中limit的最大值為100。
如果需要提高limit的上限,請參見如何將多元索引 Search 接口查詢數據的 limit 提高到 1000。
如果使用此方式進行翻頁時未設置limit和offset,則limit的默認值為10,offset的默認值為0。
$request = array(
'table_name' => 'php_sdk_test',
'index_name' => 'php_sdk_test_search_index',
'search_query' => array(
'offset' => 10,
'limit' => 10,
'get_total_count' => true,
'query' => array(
'query_type' => QueryTypeConst::MATCH_ALL_QUERY
),
'sort' => array(
array(
'field_sort' => array(
'field_name' => 'keyword',
'order' => SortOrderConst::SORT_ORDER_ASC
)
),
),
'token' => null,
),
'columns_to_get' => array(
'return_type' => ColumnReturnTypeConst::RETURN_SPECIFIED,
'return_names' => array('col1', 'col2')
)
);
$response = $otsClient->search($request);
使用token翻頁
由于使用token進行翻頁時翻頁深度無限制,當需要進行深度翻頁時,推薦使用token進行翻頁。
當符合查詢條件的數據未讀取完時,服務端會返回next_token,此時可以使用next_token繼續讀取后面的數據。
使用token進行翻頁時默認只能向后翻頁。由于在一次查詢的翻頁過程中token長期有效,您可以通過緩存并使用之前的token實現向前翻頁。
使用token翻頁后的排序方式和上一次請求的一致,無論是系統默認使用IndexSort還是自定義排序,因此設置了token不能再設置Sort。另外使用token后不能設置offset,只能依次往后讀取,即無法跳頁。
由于含有Nested類型字段的多元索引不支持索引預排序,如果使用含有Nested類型字段的多元索引查詢數據且需要翻頁,則必須在查詢條件中指定數據返回的排序方式,否則當符合查詢條件的數據未讀取完時,服務端不會返回next_token。
$request = array(
'table_name' => 'php_sdk_test',
'index_name' => 'php_sdk_test_search_index',
'search_query' => array(
'offset' => 0,
'limit' => 10,
'get_total_count' => true,
'query' => array(
'query_type' => QueryTypeConst::FUNCTION_SCORE_QUERY,
'query' => array(
'query' => array(
'query_type' => QueryTypeConst::TERM_QUERY,
'query' => array(
'field_name' => 'keyword',
'term' => 'keyword'
)
),
'field_value_factor' => array(
'field_name' => 'long'
)
)
),
'sort' => array(
array(
'score_sort' => array(
'order' => SortOrderConst::SORT_ORDER_DESC
)
),
)
),
'columns_to_get' => array(
'return_type' => ColumnReturnTypeConst::RETURN_SPECIFIED,
'return_names' => array('keyword', 'long')
)
);
$response = $otsClient->search($request);
print "total_hits: " . $response['total_hits'] . "\n";
print json_encode($response['rows'], JSON_PRETTY_PRINT);
while($response['next_token'] != null) {
$request['search_query']['token'] = $response['next_token'];
$request['search_query']['sort'] = null;//當有next_token時,不能再設置Sort,token中包含sort信息。
$response = $otsClient->search($request);
print json_encode($response['rows'], JSON_PRETTY_PRINT);
}
常見問題
相關文檔
多元索引查詢類型包括精確查詢、多詞精確查詢、全匹配查詢、匹配查詢、短語匹配查詢、前綴查詢、范圍查詢、通配符查詢、多條件組合查詢、地理位置查詢、嵌套類型查詢和列存在性查詢,您可以選擇合適的查詢類型進行多維度數據查詢。
如果要對結果集進行排序或者翻頁,您可以使用排序和翻頁功能來實現。具體操作,請參見排序和翻頁。
如果要按照某一列對結果集做折疊,使對應類型的數據在結果展示中只出現一次,您可以使用折疊(去重)功能來實現。具體操作,請參見折疊(去重)。
如果要進行數據分析,例如求最值、求和、統計行數等,您可以使用Search接口的統計聚合功能或者SQL查詢來實現。具體操作,請參見統計聚合和SQL查詢。
如果要快速導出數據,而不關心整個結果集的順序時,您可以使用ParallelScan接口和ComputeSplits接口實現多并發導出數據。具體操作,請參見并發導出數據。