使用多元索引查詢數據時,通過預先定義排序方式或者查詢時指定排序方式,您可以按照指定排列方式獲取到返回數據。當返回結果行數較多時,通過使用跳轉翻頁或者連續翻頁可以快速定位到所需數據。
使用場景
分類 | 使用方式 | 功能 | 使用場景 |
排序 | 創建時指定排序方式 | 多元索引默認按照設置的索引預排序(IndexSort)方式進行排序,用于確定數據的默認返回順序。 | |
查詢時指定排序方式 | 按照查詢結果的相關性(BM25算法)分數進行排序,適用于有相關性的場景,例如全文檢索等。 | ||
按照主鍵進行排序,適用于按照事物標識排序的場景。 | |||
按照字段值進行排序,適用于電商、社交媒資等按照事物屬性排序的場景,例如商品銷量、瀏覽量等。 | |||
根據地理點距離進行排序,適用于地圖、物流等按照距離排序事物的場景,例如某個位置周邊餐廳按距離排序等。 | |||
翻頁 | 查詢時指定翻頁方式 | 返回結果行數小于100000行時用于跳轉翻頁。 | |
用于連續翻頁,默認只能向后翻頁。由于在一次查詢的翻頁過程中Token長期有效,您可以通過緩存并使用之前的Token實現向前翻頁。 |
索引預排序
多元索引默認按照設置的索引預排序(IndexSort)方式進行排序,使用多元索引查詢數據時,IndexSort決定了數據的默認返回順序。
在創建多元索引時,您可以自定義IndexSort,如果未自定義IndexSort,則IndexSort默認為主鍵排序。
索引預排序只支持PrimaryKeySort (按照主鍵排序)和FieldSort(按照字段值排序)兩種方式。
含有Nested類型字段的多元索引不支持索引預排序。
創建多元索引后,如果要修改多元索引的IndexSort,您可以使用動態修改schema功能實現。具體操作,請參見動態修改schema。
查詢時排序
只有EnableSortAndAgg設置為true的字段才能進行排序。
在每次查詢時,可以指定排序方式,多元索引支持如下四種排序方式(Sorter)。您也可以使用多個Sorter,實現先按照某種方式排序,再按照另一種方式排序的需求。
ScoreSort
按照查詢結果的相關性(BM25算法)分數進行排序,適用于有相關性的場景,例如全文檢索等。
如果需要按照相關性打分進行排序,必須手動設置ScoreSort,否則會按照索引設置的IndexSort進行排序。
var searchQuery = new SearchQuery();
searchQuery.Sort = new Sort(new List<ISorter>() { new ScoreSort() });
PrimaryKeySort
按照主鍵進行排序。
//正序。
var searchQuery = new SearchQuery();
searchQuery.Sort = new Sort(new List<ISorter>() { new PrimaryKeySort() });
//逆序。
var searchQuery = new SearchQuery();
searchQuery.Sort = new Sort(new List<ISorter>() { new PrimaryKeySort(SortOrder.DESC) });
FieldSort
按照列值進行排序。
單列排序
按照某列的值進行排序。
var searchQuery = new SearchQuery();
var fieldSort = new FieldSort("col", SortOrder.ASC);
searchQuery.Sort = new Sort(new List<ISorter>() { fieldSort });
多列排序
先按照某列的值進行排序,再按照另一列的值進行排序。
var searchQuery = new SearchQuery();
var col1Sort = new FieldSort("col", SortOrder.ASC);
var col2Sort = new FieldSort("co2", SortOrder.ASC);
searchQuery.Sort = new Sort(new List<ISorter>() { col1Sort, col2Sort });
GeoDistanceSort
根據地理點距離進行排序。
var searchQuery = new SearchQuery();
var geoDistanceSort = new GeoDistanceSort("geoCol", new List<string>(){"0","0"});
searchQuery.Sort = new Sort(new List<ISorter>() { geoDistanceSort });
翻頁方式
在獲取返回結果時,可以使用Limit和Offset或者使用Token進行翻頁。
使用Limit和Offset翻頁
當需要獲取的返回結果行數小于100000行時,可以通過Limit和Offset進行翻頁,即Limit+Offset<=100000,其中Limit的最大值為100。
如果需要提高Limit的上限,請參見如何將多元索引 Search 接口查詢數據的 limit 提高到 1000。
如果使用此方式進行翻頁時未設置Limit和Offset,則Limit的默認值為10,Offset的默認值為0。
var searchQuery = new SearchQuery();
searchQuery.Query = new MatchAllQuery();
searchQuery.Limit = 100;
searchQuery.Offset = 100;
使用Token翻頁
由于使用Token進行翻頁時翻頁深度無限制,當需要進行深度翻頁時,推薦使用Token進行翻頁。
當符合查詢條件的數據未讀取完時,服務端會返回NextToken,此時可以使用NextToken繼續讀取后面的數據。
使用Token進行翻頁時默認只能向后翻頁。由于在一次查詢的翻頁過程中Token長期有效,您可以通過緩存并使用之前的Token實現向前翻頁。
使用Token翻頁后的排序方式和上一次請求的一致,無論是系統默認使用IndexSort還是自定義排序,因此設置了Token不能再設置Sort。另外使用Token后不能設置Offset,只能依次往后讀取,即無法跳頁。
由于含有Nested類型字段的多元索引不支持索引預排序,如果使用含有Nested類型字段的多元索引查詢數據且需要翻頁,則必須在查詢條件中指定數據返回的排序方式,否則當符合查詢條件的數據未讀取完時,服務端不會返回NextToken。
/// <summary>
/// 使用Token進行翻頁,此示例將讀取所有數據,放到一個List中。
/// </summary>
/// <param name="otsClient"></param>
public static SearchResponse ReadMoreRowsWithToken(OTSClient otsClient)
{
var searchQuery = new SearchQuery();
searchQuery.Query = new MatchAllQuery();
var request = new SearchRequest(TableName, IndexName, searchQuery);
var response = otsClient.Search(request);
var rows = response.Rows;
while (response.NextToken != null) //直到讀取到NextToken為null,即讀出全部數據。
{
request.SearchQuery.Token = response.NextToken;
response = otsClient.Search(request);
rows.AddRange(response.Rows);
}
return response;
}
常見問題
相關文檔
多元索引查詢類型包括精確查詢、多詞精確查詢、全匹配查詢、匹配查詢、短語匹配查詢、前綴查詢、范圍查詢、通配符查詢、多條件組合查詢、地理位置查詢、嵌套類型查詢和列存在性查詢,您可以選擇合適的查詢類型進行多維度數據查詢。
如果要對結果集進行排序或者翻頁,您可以使用排序和翻頁功能來實現。具體操作,請參見排序和翻頁。
如果要按照某一列對結果集做折疊,使對應類型的數據在結果展示中只出現一次,您可以使用折疊(去重)功能來實現。具體操作,請參見折疊(去重)。
如果要進行數據分析,例如求最值、求和、統計行數等,您可以使用Search接口的統計聚合功能或者SQL查詢來實現。具體操作,請參見統計聚合和SQL查詢。
如果要快速導出數據,而不關心整個結果集的順序時,您可以使用ParallelScan接口和ComputeSplits接口實現多并發導出數據。具體操作,請參見并發導出數據。