實例管理
名稱 | 說明 |
實例 | 實例是用戶的一套數據配置,包括數據源結構、索引結構及其它屬性配置。一個實例即一個搜索服務。 |
文檔 | 文檔是可搜索的結構化數據單元。文檔包含一個或多個字段,但必須有主鍵字段,OpenSearch通過主鍵值來確定唯一的文檔。主鍵重復則文檔會被覆蓋。 |
字段 | 字段是文檔的組成單元,包含字段名稱和字段內容。 |
插件 | 為了在導入過程中進行一些數據處理,系統內置了若干數據處理插件,可以在定義應用結構或者配置數據源時選擇。 |
源數據 | 原始數據,包含一個或多個源字段。 |
源字段 | 組成源數據的最小單元,包含字段名稱和字段值,可選數據類型請參見應用結構&索引結構。 |
索引 | 索引是用于加速檢索速度的數據結構,一個實例可以創建多個索引。 |
組合索引 | 可將多個TEXT或SHORT_TEXT文本類型的字段配置到同一個索引,用來做組合索引。如一個論壇搜索,需要提供基于標題(title)的搜索及基于標題(title)和內容(body)的綜合搜索,那么可以將title建立title_search索引,將title和body建立default組合索引。那么,在title_search上查詢即可實現基于標題的搜索,在default上查詢即可實現基于標題和內容的綜合搜索。 |
索引字段 | 在query子句中使用,需要定義索引字段,通過索引字段來做高性能的檢索召回。 |
屬性字段 | |
默認展示字段 | 用來做結果展示??梢酝ㄟ^API參數fetch_fields來控制每次結果的返回字段,需注意在程序中配置fetch_fields該參數后會覆蓋默認展示字段配置,以程序中的fetch_fields設置為主;若程序中不設置fetch_fields參數則以默認展示字段為主。 |
分詞 | 對文檔進行詞組切分,TEXT類型按檢索單元切分,SHORT_TEXT按單字切分。如“浙江大學”,TEXT類型會切分成2個詞組:“浙江”、“大學”。SHORT_TEXT會切分成4個詞組:“浙”、“江”、“大”、“學”。 |
term | 分詞后的詞組稱為term。 |
構建索引 | 分詞后會進行索引構建,以便根據查詢請求,快速定位到文檔。搜索引擎會構建出兩種類型的鏈表:倒排和正排鏈表。 |
倒排 | 詞組到文檔的對應關系組成的鏈表,query子句采用這種排序方式進行查詢。例如:term1->doc1,doc2,doc3;term2->doc1,doc2。 |
正排 | 文檔到字段對應關系組成的鏈表,filter子句采用這種排序方式,性能略慢于倒排。例如:doc1->id,type,create_time。 |
召回 | 通過查詢的關鍵詞進行分詞,將分詞后的詞組通過查找倒排鏈表快速定位到文檔。 |
召回量 | 召回得到的文檔數為召回量。 |
數據同步
名稱 | 說明 |
數據源 | 數據來源,目前支持阿里云RDS、MaxCompute、PolarDB的數據同步。 |
索引重建 | 重新構建索引。在配置/修改應用結構、數據源后需要索引重建。 |
配額管理
名稱 | 說明 |
文檔容量 | 實例中各個表的總文檔大小累加值(不考慮字段名,字段內容按照string來計算容量)。 |
QPS | 每秒查詢請求數。 |
LCU | LCU(邏輯計算單元)是衡量搜索計算能力的單位,一個LCU代表搜索集群中1/100個核的計算能力。 |
快速擴縮容 | 根據實際業務需求,快速升降配,小規格可實時生效,涉及規格轉換(如:共享型-集群轉換為獨享型-集群)需審批后生效。 |
搜索
名稱 | 說明 |
排序表達式 | 排序表達式是用于控制搜索文檔排序的表達式,支持基本數學運算、數學函數和內置函數。 |
基礎排序表達式 | 對搜索結果進行第一輪的海選,按照表達式對文檔進行算分,并按照算分結果進行排序。 |
業務排序表達式 | 對第一輪的排序結果選取前N個按照業務排序表達式進行第二輪更細節的分值計算,按照分值進行最終的排序。 |
結果摘要 | 文本內容一般會很長,在搜索結果展示的時候可以只展示部分匹配的內容,方便用戶快速了解文檔主要內容。 |
查詢分析 | 目前支持同義詞、拼寫糾錯、停用詞、詞權重等功能,理解用戶的搜索意圖。 |