名詞解釋
實(shí)例管理
名稱(chēng) | 說(shuō)明 |
實(shí)例 | 實(shí)例是用戶(hù)的一套數(shù)據(jù)配置,包括數(shù)據(jù)源結(jié)構(gòu)、索引結(jié)構(gòu)及其它屬性配置。一個(gè)實(shí)例即一個(gè)搜索服務(wù)。 |
文檔 | 文檔是可搜索的結(jié)構(gòu)化數(shù)據(jù)單元。文檔包含一個(gè)或多個(gè)字段,但必須有主鍵字段,高性能檢索版實(shí)例通過(guò)主鍵值來(lái)確定唯一的文檔。主鍵重復(fù)則文檔會(huì)被覆蓋。 |
字段 | 字段是文檔的組成單元,包含字段名稱(chēng)和字段內(nèi)容。 |
插件 | 為了在導(dǎo)入過(guò)程中進(jìn)行一些數(shù)據(jù)處理,系統(tǒng)內(nèi)置了若干數(shù)據(jù)處理插件,可以在定義應(yīng)用結(jié)構(gòu)或者配置數(shù)據(jù)源時(shí)選擇。 |
源數(shù)據(jù) | 原始數(shù)據(jù),包含一個(gè)或多個(gè)源字段。 |
源字段 | 組成源數(shù)據(jù)的最小單元,包含字段名稱(chēng)和字段值,可選數(shù)據(jù)類(lèi)型請(qǐng)參見(jiàn)OpenSearch表結(jié)構(gòu)。 |
索引 | 索引是用于加速檢索速度的數(shù)據(jù)結(jié)構(gòu),一個(gè)實(shí)例可以創(chuàng)建多個(gè)索引。 |
組合索引 | 可將多個(gè)TEXT或SHORT_TEXT文本類(lèi)型的字段配置到同一個(gè)索引,用來(lái)做組合索引。如一個(gè)論壇搜索,需要提供基于標(biāo)題(title)的搜索及基于標(biāo)題(title)和內(nèi)容(body)的綜合搜索,那么可以將title建立title_search索引,將title和body建立default組合索引。那么,在title_search上查詢(xún)即可實(shí)現(xiàn)基于標(biāo)題的搜索,在default上查詢(xún)即可實(shí)現(xiàn)基于標(biāo)題和內(nèi)容的綜合搜索。 |
索引字段 | 在query子句中使用,需要定義索引字段,通過(guò)索引字段來(lái)做高性能的檢索召回。 |
屬性字段 | 在filter子句、sort子句、aggregate子句、distinct子句子句使用,用來(lái)實(shí)現(xiàn)過(guò)濾、統(tǒng)計(jì)等功能。 |
默認(rèn)展示字段 | 用來(lái)做結(jié)果展示。可以通過(guò)API參數(shù)fetch_fields來(lái)控制每次結(jié)果的返回字段,需注意在程序中配置fetch_fields該參數(shù)后會(huì)覆蓋默認(rèn)展示字段配置,以程序中的fetch_fields設(shè)置為主;若程序中不設(shè)置fetch_fields參數(shù)則以默認(rèn)展示字段為主。 |
分詞 | 對(duì)文檔進(jìn)行詞組切分,TEXT類(lèi)型按檢索單元切分,SHORT_TEXT按單字切分。如“浙江大學(xué)”,TEXT類(lèi)型會(huì)切分成2個(gè)詞組:“浙江”、“大學(xué)”。SHORT_TEXT會(huì)切分成4個(gè)詞組:“浙”、“江”、“大”、“學(xué)”。 |
term | 分詞后的詞組稱(chēng)為term。 |
構(gòu)建索引 | 分詞后會(huì)進(jìn)行索引構(gòu)建,以便根據(jù)查詢(xún)請(qǐng)求,快速定位到文檔。搜索引擎會(huì)構(gòu)建出兩種類(lèi)型的鏈表:倒排和正排鏈表。 |
倒排 | 詞組到文檔的對(duì)應(yīng)關(guān)系組成的鏈表,query子句采用這種排序方式進(jìn)行查詢(xún)。例如:term1->doc1,doc2,doc3;term2->doc1,doc2。 |
正排 | 文檔到字段對(duì)應(yīng)關(guān)系組成的鏈表,filter子句采用這種排序方式,性能略慢于倒排。例如:doc1->id,type,create_time。 |
召回 | 通過(guò)查詢(xún)的關(guān)鍵詞進(jìn)行分詞,將分詞后的詞組通過(guò)查找倒排鏈表快速定位到文檔。 |
召回量 | 召回得到的文檔數(shù)為召回量。 |
數(shù)據(jù)同步
名稱(chēng) | 說(shuō)明 |
數(shù)據(jù)源 | 數(shù)據(jù)來(lái)源,目前支持阿里云RDS、MaxCompute、PolarDB的數(shù)據(jù)同步。 |
索引重建 | 重新構(gòu)建索引。在配置/修改應(yīng)用結(jié)構(gòu)、數(shù)據(jù)源后需要索引重建。 |
配額管理
名稱(chēng) | 說(shuō)明 |
文檔容量 | 實(shí)例中各個(gè)表的總文檔大小累加值(不考慮字段名,字段內(nèi)容按照string來(lái)計(jì)算容量)。 |
QPS | 每秒查詢(xún)請(qǐng)求數(shù)。 |
LCU | LCU(邏輯計(jì)算單元)是衡量搜索計(jì)算能力的單位,一個(gè)LCU代表搜索集群中1/100個(gè)核的計(jì)算能力。 |
搜索
名稱(chēng) | 說(shuō)明 |
排序表達(dá)式 | 排序表達(dá)式是用于控制搜索文檔排序的表達(dá)式,支持基本數(shù)學(xué)運(yùn)算、數(shù)學(xué)函數(shù)和內(nèi)置函數(shù)。 |
基礎(chǔ)排序表達(dá)式 | 對(duì)搜索結(jié)果進(jìn)行第一輪的海選,按照表達(dá)式對(duì)文檔進(jìn)行算分,并按照算分結(jié)果進(jìn)行排序。 |
業(yè)務(wù)排序表達(dá)式 | 對(duì)第一輪的排序結(jié)果選取前N個(gè)按照業(yè)務(wù)排序表達(dá)式進(jìn)行第二輪更細(xì)節(jié)的分值計(jì)算,按照分值進(jìn)行最終的排序。 |
結(jié)果摘要 | 文本內(nèi)容一般會(huì)很長(zhǎng),在搜索結(jié)果展示的時(shí)候可以只展示部分匹配的內(nèi)容,方便用戶(hù)快速了解文檔主要內(nèi)容。 |