久久午夜激情免费精品网站,香蕉精品高清在线观看视频,国产女人爽的流水毛

教育搜題業務特點

教育搜題行業專屬的教育分詞器

2. 查詢語義理解：

分詞是影響搜索效果的最基礎的模塊。開放搜索集成了教育搜題行業專屬的教育分詞器，同時在此基礎之上用戶還可上傳自己的分詞詞條定制個性化的分詞器。

示例

3. 類目預測：

什么是類目預測？

簡單來說，用戶輸入一個query，查詢得到一批物品，通過計算每一個物品所屬的類目與query之間的相關度，只要物品的排序公式中引用了這個相關度，那么對于這個物品來說，它所屬的類目與query的相關度越高，它的排序公式的計算結果就獲得了越高的排序得分，從而這個物品就會排在越前面。

類目預測在教育行業的應用：

4. 詞權重分析：

功能介紹：該功能主要分析了查詢中每一個詞在文本中的重要程度，并將其量化成權重，權重較低的詞可能不會參與召回。這樣可以避免當用戶輸入的查詢詞中包含一些權重低的詞時，仍然按用戶輸入的查詢詞限制召回，導致命中結果過少。

功能用途： Query丟詞、改寫、文本相關性分析；

1）基于用戶行為生成訓練數據：

2）詞權重模型訓練：

query	35 的因數有 ( ) , 100 以內 24 的倍數有 ( )
對應權重分	4 1 71 1 1 1 1 1 4 1 7 1 1 1

此題目中“因數”和“倍數”的權重分最高7分，參與召回的權重也就最高，其次是“35”和“24”為4分，其他權重分為1分的，不參與召回；

5. query改寫：

為了滿足業務的靈活需求，開放搜索支持批量干預：詞典、拼寫糾錯，同義詞，詞權重等。

1）OCR識別可能會把一些非題目要素識別進來干擾query分析的結果，這時候可以使用詞權重干預的方式保證非題目要素字段被打標成低權重，保證召回和排序效果

2）用戶可以自定義同義詞來擴召回，例如"立方米" -> "噸"

排序定制

系統開放了兩階段排序過程：基礎排序和業務排序，即粗排和精排；基礎排序即是海選，從檢索結果中快速找到質量高的文檔，取出TOP N個結果再按照精排進行精細算分，最終返回最優的結果給用戶。為了實現更細粒度的排序效果，結合排序表達式（Ranking Formula）可以為應用自定義搜索結果排序方式。

，

客戶效果對比

某在線教育平臺，主打K12教育，用戶數千萬級別，題庫量8千萬左右且持續增加，由自建題庫和第三方題庫兩部分組成，之前通過OCR+自建ES搜索服務實現拍照搜索功能，面臨的主要問題是搜索準確率待優化提升，降低搜索延遲等問題。

開放搜索接入后：

級別	舊版自建召回結果	開放搜索召回結果
top1	某歌舞團獨唱演員張慧月工資RMB 5,800,2006年6月,張慧參加了該團在上海的3場演出,得到RMB 3800元報酬...	張惠言所指與“小詞”大概相近的是樂府之音。
top2	張慧研對音樂的喜好源于...	張惠言所指與“小詞”大概相近的是樂府之音。（）
top3	下列文獻中,屬于張慧老師在中國音樂期刊上發表文章的引證文獻是	下列選項中屬于張惠言所指與“小詞”大概相近的是（）。