教育行業算法版介紹
教育行業算法版基于最新算法功能,貼合搜題場景的痛點和需求,提供了教育行業專屬的搜題智能語義理解能力、向量召回、排序算法,為在線教育行業搜題業務的搜索性能和效果準確性提供雙重保障,并有效的解決了超大題庫數據導致的搜索延遲高、資源消耗大、題庫不完整導致的搜索無結果率高等行業重難點問題,提供多模態搜索解決方案。針對教育行業,開放搜索還提供了向量模型,以實現向量召回及多路搜索,提高搜題準確率,詳見多路搜索。
二者功能差異
功能列表 | 通用行業 | 教育行業算法版 |
一站式配置 | 創建應用后,需要手動創建并配置查詢分析、排序策略和下拉提示模型。 | 結合教育行業常見搜索場景,選擇所需能力及功能,同時提供應用結構模板和索引結構模板,實現一鍵式配置,降低新用戶使用門檻。 |
查詢分析 | 針對通用行業提供同義詞拓展、停用詞省略、拼寫糾錯、詞權重分析、類目預測等能力。 | 針對教育通用行業及搜題垂類場景,提供增強版分析器與查詢分析功能。結合教育搜題場景及行業難題,更精準的構建索引并識別用戶查詢意圖,與通用版相比效果更優。 |
策略排序 | 創建應用后,需要結合業務場景手動配置并調試相應的排序策略。 | 在應用結構模板和索引結構模板基礎上,提供教育行業常用基礎排序、業務排序表達式,無需額外配置即可滿足大部分教育行業排序效果需求。 |
功能迭代 | 定期更新分析器、查詢分析等系統默認詞典。 | 根據教育行業的名詞、產品等變化,不斷迭代更新,優化原有分詞、查詢分析能力,提供更高時效性的服務保障。 |
查詢分析效果對比
行業增強版較通用版相比在查詢分析功能上做出了更深入的優化,不僅在通用版的基礎上更新了常見bad case,而且針對教育行業集各家之所長,豐富已有詞庫,如下根據各個功能舉例:
分詞:(以空格分詞)
query | 通用版 | 行業增強版 |
Atteno's clockwehaveourbreak. | Atteno ' s clockwehaveourbreak . | At ten o'clock we have our break . |
BeforeIgottonthebusstop,thebushadalreadyleft. | BeforeIgottonthebusstop , thebushadalreadyleft . | Before I got to the bus stop , the bus had already left . |
Itis20yuan. | Itis 20 yuan . | It is 20 yuan . |
minusfrac12xmsup3yplus3xymsup3minus5x | minusfrac 12 xmsup 3 yplus 3 xymsup 3 minus 5 x | minus frac 12 x msup 3 y plus 3 xy msup 3 minus 5 x |
adequal2,bcequal4 | adequal 2 , bcequal 4 | ad equal 2 , bc equal 4 |
矩形leftoabcright的頂點leftoright | 矩形 leftoabcright 的頂點 leftoright | 矩形 left oabc right 的頂點 left o right |
注意事項
教育行業算法版應用的創建流程可以參考文檔:教育行業算法版
獨享通用版應用可轉為行業增強版,行業增強版應用不可轉為通用版;
教育行業算法版僅適用于獨享型應用;
如果是共享型應用變規格到獨享型再進行教育行業算法版適配,需要線上應用規格與實例規格一致(同為獨享型)后再做教育行業算法版適配操作;
應用結構中務必添加字段標簽所對應的字段名稱,否則會報錯;
?
索引結構中務必添加索引標簽所對應的索引名稱,否則不能進行下一步:
?