Lindorm搜索引擎支持自定義詞典功能,該功能是通過更新配置集實現的。您可以根據需求更新詞庫和停詞庫。本文介紹自定義詞典的方法。
前提條件
已安裝Java環境,且JDK版本為1.8及以上版本。
已通過Search Shell連接搜索引擎,具體操作,請參見通過Search Shell連接并使用搜索引擎。
使用限制
分詞詞典僅支持ik分詞器,您可以通過創建搜索索引來指定分詞器,具體語法,請參見CREATE SEARCH INDEX。
操作步驟
執行以下命令,進入lindorm-search-cli/bin目錄。
cd lindorm-search-cli/bin
執行以下命令查看配置集列表。
./search-cli zk ls /configs
執行以下命令,下載需要修改的配置集到當前目錄。執行成功后在當前目錄下會生成一個conf目錄。
./search-cli zk downconfig -d . -n <配置集的名稱>
示例如下:
./search-cli zk downconfig -d . -n default.myTable.myIdx
執行以下命令,進入conf目錄。
cd conf
如果conf目錄下沒有extra_main.dic文件,您需要執行以下命令,新建一個詞庫文件并命名為extra_main.dic。
touch extra_main.dic
執行以下命令編輯詞庫文件。
vi extra_main.dic
內容格式示例如下,要求每行有且只有一個詞語:
用戶指南 產品簡介 引擎簡介
執行以下命令編輯停詞庫文件。文件名默認為extra_stopword.dic。
vi extra_stopword.dic
執行以下命令,返回到bin目錄。
cd ..
執行以下命令上傳配置集到服務端。
./search-cli zk upconfig -d conf -n default.myTable.myIdx
執行以下命令使配置集生效。
./search-cli reload_collection -c default.myTable.myIdx
文檔內容是否對您有幫助?