控制臺中內置了問答測試頁面方便用戶進行問答測試,輸入問題模型就會匹配到對應的結果進行回答。完成實例配置后,您可針對不同場景和不同期望效果設置相應參數,通過體驗問答效果,來選擇最優(yōu)參數。本文以控制臺操作為例介紹如何進行問答測試并對可自定義的參數進行說明。
前提條件
操作步驟
登錄OpenSearch控制臺選擇LLM智能問答版,選擇左側導航欄實例管理,單擊對應的實例操作欄下的管理按鈕,進入實例詳情頁面,選擇問答測試,可以向模型進行提問。
可根據搜索需求填寫對應的問答參數、Prompt參數、文檔召回參數、參考圖片參數、Query理解參數、人工干預參數及其它參數,然后在對話框輸入需要詢問的內容,單擊發(fā)送按鈕。
查看問答測試效果。
參數說明
問答參數說明 | |||||
參數 | 類型 | 必需 | 取值范圍 | 默認值 | 描述 |
模型選擇 | String | 是 | - | opensearch-qwen | 表示該次搜索使用的LLM大模型。可選擇的模型請參考:LLM管理。 |
Prompt | String | 否 | - | 系統(tǒng)默認模板 | 表示該次搜索使用的Prompt。可選擇的Prompt請參考:Prompt管理 |
多輪對話 | Boolean | 否 | - | true |
|
流式輸出 | Boolean | 否 | - | true |
|
Prompt參數說明 | |||||
參數 | 類型 | 必需 | 取值范圍 | 默認值 | 描述 |
attitude | String | 否 | - | normal |
|
rule | String | 否 | - | simple | 對話內容的詳細程度,默認為detailed
|
noanswer | String | 否 | - | sorry | 無法回答問題時的回復,默認為sorry
|
language | String | 否 | - | Chinese | 回答問題使用的語言,默認為Chinese
|
role | Boolean | 否 | - | true | 開啟后,將定制回答的角色。 |
role_name | String | 否 | - | AI小助手 | 定制回答的角色,例如:AI小助手 |
out_format | String | 否 | - | text | 輸出內容的形式,默認為text
|
文檔召回參數說明 | |||||
參數 | 類型 | 必需 | 取值范圍 | 默認值 | 描述 |
filter | String | 否 | - | - | 召回文檔時根據目標字段進行過濾。例:filter = field = value |
top_n | INT | 否 | (0, 50] | 5 | 召回的文檔數。 |
sf | Float | 否 | [0,+∞) | 1.3 | 文檔召回的閾值,sf越大則召回文檔的向量相似度越小。 |
dense_weight | Float | (0,1) | 0.7 | 選擇稀疏向量模型時可選,表示稠密向量的權重,稀疏向量的權重則為:1-dense_weight。 | |
formula | String | 否 | - | 向量相似度 | 文檔召回的排序公式。 |
operator | String | 否 | - | AND | 文本召回時,文本token之間的關系。 |
參考圖片參數說明 | |||||
參數 | 類型 | 必需 | 取值范圍 | 默認值 | 描述 |
sf | Float | 否 | [0,+∞) | 1 | 參考圖片的閾值,對于稀疏向量模型sf越大則參考圖片與內容的向量相似度越大,對于稠密向量模型sf越大則參考圖片與內容的向量相似度越小。 |
dense_weight | Float | 否 | (0,1) | 0.7 | 選擇稀疏向量模型時可選,表示稠密向量的權重,稀疏向量的權重則為:1-dense_weight。 |
Query理解參數說明 | |||||
參數 | 類型 | 必需 | 取值范圍 | 默認值 | 描述 |
query_extend | Boolean | 否 | - | false | 開啟后會擴展Query,提升召回質量 |
query_exten_num | INT | 否 | (0,+∞) | 5 | 擴展Query的數量 |
人工干預參數說明 | |||||
參數 | 類型 | 必需 | 取值范圍 | 默認值 | 描述 |
sf | Float | 否 | [0,2] | 0.3 | 人工干預問題的閾值,默認為0.3,sf越大則越容易匹配到人工干預詞條 |
其它參數說明 | |||||
參數 | 類型 | 必需 | 取值范圍 | 默認值 | 描述 |
return_hits | Boolean | 否 | - | false | 是否在結果中返回文檔召回的結果 |
csi_level | String | 否 | - | strict | 綠網配置
|
history_max | INT | 否 | (0,20] | 20 | 多輪對話歷史最大輪數,最大20輪 |
link | Boolean | 否 | - | false | 是否在結果中返回文檔召回的具體來源 |