本文介紹如何實現表格問答。
功能簡介
伴隨著問答內容豐富度的提高,問答文檔內容不僅僅局限于常規的文本圖片相關內容,對結構化數據的精準問答的需求也在不斷增多。為解決在復雜的內容結構下,準確的回答客戶問題,提升問答體驗,OpenSearch-LLM智能問答版推出了表格問答功能,通過配置簡單的表結構,傳入結構化數據就可以是實現表格類數據的精準問答。同時還支持數據源的方式(MaxCompute)來同步結構化數據方便快捷、簡單易用,極大地節約了開發成本。
通過控制臺手動創建輔表
一、手動創建輔表
選擇數據配置->變更配置,保持默認數據處理配置,單擊下一步進入數據結構配置。單擊添加表并選擇手動創建。
如果相關表字段需進行文本問答,可打開文本問答按鈕,給需要進行文本問答的字段指定字段標簽。
說明表名為英文字母、數據或者下劃線,不要超過20個字符。
字段名稱:必須以字母開頭,由字母、數字和下劃線組成,不能超過30個字符。
字段解釋:字段解釋和問答效果強相關,建議每個字段都要填寫,否則會對問答效果產生影響。可以根據問答效果隨時進行調整,每個字段的字段解釋不能超過30個字符。
請保證主鍵值唯一,主鍵ID只支持INT和TEXT兩種類型。
字段類型:請根據待上傳表格數據進行配置,類型不一致會導致表格上傳失敗。配置為內容的字段,字段類型應設置為TEXT。
字段標簽:若不開啟文本問答功能則無需填寫,若開啟文本問答功能則需要配置內容和主鍵這兩個字段標簽。配置為內容的字段會同步到main表中,目前只支持將一條字段的標簽設置為內容。
文本問答:開啟后,在問答測試時會先針對自定義的輔表中進行表格問答,如果沒有搜索到答案,則會針對設置為內容的字段進行文本問答,增加回答率。
點擊完成等待版本構建完畢后由控制臺推送數據,也可以點擊添加數據源,配置數據源同步數據。
二、通過控制臺上傳數據
通過文件導入方式上傳測試數據,上傳前請先參考樣例數據。
您還可以通過API上傳輔表,導入您的表格數據來進行問答,具體請參見PushKnowledgeDocuments-文檔推送。
三、(可選)添加數據源同步附表數據
如果您有MaxCompute數據源,可以通過添加數據源把數據同步至輔表中。
選擇MaxCompute數據源,點擊新建數據庫,按要求填寫project名稱、accessKey和accessKeySecret,然后點擊連接。
說明project名稱:MaxCompute的項目名。
accessKey:MaxCompute項目所在賬號的accessKey。
accessKeySecret:MaxCompute項目所在賬號的accessKeySecret。
要查看賬號的AccessKey信息請參見查看RAM用戶的AccessKey信息。
選擇需要參與問答的數據表然后單擊確認。
單擊MaxCompute源字段下拉菜單選擇對應字段與OpenSearch表字段相映射。映射完畢后單擊確認。
填入分區條件(不填默認拉取所有分區)點擊完成等待版本構建完畢。
通過數據源創建輔表
如有表格類的結構化數據需要做問答的話,可以通過配置數據源和添加輔表的方式來實現表格問答。
選擇數據配置->變更配置,保持默認數據處理配置,單擊下一步進入數據結構配置。單擊添加表并選擇通過數據源創建。
選擇MaxCompute數據源,點擊新建數據庫,按要求填寫project名稱、accessKey和accessKeySecret,然后單擊連接。
選擇需要參與問答的數據表然后單擊確認。
如果相關表字段需進行文本問答,可打開文本問答按鈕,給需要進行文本問答的字段指定字段標簽。
說明表名為英文字母、數據或者下劃線,不要超過20個字符。
字段名稱:必須以字母開頭,由字母、數字和下劃線組成,不能超過30個字符。
字段解釋:字段解釋和問答效果強相關,建議每個字段都要填寫,否則會對問答效果產生影響。可以根據問答效果隨時進行調整,每個字段的字段解釋不能超過30個字符。
請保證主鍵值唯一,主鍵ID只支持INT和TEXT兩種類型。
字段類型:請根據待上傳表格數據進行配置,類型不一致會導致表格上傳失敗。配置為內容的字段,字段類型應設置為TEXT。
字段標簽:若不開啟文本問答功能則無需填寫,若開啟文本問答功能則需要配置內容和主鍵這兩個字段標簽。配置為內容的字段會同步到main表中,目前只支持將一條字段的標簽設置為內容。其它標簽設置請參見數據配置。
文本問答:開啟后,在問答測試時會先針對自定義的輔表中進行表格問答,如果沒有搜索到答案,則會針對設置為內容的字段進行文本問答,增加回答率。
填入分區條件(不填分區條件默認拉取全部分區數據),單擊完成等待構建完畢。
效果測試
數據上傳成功后可在問答測試頁面進行測試,文檔總數可在數據查詢下查看。
API查詢數據可參考:問答文檔查詢。
相關限制
輔表最多只能添加5張。
每個輔表最多支持30個字段的數據寫入和查詢。