本文介紹了黃金測評集的創建方式、擴充方式以及對已有黃金測評集的查看、編輯和刪除操作。
功能概述
黃金測評集是指通過仔細篩選的一套用戶會話數據集,用于在標注任務中評估測試機器人的會話效果。可下載模板按要求進行填寫,黃金測評集主要包含:用戶問法、期望答案、期望命中答案類型、期望命中文件名稱、SessionId。黃金測評集在標注任務中的使用請參見標注任務。
新建黃金測評集
登錄智能對話機器人管理控制臺,進入具體機器人空間,選擇標注中心>黃金測評集進入黃金測評集管理界面。
單擊新建黃金測評集,在新建黃金測評集窗口填寫黃金測評集名稱并按照規范模板上傳文件。黃金測評集內容需要滿足一定的規范格式,系統提供黃金測評集模板,實際業務中可根據此模板梳理黃金測評集。規范模板內容如下:
用戶問法(必填):即用戶與機器人對話中提出的問題或請求。如:“幫我查下天氣、今天天氣怎么樣”。
期望答案(選填):對應用戶問法下,期望機器人回復的答案。如機器人:“請問你要查詢哪里的天氣、今天天氣晴朗”。
SessionId(選填):用于測評多輪對話,可以使用數字自定義,同一通對話使用相同ID即可。若未填寫,則默認測試單輪對話,系統自動生成不同的ID。
期望命中的問答類型(選填):可填寫對話工廠、數據問答、高頻問答、文檔、網站、互聯網知識等任一種問答類型。
期望命中的文件名稱(選填):可填寫文檔名稱、高頻問題、網頁名稱、數據表名稱、對話流名稱,為方便區分同名文件,建議文件名稱帶后綴。
隨路參數(選填):json格式的用戶自定義參數集,可以傳入用戶自定義的參數到各對話引擎。
說明導入文件支持擴展名為:xls、xlsx,最大為20MB。導入文件非必填,若不上傳,則創建一個空測評集;若上傳數據需要符合既定的格式,用戶問法為必填字段,其他字段根據需求選填,請勿在其他列填寫無關內容。
單擊確定,完成黃金測評集的創建。
在黃金測評集管理界面,單擊已有黃金測評集右側查看、下載、刪除,即可完成對已有黃金測評集的查看、下載和刪除操作。
擴充已有黃金測評集
在已有測評集上新增數據
登錄智能對話機器人管理控制臺,進入具體機器人空間,選擇標注中心>黃金測評集進入黃金測評集管理界面。
單擊已有黃金測評集右側查看,進入已有黃金測評集數據管理界面。
單擊新建,在新建數據窗口,根據實際業務需求,填寫用戶問法等信息,單擊確定完成數據新建。
用戶問法:即用戶與機器人對話中提出的問題或請求。如用戶:“幫我查下天氣、今天天氣怎么樣”。
期望答案:對應用戶問法下,期望機器人回復的答案。如機器人:“請問你要查詢哪里的天氣、今天天氣晴朗?!?/p>
期望命中答案類型:可選擇對話工廠、數據問答、高頻問答、文檔、網站、互聯網知識等任一種問答類型
期望命中文件名稱:可填寫文檔名稱、高頻問題、網頁名稱、數據表名稱、對話流名稱,為方便區分同名文件,建議文件名稱帶后綴。
SessionId:用于測評多輪對話,可以使用數字自定義,同一通對話使用相同ID即可。若未填寫,則默認測試單輪對話,系統自動生成有差異的ID。
單擊已有黃金測評集右側的編輯、刪除,即可進行黃金測評集內容的編輯、刪除操作。
從測試窗中擴充測評集
在測試窗中測試機器人問答效果時,若機器人回復效果不佳,可將當前用戶問句保存至黃金測評集,方便后續再次驗證有關問答效果。具體操作方法請參見全局測試窗查看對話調試信息部分。