日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

數據集管理

數據集是一個或多個錄音文件組成的集合,您可以將呼叫中心已經生成的錄音文件創建為數據集,然后使用數據集發起數據集質檢任務。

新建數據集

1、上傳音頻文件

點擊,數據集質檢-數據集管理,頁面列表上方的 新建數據集 按鈕,如下圖所示,按照頁面提示進行填寫,并按照頁面提示的要求上傳錄音文件,對于某些不符合標準的音頻,上傳時會做自動轉碼處理,比如將采樣率轉為8000Hz,單擊下載 音頻樣例 。上傳完畢后點擊頁面底部的 下一步 按鈕,進行話者角色配置;

image.png

2、開始音頻轉寫

系統會隨機選取一個錄音文件,點擊頁面中的 開始音頻轉寫 按鈕,對該文件進行語音轉文字,轉寫完畢后,需要您根據對話文本進行話者角色配置。由于錄音文件分為單軌錄音和雙軌錄音,話者角色配置方式有所不同,下面會分別說明。

image.png

話者角色配置:語音轉文本時,系統會自動將錄音分為兩個對話角色,但是出于一些客觀因素系統無法準確識別哪個角色為客服,所以需要您根據文本內容來手工設置,選出哪一方為客服,則另一方即為客戶。準確的進行話者角色配置非常重要,因為我們進行質檢分析時所用的規則,很多時候都有檢測范圍的限制(即一個規則只檢測客服或者客戶),如果話者角色配置是錯誤的,那么將對質檢結果的準確性產生極大影響。

3、單軌錄音的話者角色配置

單軌錄音的話者角色配置,音頻轉寫完成后,如下圖所示,一側為客戶,一側為客服;角色的判斷方式分為以下兩種:

  • 系統自動判斷:我們內置了一些常見的客服開場時所說的關鍵詞,例如“您好、很高興為您服務......”,從上往下對文本進行匹配,當匹配成功時,則認為當前角色為客服,另一側即為客戶;

  • 根據關鍵詞判斷客服人員:根據實際業務場景,填寫一個或多個客服開場時常說的關鍵詞,匹配上這些關鍵詞時,則認為當前角色為客服,另一側即為客戶;

選擇合適的角色判斷方式,點擊 驗證 按鈕,對話框中的文本會發生變化,請您自行判斷是否正確,如不正確,可以對關鍵詞進行調整;話者角色配置完畢后,點擊頁面底部的 完成創建 即可,此時該數據集內的所有文件,都將使用相同的角色判斷方式。

image.png

需要強調的是,單軌錄音的話者角色分離無法保證100%正確,建議您將呼叫中心生成的錄音文件設置為 雙軌錄音,這樣客戶一個軌,客服一個軌,可以從根源上避免出現話者角色分離錯誤的情況。

4、雙軌錄音的話者角色配置

雙軌錄音的話者角色配置,音頻轉寫完成后,如下圖所示,根據對話文本,選擇角色A的正確角色,角色B的角色會自動變化,選擇無誤后,點擊頁面底部的 完成創建 即可,此時該數據集內的所有文件,都將使用相同的角色判斷方式。

image

列表操作

  • 編輯數據集:編輯數據集時只可修改話者角色配置,不可增加或刪除數據集中的文件;

  • 刪除數據集:刪除后不可找回,但已經使用該數據集執行過的質檢任務數據仍將保留;