敏感詞通常指帶有政治性、煽動性、暴力傾向、不健康色彩的詞、不文明的詞語或違法違規的詞語。
內容中臺支持對入庫的內容進行敏感詞檢測,有針對性地篩查和屏蔽,確保 App 線上發布內容的合規性和有效性。支持敏感詞表管理,配合敏感詞模型使用。若上傳的內容含敏感詞,則會命中敏感詞模型進入質檢隊列,并在人工質檢操作頁面高亮展示敏感詞,高效輔助質檢員完成質檢判斷。
系統會預置一些通用的敏感詞表,同時也支持自定義上傳、修改敏感詞。
本文介紹如何創建敏感詞表及管理敏感詞。
創建敏感詞表
登錄 mPaaS 控制臺,從左側導航欄進入 內容中臺 > 質檢敏感詞管理 頁面。
單擊 創建敏感詞表,在創建面板中設置詞表信息并添加敏感詞。
詞表名稱:自定義敏感詞表的名稱,應用內保持唯一。
詞表描述:對該詞表包含的敏感詞進行簡要的描述。
敏感詞信息:支持手動輸入敏感詞,或通過文件導入的方式批量上傳敏感詞。
手動輸入:在輸入框中輸入敏感詞,按回車鍵(Enter)后,繼續添加。
文件導入:僅支持導入 .txt 格式的文件,文件大小不超過 50 MB。文件中每條記錄占一行,詞語長度需小于 100 字符,超過 100 字符時,將不予以導入。重復條目只導入一次。
敏感詞添加完畢后,單擊 確定 完成敏感詞表創建。新建的敏感詞表將展示在詞表列表上方,默認不啟用,即未應用到敏感詞模型中去。
啟用/停用敏感詞表
在詞表列表中,選擇未啟用的目標敏感詞表,單擊操作列下的 啟用 菜單,使該詞表生效。如無需使用該詞表,單擊 停用 菜單即可。
一旦啟用,敏感詞表將配合敏感詞模型對入庫內容進行敏感詞質檢。
編輯敏感詞表
在詞表列表中,選擇要修改的敏感詞表,單擊操作列下的 編輯 菜單,修改詞表基本信息,添加或刪除敏感詞。
已啟用的敏感詞表不支持編輯,需要先停用后方可修改。
刪除敏感詞表
在詞表列表中,選擇要刪除的敏感詞表,單擊操作列下的 刪除 菜單即可。
二次掃描
背景
敏感詞表的啟動和停用,僅會影響尚未通過機器質檢的內容;對于已經通過了質檢的內容和評論(無論是否已發布到線上),都不會受到敏感詞表啟用和停用的影響。
因此,需要單獨開辟一個敏感詞全量掃描質檢的功能,使得遇到突發輿情事件時,可針對敏感詞實現對 質檢已通過 的內容和評論的再次掃描質檢。
頁面流程
登錄 mPaaS 控制臺,從左側導航欄進入 內容中臺 > 質檢敏感詞管理 頁面。
點擊 二次掃描 按鈕,對處于上述狀態的內容及評論進行全量敏感詞再次掃描,掃描完成后導出.csv文件,給后續處理提供依據。
質檢已通過的內容包含兩種狀態:已發布、已上線。
質檢已通過的評論的狀態為:正常
導出的.csv
文件分為三個 sheet,分別是視頻、圖文、評論的掃描結果。每個 sheet 中包含以下字段:
內容 id/評論 id、命中敏感詞(可包含多個,當存在多個時用英文逗號分隔)、內容狀態/評論狀態。