文本審核增強版服務通過升級內容安全核心引擎,采用動態策略和模型強化變異對抗性,提供多種業務場景的審核服務,識別出多種違規風險。本文介紹如何使用文本審核增強版。
功能特性
與文本檢測1.0服務相比較,文本審核增強版服務支持更多的功能,并支持業務自定義規則,為您提供更全面的內容安全保障。
匹配業務場景
文本審核增強版服務支持匹配多種業務場景,為您簡化業務接入和選擇模型的工作,擴大合規風險覆蓋的范圍。您可根據需要的業務場景選擇對應的服務。
服務名稱 | service | 常用業務場景 | 場景特性說明 |
大語言模型輸入文字檢測 | llm_query_moderation | 大語言模型的用戶輸入內容 | 支持對底線類違規(涉黃、涉政、涉暴等)、不良誘導信息的檢測,可支持對部分誘導性敏感話題的話術建議。具體參考面向大語言模型的文本審核plus服務。 |
大語言模型生成文字檢測 | llm_response_moderation | 大語言模型的AI合成內容 | 支持對底線類違規(涉黃、涉政、涉暴等)、不良誘導信息的檢測,可支持對AI可能產生的辱罵、偏見、不良價值觀信息進行部分檢測。具體參考面向大語言模型的文本審核plus服務。 |
用戶昵稱檢測_專業版 | nickname_detection_pro | 用戶昵稱、公眾號名稱、直播間標題等 | 在用戶昵稱檢測的基礎上提供更細化標簽且開放審核標簽的開啟和關閉功能。具體參考文本審核增強版PLUS服務。 |
私聊互動內容檢測_專業版 | chat_detection_pro | 用戶間聊天互動 | 在私聊互動內容檢測的基礎上提供更細化標簽且開放審核標簽的開啟和關閉功能。具體參考文本審核增強版PLUS服務。 |
公聊評論內容檢測_專業版 | comment_detection_pro | 評論、彈幕、公聊、轉發等 | 在公聊評論內容檢測的基礎上提供更細化標簽且開放審核標簽的開啟和關閉功能。具體參考文本審核增強版PLUS服務。 |
用戶昵稱檢測 | nickname_detection | 用戶昵稱、公眾號名稱、直播間標題等 | 側重識別底線違規類(涉黃、涉政、涉暴等)、仿冒官方、禁限引流風險,可輔助治理虛假賬號。 |
私聊互動內容檢測 | chat_detection | 用戶間聊天互動 | 在平衡用戶體驗基礎上,主要識別底線違規類(涉黃、涉政、涉暴等)、辱罵網暴等風險。 |
公聊評論內容檢測 | comment_detection | 評論、彈幕、公聊、轉發等 | 通常風險率高、風險類型多、變形變異強,識別底線違規類(涉黃、涉政、涉暴等)、廣告導流、禁限內容等風險。支持在決策引擎中接入使用,具體參考文本審核服務在決策引擎中的應用。 |
PGC通用物料檢測 | pgc_detection | 辦公文檔、課件內容、宣傳資料等通用物料 | 適用于通常風險率低,需精確檢測底線類風險(涉黃、涉政、涉暴等)的內容場景。 |
AIGC類文字檢測 | ai_art_detection | AI文生圖的文字指令等 | 兼容中英文本,側重識別底線違規類(涉黃、涉政、涉暴等)和負面內容。 |
廣告法合規檢測 | ad_compliance_detection | 商品素材、廣告文案 | 識別疑似違反廣告法規,包括極限詞、行業禁限、紅線違規(涉黃、涉政、涉暴等)等風險。 |
國際業務多語言檢測 | comment_multilingual_pro | 國際化業務中的評論、聊天和昵稱等 | 自動判斷語種,支持38個語種類型,結合國際化業務特性的策略體系,具體參考文本審核增強版多語言服務。 |
URL風險鏈接檢測 | url_detection | URL鏈接發布和分享,內置瀏覽器等 | 識別第三方URL鏈接是否存在欺詐、色情、賭博等風險,具體參考文本審核增強版檢測URL風險。 |
豐富審核標簽
支持更豐富的審核標簽,以及更詳細的原因定位。如果內容存在多類風險,能夠同時返回多個標簽。您可以在
頁簽,單擊查看標簽獲取每個服務支持的標簽及其細分檢測范圍信息。計費說明
文本審核增強版服務支持按量后付費和資源包抵扣兩種付費方式。
按量后付費
當您開通文本審核增強版服務后,默認付費方式是按量后付費,且按照實際用量結算當日費用,不調用服務不收費。更多內容,請參見開通內容審核增強版服務。
審核類型 | 支持的業務場景(服務) | 計費單價 |
文本審核通用(text_standard) |
url_detection | 7.5元/萬次 |
文本審核高級(text_advanced) |
comment_multilingual_pro | 15元/萬次 |
資源包抵扣
如果您的審核量較大,或有相對固定的審核需求,建議預先購買資源包的方式。購買資源包規格越大,享受越低折扣,支持疊加購買和使用。更多內容,請參見購買內容審核增強版抵扣資源包。
該資源包用于內容審核增強版用量的抵扣,無法與內容安全流量包共享,具體的抵扣系數如下:
審核類型 | 抵扣系數 |
文本審核通用(text_standard) | 抵扣系數為1,表示每成功調用一次接口,抵扣資源包的流量包容量規格1次。 說明 例如購買的資源包的流量包容量規格為10次,當您成功調用1次接口,抵扣流量包容量規格1次,剩余9次。 |
文本審核高級(text_advanced) | 抵扣系數為2,表示每成功調用一次接口,抵扣資源包的流量包容量規格2次。 說明 例如購買的資源包的流量包容量規格為10次,當您成功調用1次接口,抵扣流量包容量規格2次,剩余8次。 |
步驟一:開通服務
在正式使用文本審核增強版功能之前,需要先開通服務。
訪問內容審核增強版頁面,仔細閱讀并選中服務協議。
單擊立即開通。
步驟二:自定義檢測服務(可選)
文本審核增強版為您內置了多個檢測服務,可滿足您大部分業務場景使用。具體信息,請參見檢測服務可匹配的業務場景。
如果您需要定制私有化的檢測服務,可以通過如下步驟復制內置的檢測服務,調整檢測范圍,以滿足業務差異化的審核需求。
登錄內容安全控制臺。
在左側導航欄,選擇
。在規則管理頁簽,定位到要復制的服務,單擊操作列復制,輸入服務名稱和服務說明。
復制成功后,復制服務和源服務的配置項一致,包括計費方式、可設置項以及自定義詞庫配置情況。您可以根據業務需求對調整復制服務的檢測范圍,滿足業務差異化的審核需求。具體操作,請參見步驟三:自定義審核規則(可選)。
步驟三:自定義審核規則(可選)
文本審核增強版為您內置了一套文本審核的標簽,可滿足您大部分文本內容的審核。具體信息,請參見豐富審核標簽。
如果您需要定制私有化的審核規則,可以通過如下步驟創建詞庫,設置有風險的違規關鍵詞或者在檢測文本前需要過濾掉的關鍵詞,然后配置匹配關鍵詞的檢測規則。
登錄內容安全控制臺。
在 頁面,按照如下步驟配置詞庫。
在關鍵詞庫管理頁簽,單擊創建詞庫。
在創建詞庫面板,按要求填寫詞庫信息。
1、支持多個關鍵詞通過與或非邏輯組合成一個關鍵詞,如關鍵詞“微信&兼職”表示只有同時出現以上兩個詞時才命中,“&”表示與關系,“~”表示非(排除)關系,配置關鍵詞時“&”必須在“~”之前。
2、每個關鍵詞以換行來分隔,單個詞不超過50字。
3、最多 1000 行,如需一次增加超過 1000 行,請使用上傳文件導入。
4、同一個賬號下總共支持添加 10萬個詞,最多可創建 20個詞庫。
單擊創建詞庫。
如果詞庫創建失敗,會有具體的提示信息,您可以根據提示重新創建。
配置規則。
在 頁簽,選擇目標服務,單擊右側操作列設置詞庫。
選擇用于忽略的詞庫。然后單擊下一步。
忽略詞庫的任何一個關鍵詞只要與待審核文本匹配成功后,先進行忽略再檢測。該場景主要對一些關鍵詞加入白名單,不需要檢測。
例如,設置的忽略詞庫中的關鍵詞為方便、快捷。此時,待審核的文本為本校小額貸款,安全、快捷、方便、無抵押,隨機隨貸,當天放款,上門服務,那么方便、快捷先被忽略掉,只對本校小額貸款,安全、無抵押,隨機隨貸,當天放款,上門服務進行文本風險檢測。
選擇用于命中的詞庫,然后單擊確定。
命中詞庫的任何一個關鍵詞只要與待審核文本匹配成功后,使用API調用文本審核增強版時
labels
會返回C_customized
(用戶庫命中,表示命中您創建的詞庫)。該場景主要是檢測待審核文本中是否存在違規風險。例如,設置的命中詞庫中的關鍵詞為小額貸款、上門服務。此時,待審核的文本為本校小額貸款,安全、快捷、方便、無抵押,隨機隨貸,當天放款,上門服務,那么進行文本風險檢測時,會匹配到小額貸款和上門服務關鍵詞。使用API調用文本審核增強版時返回參數
labels
的值除了返回內置的標簽外(如果匹配到會返回,否則不返回),還會返回C_customized
。
規則配置完成后,會在3分鐘后生效,請您耐心等待。
步驟四:接入文本審核增強版
目前,文本審核增強版支持以下兩種接入方式。
調用API接入服務。具體操作,請參見文本審核增強版PLUS服務 (推薦接入)或 文本審核增強版API。
使用SDK接入服務。具體操作,請參見文本審核增強版SDK及接入指南。
針對大模型場景的內容審核,文本審核增強版可參考以下接入方式。
調用API接入服務。具體操作,請參見面向大語言模型的文本審核plus服務。
使用SDK接入服務。具體操作,請參見大語言模型文本審核plus的SDK。
步驟五:查看審核結果(可選)
你可以通過查看審核的結果,分析審核文本中高頻的違規類型。
在 頁簽頁面,查看審核的文本、命中的標簽及請求時間。
您可以設置查詢時間范圍、請求ID、文本、標簽搜索待查詢的信息。支持查詢30天以內的數據,結果查詢頁面最多可以保存5萬條數據,如果您有更高的存儲需求,在調用API后需要您自行保存返回結果。
按照標簽搜索查詢信息時,標簽的篩選方式如下:
包含:表示返回結果標簽中包含輸入的標簽值。
不包含:表示返回結果標簽中不包含輸入的標簽值。
空:表示返回結果沒有命中任何標簽。
非空:表示返回結果命中了任意標簽的(無需輸入標簽值)。
定位到某條文本內容,單擊操作列查看。查看該條文本內容被審核的詳細信息。
如果您對審核結果有異議,可以在指定文本操作列反饋下拉框中提交未違規誤報和違規漏過的反饋。
步驟六:統計用量(可選)
統計調用量數據,幫助您了解當前阿里云賬號(主賬號)及其RAM用戶(子賬號)近期的文本審核增強版的調用量。
在
頁簽頁面,查看文本審核的調用量。您可以自定義查詢時間范圍,支持最近的365天內的調用量。支持按阿里云賬號及其RAM用戶的維度查看調用量。單擊圖標,下載用量統計數據。