面向百煉大模型用戶的文本審核服務(wù)
本服務(wù)專為百煉平臺用戶提供,旨在提升大模型的文字輸入和輸出安全審核體驗。在遵守百煉平臺紅線管控政策的基礎(chǔ)上,我們提供了靈活的審核標(biāo)簽管理功能,允許用戶根據(jù)需要開啟或關(guān)閉特定審核標(biāo)簽。此外,我們還提供定制化的安全策略配置服務(wù),以滿足不同用戶的個性化需求。
基于模型匹配策略
當(dāng)您在百煉控制臺開通內(nèi)容安全產(chǎn)品的SLR授權(quán)后,并在調(diào)用百煉的header中傳入cip標(biāo)識時,我們會根據(jù)您的模型版本自動匹配服務(wù)于該模型的內(nèi)容安全服務(wù),具體匹配邏輯如下:
服務(wù)名稱 | service | 適用模型范圍 | 特性說明 |
百煉文字輸入檢測_pro | bailian_query_check_pro | Qwen-Max系列模型 | 支持對底線類違規(guī)(涉黃、涉政、涉暴等)、不良誘導(dǎo)信息的檢測,支持對部分誘導(dǎo)性敏感話題進(jìn)行檢測。在部分場景中,該服務(wù)引入了審核大模型用于提升識別效果。 |
百煉文字輸出檢測_pro | bailian_response_check_pro | Qwen-Max系列模型 | 支持對底線類違規(guī)(涉黃、涉政、涉暴等)、不良誘導(dǎo)信息的檢測,支持對AI可能產(chǎn)生的辱罵、偏見、不良價值觀信息進(jìn)行檢測。在部分場景中,該服務(wù)引入了審核大模型用于提升識別效果。 |
百煉文字輸入檢測 | bailian_query_check | (非Qwen-Max系列)其他系列的模型 | 支持對底線類違規(guī)(涉黃、涉政、涉暴等)、不良誘導(dǎo)信息的檢測,支持對部分誘導(dǎo)性敏感話題進(jìn)行檢測。 |
百煉文字輸出檢測 | bailian_response_check | (非Qwen-Max系列)其他系列的模型 | 支持對底線類違規(guī)(涉黃、涉政、涉暴等)、不良誘導(dǎo)信息的檢測,支持對AI可能產(chǎn)生的辱罵、偏見、不良價值觀信息進(jìn)行檢測。 |
計費(fèi)說明
按token數(shù)量后付費(fèi)
當(dāng)您在百煉控制臺開通內(nèi)容安全產(chǎn)品的SLR授權(quán),并通過百煉配置使用內(nèi)容安全產(chǎn)品策略,產(chǎn)生實(shí)際用量時,付費(fèi)方式是按token數(shù)量后付費(fèi),且按照實(shí)際用量結(jié)算當(dāng)日費(fèi)用,不調(diào)用服務(wù)不收費(fèi)。
審核類型 | 支持的服務(wù) | 計費(fèi)單價 |
文本審核按token計費(fèi)通用(text_token_standard) |
| 0.0004 元/千Token |
文本審核按token計費(fèi)高級(text_token_advanced) |
| 0.003 元/千Token |
在百煉平臺進(jìn)行單次query/response檢測時,如果文本的token數(shù)量不足1000個,我們將按照1000個token的標(biāo)準(zhǔn)進(jìn)行計費(fèi)。若文本的token數(shù)量超過1000個,則將根據(jù)實(shí)際的token數(shù)量來計算費(fèi)用。
風(fēng)險標(biāo)簽
標(biāo)簽含義
您可以在
頁簽,單擊查看標(biāo)簽獲取每個服務(wù)支持的標(biāo)簽及其細(xì)分檢測范圍信息。以下是風(fēng)險標(biāo)簽值、對應(yīng)的分值區(qū)間以及對應(yīng)的含義:標(biāo)簽值(label) | 置信分區(qū)間(confidence) | 中文含義 |
pornographic_adult | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似色情內(nèi)容 |
sexual_terms | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似性健康內(nèi)容 |
sexual_prompts | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似誘導(dǎo)生成色情內(nèi)容 |
sexual_suggestive | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似低俗內(nèi)容 |
political_figure | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似政治人物 |
political_entity | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似政治實(shí)體 |
political_n | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似敏感政治內(nèi)容 |
political_p | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似涉政禁宣人物 |
political_prompts | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似誘導(dǎo)生成涉政內(nèi)容 |
political_a | 0~100分,分?jǐn)?shù)越高置信度越高 | 涉政專項升級保障 |
violent_extremist | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似極端組織 |
violent_incidents | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似極端主義內(nèi)容 |
violent_weapons | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似武器彈藥 |
violent_prompts | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似誘導(dǎo)生成暴力內(nèi)容 |
contraband_drug | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似毒品相關(guān) |
contraband_gambling | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似賭博相關(guān) |
contraband_act | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似違禁行為 |
contraband_entity | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似違禁工具 |
inappropriate_discrimination | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似偏見歧視內(nèi)容 |
inappropriate_ethics | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似不良價值觀內(nèi)容 |
inappropriate_profanity | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似攻擊辱罵內(nèi)容 |
inappropriate_oral | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似低俗口頭語內(nèi)容 |
inappropriate_superstition | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似封建迷信內(nèi)容 |
inappropriate_nonsense | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似無意義灌水內(nèi)容 |
pt_to_sites | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似站外引流 |
pt_by_recruitment | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似網(wǎng)賺兼職廣告 |
pt_to_contact | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似引流廣告號 |
religion_b | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似涉及佛教 |
religion_t | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似涉及道教 |
religion_c | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似涉及基督教 |
religion_i | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似涉及伊斯蘭教 |
religion_h | 0~100分,分?jǐn)?shù)越高置信度越高 | 疑似涉及印度教 |
customized | 0~100分,分?jǐn)?shù)越高置信度越高 | 命中自定義詞庫 |
管理標(biāo)簽
除了部分紅線管控標(biāo)簽,其他風(fēng)險標(biāo)簽均可以在控制臺進(jìn)行開關(guān)配置,部分風(fēng)險標(biāo)簽會提供更細(xì)分檢測范圍的開關(guān)配置,具體參見內(nèi)容安全控制臺。
在左側(cè)導(dǎo)航欄,選擇API違規(guī)檢測增強(qiáng)版>文本審核>規(guī)則配置。
在規(guī)則管理頁簽,以百煉文字輸入檢測(bailian_query_check)為例,單擊操作列管理檢測規(guī)則。
選擇需要調(diào)整的檢測類型,以不良內(nèi)容檢測為例。
單擊編輯進(jìn)入編輯模式,修改對應(yīng)檢測狀態(tài)。
單擊保存,保存新配置的檢測范圍。新配置的檢測范圍約2~5分鐘生效并應(yīng)用于生產(chǎn)環(huán)境。
步驟一:開通服務(wù)
在正式使用文本審核增強(qiáng)版功能之前,需要先開通服務(wù)。
訪問內(nèi)容審核增強(qiáng)版頁面,仔細(xì)閱讀并選中服務(wù)協(xié)議。
單擊立即開通。
步驟二:自定義審核規(guī)則(可選)
文本審核增強(qiáng)版為您內(nèi)置了一套文本審核的標(biāo)簽,可滿足您大部分文本內(nèi)容的審核。
如果您需要定制私有化的審核規(guī)則,可以通過如下步驟創(chuàng)建詞庫,設(shè)置有風(fēng)險的違規(guī)關(guān)鍵詞或者在檢測文本前需要過濾掉的關(guān)鍵詞,然后配置匹配關(guān)鍵詞的檢測規(guī)則。
登錄內(nèi)容安全控制臺。
在 頁面,按照如下步驟配置詞庫。
在關(guān)鍵詞庫管理頁簽,單擊創(chuàng)建詞庫。
在創(chuàng)建詞庫面板,按要求填寫詞庫信息。
1、支持多個關(guān)鍵詞通過與或非邏輯組合成一個關(guān)鍵詞,如關(guān)鍵詞“微信&兼職”表示只有同時出現(xiàn)以上兩個詞時才命中,“&”表示與關(guān)系,“~”表示非(排除)關(guān)系,配置關(guān)鍵詞時“&”必須在“~”之前。
2、每個關(guān)鍵詞以換行來分隔,單個詞不超過50字。
3、最多 1000 行,如需一次增加超過 1000 行,請使用上傳文件導(dǎo)入。
4、同一個賬號下總共支持添加 10萬個詞,最多可創(chuàng)建 20個詞庫。
單擊創(chuàng)建詞庫。
如果詞庫創(chuàng)建失敗,會有具體的提示信息,您可以根據(jù)提示重新創(chuàng)建。
配置規(guī)則。
在 頁簽,選擇目標(biāo)服務(wù),單擊右側(cè)操作列設(shè)置詞庫。
選擇用于忽略的詞庫。然后單擊下一步。
忽略詞庫的任何一個關(guān)鍵詞只要與待審核文本匹配成功后,先進(jìn)行忽略再檢測。該場景主要對一些關(guān)鍵詞加入白名單,不需要檢測。
例如,設(shè)置的忽略詞庫中的關(guān)鍵詞為方便、快捷。此時,待審核的文本為本校小額貸款,安全、快捷、方便、無抵押,隨機(jī)隨貸,當(dāng)天放款,上門服務(wù),那么方便、快捷先被忽略掉,只對本校小額貸款,安全、無抵押,隨機(jī)隨貸,當(dāng)天放款,上門服務(wù)進(jìn)行文本風(fēng)險檢測。
選擇用于命中的詞庫,然后單擊確定。
命中詞庫的任何一個關(guān)鍵詞只要與待審核文本匹配成功后,使用API調(diào)用文本審核增強(qiáng)版時
labels
會返回C_customized
(用戶庫命中,表示命中您創(chuàng)建的詞庫)。該場景主要是檢測待審核文本中是否存在違規(guī)風(fēng)險。例如,設(shè)置的命中詞庫中的關(guān)鍵詞為小額貸款、上門服務(wù)。此時,待審核的文本為本校小額貸款,安全、快捷、方便、無抵押,隨機(jī)隨貸,當(dāng)天放款,上門服務(wù),那么進(jìn)行文本風(fēng)險檢測時,會匹配到小額貸款和上門服務(wù)關(guān)鍵詞。使用API調(diào)用文本審核增強(qiáng)版時返回參數(shù)
labels
的值除了返回內(nèi)置的標(biāo)簽外(如果匹配到會返回,否則不返回),還會返回C_customized
。
規(guī)則配置完成后,會在3分鐘后生效,請您耐心等待。
步驟三:查看審核結(jié)果(可選)
你可以通過查看審核的結(jié)果,分析審核文本中高頻的違規(guī)類型。
在 頁簽頁面,查看審核的文本、命中的標(biāo)簽及請求時間。
您可以設(shè)置查詢時間范圍、百煉請求ID、文本、標(biāo)簽搜索待查詢的信息。支持查詢30天以內(nèi)的數(shù)據(jù),結(jié)果查詢頁面最多可以保存5萬條數(shù)據(jù),如果您有更高的存儲需求,在調(diào)用API后需要您自行保存返回結(jié)果。
按照標(biāo)簽搜索查詢信息時,標(biāo)簽的篩選方式如下:
包含:表示返回結(jié)果標(biāo)簽中包含輸入的標(biāo)簽值。
不包含:表示返回結(jié)果標(biāo)簽中不包含輸入的標(biāo)簽值。
空:表示返回結(jié)果沒有命中任何標(biāo)簽。
非空:表示返回結(jié)果命中了任意標(biāo)簽的(無需輸入標(biāo)簽值)。
不會對未被檢測出有風(fēng)險的內(nèi)容片段進(jìn)行具體展示。
定位到某條文本內(nèi)容,單擊操作列查看。查看該條文本內(nèi)容被審核的詳細(xì)信息。
如果您對審核結(jié)果有異議,可以在指定文本操作列反饋下拉框中提交未違規(guī)誤報和違規(guī)漏過的反饋。