日本熟妇hd丰满老熟妇,中文字幕一区二区三区在线不卡 ,亚洲成片在线观看,免费女同在线一区二区

文檔知識管理

本文從機(jī)器人空間維度介紹了文檔知識的導(dǎo)入流程以及對已導(dǎo)入文檔知識的查看、轉(zhuǎn)移、刪除和搜索查詢操作。

功能概述

文檔知識指的是以文檔形式存在的知識,如pdf、doc/docx、txt、markdown格式的文檔。將文檔導(dǎo)入系統(tǒng)后,機(jī)器人可以根據(jù)用戶提問從文檔中召回相關(guān)知識,然后結(jié)合LLM給出最終答案。

導(dǎo)入文檔

說明

不同版本的業(yè)務(wù)空間可支持導(dǎo)入文檔的數(shù)量有差別,如企業(yè)版支持最多上傳5000個文檔,有關(guān)具體版本對應(yīng)的資源信息請參見資源限制和免費(fèi)額度

  1. 登錄智能對話機(jī)器人管理控制臺,進(jìn)入具體機(jī)器人空間,選擇知識庫>文檔管理進(jìn)入文檔知識管理界面。

    image

  2. 單擊導(dǎo)入文檔,在導(dǎo)入文檔窗口完成相關(guān)信息輸入。

    • 文檔類目:指文檔所屬類目,方便對文檔知識進(jìn)行分類。可以選擇綁定業(yè)務(wù)空間內(nèi)已有文檔類目,也可以單擊新建類目創(chuàng)建新的文檔類目。

    • 導(dǎo)入文檔限制條件:

      • 支持pdf、doc/docx、txt、markdown格式文檔。

      • 單個文件:支持最多100頁,txt小于200K,pdf小于100M,markdown小于200K,doc小于100M,docx小于100M。

      • 單次最多導(dǎo)入50個文件,超過50個請分批導(dǎo)入。

    • 生效配置:文檔知識可以作用于對話問答的時間,可配置為永久生效(即在該機(jī)器人未下線前都可用于對話問答)、指定時間生效(即僅在所配置時間段內(nèi)用于對話問答)、不生效。

    • 標(biāo)簽:支持對導(dǎo)入的文檔進(jìn)行標(biāo)記。

  3. 單擊下一步,進(jìn)入文檔解析設(shè)置窗口,根據(jù)實際業(yè)務(wù)需求,設(shè)置文檔解析規(guī)則。

    image

    • 自動解析分段:自動根據(jù)文檔內(nèi)容選擇一種內(nèi)置解析策略進(jìn)行解析。

    • 自定義解析策略:自主選擇內(nèi)置解析策略或自定義解析策略進(jìn)行解析。

      • 解析策略:可選擇已保存的自定義解析策略。

      • 解析內(nèi)容:

        • 文字內(nèi)容(必選):對文檔中的文字內(nèi)容進(jìn)行解析,并可以作為知識點用于對話問答。

        • 段落標(biāo)題(必選):對段落標(biāo)題進(jìn)行解析,并可以作為知識點用于對話問答。

        • 表格(非必選):文檔內(nèi)的表格內(nèi)容會被解析為markdown,并可以作為知識點用于對話問答。

        • 圖片(非必選):對圖片內(nèi)的文字內(nèi)容進(jìn)行解析,并可以作為知識點用于對話問答。

        • 目錄(非必選):對文檔內(nèi)的目錄內(nèi)容進(jìn)行解析,并可以作為知識點用于對話問答。

        • 頁面頁腳(非必選):對文檔中的頁眉頁腳內(nèi)容進(jìn)行解析,并可以作為知識點用于對話問答。

      • 內(nèi)容過濾:可通過正則表達(dá)式過濾掉文檔中的特定內(nèi)容片段。

      • 圖片增強(qiáng):開啟后,文檔解析時將自動生成圖片描述用于機(jī)器人問答。現(xiàn)階段免費(fèi)試用。圖片增強(qiáng)能力僅支持企業(yè)版和旗艦版。

      • 文檔摘要:啟用后,文檔解析時對知識進(jìn)行摘要總結(jié)。現(xiàn)階段免費(fèi)試用。

      • 文章標(biāo)題:文章標(biāo)題將用于文檔路徑片段,并將在對話中用于檢索相關(guān)文檔片段。

        • 識別標(biāo)題:采用ocr或md格式識別文檔內(nèi)容中的文章標(biāo)題,未識別時將默認(rèn)使用文檔名稱作為文章標(biāo)題。

        • 文檔標(biāo)題:直接使用文檔名稱作為文章標(biāo)題。

      • 文檔片段長度:文檔切片最大字?jǐn)?shù)上限,當(dāng)前支持單個文檔切片字?jǐn)?shù)最多為800字。

      • 層級解析模式:設(shè)置文檔段落層級的解析方式。

        • 自動識別解析:通過ocr識別文檔段落層級信息。

        • 段落規(guī)則解析:通過選擇文檔標(biāo)題規(guī)則或自定義文檔標(biāo)題規(guī)則識別文檔段落層級信息。

      說明

      自定義文檔解析規(guī)則和解析策略管理請參見文檔解析規(guī)則

      • 保存解析策略:在導(dǎo)入文檔過程中可以將當(dāng)前的解析策略保存至解析策略管理中,便于后續(xù)復(fù)用。可選擇新建解析策略和覆蓋已有解析策略兩種保存方式。

        image

  4. 單擊確定,完成文檔導(dǎo)入。

  5. 在已導(dǎo)入文檔知識的右側(cè)操作欄下,單擊轉(zhuǎn)移刪除可對文檔進(jìn)行轉(zhuǎn)移或刪除操作。

    • 文檔轉(zhuǎn)移:將文檔從一個類目轉(zhuǎn)移到另一個類目。

    • 文檔刪除:刪除知識中心有關(guān)文檔。

      說明

      刪除有關(guān)文檔后,對應(yīng)從有關(guān)文檔中挖掘出的高頻問答也會被刪除。

查看已導(dǎo)入文檔

  1. 登錄智能對話機(jī)器人管理控制臺,進(jìn)入具體機(jī)器人空間,選擇知識庫>文檔管理進(jìn)入文檔知識管理界面。

  2. 單擊已導(dǎo)入文檔右側(cè)操作欄查看,即可查看有關(guān)文檔內(nèi)容和文檔解析完成并切片后的信息。

    image

    • 上圖左側(cè)內(nèi)容為原始文檔內(nèi)容;右側(cè)內(nèi)容為原始文檔解析完成后切片的內(nèi)容詳情,支持對片段內(nèi)容進(jìn)行是否生效編輯刪除操作。

      • 是否生效:打開開關(guān),當(dāng)前切片生效,進(jìn)入大模型文檔解析。

      • 編輯:單擊編輯圖標(biāo),支持對切片進(jìn)行文本信息編輯和插入圖片等操作。當(dāng)文檔解析或切片效果不佳時(如一個完整內(nèi)容被切分為兩個片段),可能會影響模型的最終問答效果。若存在此類問題,可通過手動編輯調(diào)整片段內(nèi)容進(jìn)行優(yōu)化。image

      • 刪除:單擊刪除圖標(biāo),即可刪除當(dāng)前片段。

    • 重新解析:查看文檔時,支持對文檔內(nèi)容進(jìn)行重新解析。單擊重新解析,有關(guān)重新解析的設(shè)置可參考本文的導(dǎo)入文檔知識部分。

      image

      • 智能推薦:大模型能夠根據(jù)文檔內(nèi)容推薦相應(yīng)的文檔解析規(guī)則,用戶可以利用這些推薦的規(guī)則進(jìn)行文檔的解析與切片。

        image

    • 文檔信息:

      • 元數(shù)據(jù)信息:指文檔中帶有關(guān)鍵信息的字段,可以作為檢索條件,能有效過濾無關(guān)文檔。具體操作文檔請參見文檔信息表

      • 隨路信息:隨路信息添加后,會隨答案一起返回,隨路信息不參與對話問答。

        image

查詢已導(dǎo)入文檔

對已導(dǎo)入文檔支持普通搜索和高級搜索兩種搜索查詢支持。

image

  • 普通搜索:根據(jù)文檔標(biāo)題的關(guān)鍵字或文檔內(nèi)容的關(guān)鍵字進(jìn)行搜索。

  • 高級搜索:支持根據(jù)文檔的狀態(tài)、編輯人、更新時間、生效時間和失效時間進(jìn)行搜索。

    • 狀態(tài):指文檔上傳后,系統(tǒng)對文檔的處理狀態(tài)和自定義的生效狀態(tài)

      • 處理狀態(tài):

        • 排隊中:即文檔正在排隊待解析。

        • 解析中:即正在執(zhí)行文檔解析工作。

        • 處理中:即在文檔解析完成后,系統(tǒng)進(jìn)一步對文本內(nèi)容進(jìn)行向量化儲存處理的過程。

        • 處理失敗:即文檔處理失敗。

      • 生效狀態(tài):

        • 生效時間:即文檔的有效時間,若當(dāng)前時間在文檔的生效時間內(nèi),文檔生效,可以進(jìn)行問答;反之則文檔失效,不參與問答。

        • 生效中:即文檔在當(dāng)前時間有效,可參與問答。

        • 已失效:即文檔在當(dāng)前時間無效,不可參與問答。

        • 待生效:即文檔正在解析中,還未生效,不可參與問答。