前言
歡迎使用自然語言處理服務,這里主要為您介紹如何使用NLP自學習平臺,以及如何快速找到需要的幫助信息。
NLP自學習平臺于2019年9月23日開始正式收費,每位主賬號新用戶均有1個月的免費試用期,詳細定價方案請見NLP自學習平臺定價。如需提高QPS或是其他任何問題,歡迎加入“阿里云NLP自學習平臺用戶答疑二群”(釘釘群號:44619071)。
服務使用流程
NLP自學習平臺的基本使用流程如下圖所示,全程可交互操作,無需工程與算法背景,預計500份以上的標注數據時,模型準確率可以達到85%以上。
一、開通服務
您需要先開通自然語言服務才能購買及使用NLP自學習平臺的各類產品。
首先要確保您已經注冊了阿里云賬號,如果您尚未注冊,可以點擊這里。
若您已經注冊了阿里云賬號,開通服務入口請點擊【NLP自學習平臺服務開通】
開通NLP自學習平臺后可購買服務對應調用資源包:【NLP自學習平臺調用資源包】
如果您需要模型訓練,還需要購買模型包月:【NLP自學習平臺模型服務】
二、新建項目
創建并管理自己的項目,目前您可以創建十三種項目類型:1、文本實體抽取;2、文本分類;3、關鍵短語抽??;4、情感分析;5、文本關系抽?。?、短文本匹配;7、商品評價解析;8、簡歷抽??;9、雙句文本分類;10、招中標信息抽??;11、合同要素抽?。?2、合同抽??;13、對話文本分類。
項目可添加更多的項目管理員,管理員擁有這個項目下所有權限(項目、數據、模型等),通過輸入阿里云賬號添加;同時,也支持子賬號管理項目,詳見子賬號授權相關問題。
三、數據管理
進入某一項目后,可以在數據中心中管理您的數據,有兩種方式可以創建數據:
1、創建標注任務;2、上傳數據集。
3.1 創建標注任務
步驟一:上傳待標注文檔,添加標注人員
創建者和項目管理員默認為標注人員,同時,您也可以將標注任務分配給您創建的阿里云子賬號,被分配用戶通過子賬號的賬號密碼登錄本平臺,即可參與數據標注。
子賬號登錄說明:
1、子賬號登錄頁,登錄:https://signin.aliyun.com/login.htm
2、登錄后,點擊進入我的項目-創建標注任務。
注意:目前僅支持UTF-8編碼方式的數據文件
步驟二:設置待標注的題目
不同項目類型中的題目類型會有所不同,例如
文本實體抽取項目中的題目為實體名:
文本分類項目中的題目為分類名:
步驟三:標注數據
完成標注任務的創建后,您可以在數據中心中,點擊標注進入標注中心,進行文檔的標注,每篇文檔僅會被標注一次。
步驟四:數據質檢(可選)
點擊數據中心項目列表操作欄中的質檢按鈕,進入質檢頁面。
您可以通過篩選和搜索,質檢已經標注好的文檔,以確保良好的標注質量。
3.2 上傳數據集
除了創建標注任務外,您也可以上傳本地已標注好的訓練數據,按示例文件的格式規整后,直接上傳。
點擊數據中心的上傳已標注數據按鈕,打開上傳數據集窗口。
四、模型管理
用戶可以在模型中心中一鍵訓練模型,查看模型評估指標,并進行在線可交互測試,測試完畢后可通過API方式調用接口。
4.1 訓練模型
點擊模型中心的創建模型,進入創建模型頁,輸入模型基本信息,選擇已標注完的數據,一鍵訓練模型,模型訓練需0.5-1小時。
4.2 模型查看
您可以查看模型的相關評估指標,主要有精確率、召回率和F1值;同時,您也可以新增模型版本,進行版本管理。
注意:如果訓練數據在100份以內,模型效果可能欠佳,且評估指標波動較大,基本無參考意義。若需要良好穩定的模型效果,訓練數據建議在500份以上。
4.3 模型測試
模型發布后,您可以直接在平臺上進行測試,并對不準的預測結果進行糾錯。
注意:為方便業務使用,同一模型同時可以發布兩個版本,若需發布第三個版本,請手動下線一個已發布的版本。