數據集管理
數據集模塊用來管理用戶存儲與組織樣本及標注數據的數據組織單位數據集,其主要功能分為三部分:
新建數據集
數據集列表
數據集詳情
注意:用戶必須選擇對應的工作區之后才能進入數據集相關的功能,否則會提示權限不足。
新建數據集
用戶需要新建數據集,來對模型訓練需要使用的大量樣本數據進行組織與管理;
點擊菜單欄左側【新建數據集】或者【數據集列表】的新建按鈕來實現
數據集名稱
數據集名稱30個字符以內,最好能體現數據集內容的特點,且避免重復
數據集限制條件
只支持擴展名為.zip的文件;
zip文件大小不能超過2GB,如果超出請分包上傳;
圖片個數保持在2000張以內,超出只保留前兩千張;
圖像名稱只支持字母、數字、下劃線、同名圖像將被覆蓋;
上傳與重置
填寫了數據集名稱,并選擇了合規的數據集內容文件后,點擊上傳按鈕完成數據集創建,頁面將跳轉到數據集列表頁面,并在數據集列表里顯示新創建的數據集??梢酝ㄟ^點擊數據集名稱進入數據集詳情或直接在列表中通過快捷方式操作,進一步設置完善數據集。點擊重置按鈕將清除已輸入的數據集名稱及選擇的數據集內容文件。
數據集列表
對新建的數據集進行管理,可以對已經建立好的數據集進行
【新增】:同上新建訓練集
【刪除】:對不需要的數據集合進行刪除
【篩選】:通過數據集包含的標簽進行數據集的篩選,方便用戶查找相關指標的數據集,默認顯示當前工作區的前十個標簽
【上傳】:已經標注好的數據集可以對其進行二次補充上傳,保證數據集的完整性
【標注】:對用作訓練的樣本數據進行標注,確保數據的有效性
【導出】:已經標注好的數據集支持導出功能,方便用戶使用
【復制】:可以把當前相關的數據集復制到不同的工作區,方便用戶對數據的多樣性操作
【查看異常日志】:對模型上傳數據集過程中存在的異常情況有全量的判斷,方便追蹤
數據集詳情
【基本信息】:數據集名稱、創建時間、標簽、最后修改時間
【上傳】:選擇不同的數據包形式上傳數據集,
對當前數據集的樣本進行上傳添加。
只支持文件拓展名為 .zip文件。
zip文件大小不能超出2G,超出需要分包上傳。
zip文件中圖片數量不能超出2000張。
圖像名稱只支持字母 、數字 、下劃線。
同名樣本圖片將被覆蓋。
目前支持jpg,png,bmp,jpeg格式圖片。
【瀏覽】:
(1)標注導出按鈕:(同頂部標注導出按鈕功能) 以json格式的文件導出這個數據集中所有已標注樣本的標注數據。
(2)樣本分類信息:數據集中全部樣本數,已標注樣本數與未標注樣本數統計,點擊具體三個標簽行右邊的樣本預覽區域中的樣本會隨之進行篩選。
(3)標簽標注信息:數據集中每個標簽的標注數,點擊標簽行右邊的樣本預覽區域中的樣本會隨之進行篩選。
(4)樣本縮略圖展示:樣本縮略圖顯示,每個樣本底端顯示文件名。