Dataphin標簽支持將離線數據集輸出指標直接定義成為標簽。本文將指導您如何通過指標映射方式創建離線標簽。
前提條件
通過指標映射創建離線標簽前需創建對應的離線數據集。更多信息,請參見離線數據集概述。
操作步驟
在Dataphin首頁,在頂部菜單欄選擇標簽 > 工作臺。
在頂部菜單欄選擇項目。
在左側導航欄選擇標簽加工 > 離線標簽,在離線標簽頁面單擊新增標簽。
在新增離線標簽對話框中單擊指標映射,進入新建指標映射頁面。
在新增指標映射頁面中,配置離線標簽的業務屬性、技術屬性與加工邏輯。
業務屬性
參數
描述
實體-實體ID
根據業務需求選擇所需要定義的實體及實體對應的實體ID。
標簽類型
標簽類型按照加工方式對標簽進行分類。
屬性標簽:用于描述客觀事實,是描述實體畫像最基礎常見的標簽,如性別、姓名標簽等。
統計標簽:按照業務需求根據實體行為或基礎屬性統計的計算后生成,如最近7天購買金額標簽等。
預測標簽:根據算法模型對實體特征或行為進行預測,如預測用戶常駐省份標簽等。
組合標簽:通過設置特定規則對標簽進行組合加工后生成,如消費者分層標簽等。
時效性
時效性描述標簽隨時間變化的更新頻率,分為動態及靜態標簽。
靜態標簽:一般描述實體的固有特性,一般不隨時間變化而變化,如性別、姓名等標簽。
動態標簽:需要隨時間變化動態更新來保證標簽有效性,如最近7天下單金額等標簽。
負責人
選擇該離線標簽的開發負責人。
技術屬性
標簽更新方式:支持周期更新和手動更新方式。
周期更新:在一定時間的間隔內自動更新標簽。
手動更新:通過手動操作方式更新標簽。具體操作,請參見離線標簽概述。
加工邏輯
參數
描述
數據集
選擇您需加工的離線數據集。
實體ID字段
默認為離線數據集的主鍵,不可修改。
標簽定義
選擇您需定義標簽的指標名稱并填寫對應的標簽名稱和標簽code等信息,支持單個添加和批量添加。
單個添加:單擊添加,填寫相關信息。
指標名稱:選擇所需定義的數據列。
標簽名稱:僅支持中文、英文字母大小寫、數字和下劃線(_),64個字符以內。
標簽code:標簽全局的唯一標識。創建的服務中存在相同名稱的標簽時,可幫助您定位具體標簽。僅支持小寫英文字母、數字、下劃線(_),必須以小寫英文字母開頭,長度不超過64個字符。
標簽碼表:若選擇的來源字段列已經配置碼表,將使用來源數據集中該字段配置的碼表。
說明單擊支持查看碼表詳情,包括碼表名稱、碼表的代碼值和代碼名稱。僅支持展示前50條代碼值。
值類型:無需填寫。系統將根據您的列名稱類型,自動識別值類型。
版本號:僅支持英文字母大小寫、數字、下劃線(_)、短劃線(-)和半角句號(.), 長度不超過64個字符。
標簽描述:填寫標簽的簡單描述,1000個字符以內。
批量添加:
單擊加工邏輯區域的批量添加,在選擇數據集指標對話框的指標列表中選擇一個或多個指標,可在搜索框中根據指標名稱和描述搜索未生成標簽的目標指標。
說明指標列表僅展示未添加至標簽定義列表的數據集指標,并顯示當前指標是否已生成標簽??蛇x中僅查看未生成標簽的指標,并單擊已選進行全選。
指標已生成標簽,代表某個標簽的已提交版本引用了該指標。
單擊確定,已選擇的指標將自動填充至標簽定義列表中。
您可以單擊對應指標操作列的圖標來刪除單個指標,或選中多個指標或全選后再單擊批量刪除進行指標刪除。若所有指標均被刪除,則僅保留一個默認行,默認行中版本號為V1,其他參數為空。
說明標簽定義列表中的指標不可重復。當數據集中指標已被添加到當前標簽定義列表時,則不可被再次選中。
字段自動填充時,指標名稱將被填充至標簽code列,無論標簽code列是否已有值;若指標存在標簽描述,則將其填充至標簽名稱和標簽描述列,此時若標簽名稱和標簽描述列已有值則不進行替換。
單擊提交,即可完成離線標簽的創建。
完成離線標簽創建后若您需正常使用,您還需進行標簽發布。發布后,項目內成員可用該標簽進行二次加工或圈選群組。
在離線標簽列表中單擊目標標簽操作欄圖標發布標簽。
在發布標簽對話框中,選擇已經提交的標簽版本進行發布。
說明發布前,您可單擊查看版本對比,查看各版本的信息與區別。幫助您在發布前進行校驗與確認。
單擊確定,即可完成離線標簽的發布操作。
后續步驟
完成離線標簽創建與發布后,您可將該標簽上架到對應市場進行管理和為后續標簽開發時進行使用。更多信息,請參見標簽上下架。