原子指標是對指標統計口徑、具體算法的抽象。Dataphin創新性地提出了設計即開發的理念,指標定義同時也明確了設計統計口徑(即計算邏輯),提升了研發效率,并保證了統計結果的一致性。本文為您介紹如何創建原子指標。
操作步驟
在Dataphin首頁,單擊頂部菜單欄研發。默認進入數據開發頁面。
按照下圖操作指引,進入新建原子指標對話框。
在新建原子指標對話框,配置參數。
配置基本信息區域參數。
參數
描述
業務實體
選擇業務對象或業務活動。
主題域
默認選中業務對象或業務活動所在的主題域。
英文名稱
輸入英文名稱時,Dataphin將根據輸入數據實時匹配數據標準中已配置的詞根,您可以選擇推薦的詞根作為業務實體的英文名稱。更多信息,請參見新建和管理詞根。
英文名稱需要滿足以下命名規則:
僅支持字母、數字或下劃線(_)。
不能超過64個字符。
中文名稱
命名規則如下:
支持任何字符。
不能超過128個字符。
度量單位
選擇原子指標的度量單位。包括貨幣單位、時間單位、比例單位、名次、對象量詞、重量單位和其他。
貨幣單位:分(人民幣)、元(人民幣)、萬元(人民幣)、百萬元(人民幣)、千萬元(人民幣)、億元(人民幣)、分(美元)、元(美元)、元(歐元)、元(港幣)。
時間單位:天、月、周、年、小時、分鐘、秒、季度、毫秒。
比例單位:小數、百分位數、千分位數。
名次:排名(名次)。
對象量詞:戶、筆、件、個、次、人日、家、手、張、包。
重量單位:噸、公斤。
其他:其他。
數據類型
選擇原子指標的數據類型。包括string、bigint、double、datetime、timestamp、decimal、文本(varchar、char)、數值(int、smallint、tinyint、float)、日期時間(date)、其他(boolean、binary)。
描述
填寫對原子指標的簡單描述,1000字符以內。
配置計算邏輯區域參數。
您可以根據業務情況為原子指標選擇數據時效并配置計算邏輯,數據時效包括天、小時和分鐘。
參數
描述
來源主表
選擇來源表。為保證建模標準規范,來源表僅支持維度邏輯表或事實邏輯表。
統計周期標識
統計周期標識可指定某一個事件(業務過程)的發生時間字段。僅支持流程事實邏輯表(df表)和維度邏輯表,不支持事件事實邏輯表(di表)(也可以理解為默認為ds分區字段)。
計算邏輯
編寫定義原子指標的計算邏輯。例如
count(distinct order_id)
,其中order_id
為來源邏輯表模型中的字段。說明單擊可應用列表中的字段,可將字段添加到計算邏輯編輯器中。
是否可累加
是否可累加是指在相同統計粒度下指標(派生指標)相加是否有業務含義或符合業務規則。一般來說,去重計數的指標是不可累加的。
例如,用戶粒度下的成交金額累加是有業務含義的,張三的成交金額100,李四的成交金額200,即兩人共成交 300;產品粒度下的購買人數累加在業務上就沒有意義,A品牌手機的購買者100,B品牌手機的購買者50,這個150可能被放大了,因為有人可能同時買了兩種產品,相加就將這個人多算了一次。
配置完成后,單擊保存并提交,提交原子指標。