創(chuàng)建原子指標(biāo)
原子指標(biāo)是對指標(biāo)統(tǒng)計口徑、具體算法的抽象。Dataphin創(chuàng)新性地提出了設(shè)計即開發(fā)的理念,指標(biāo)定義同時也明確了設(shè)計統(tǒng)計口徑(即計算邏輯),提升了研發(fā)效率,并保證了統(tǒng)計結(jié)果的一致性。本文為您介紹如何創(chuàng)建原子指標(biāo)。
操作步驟
在Dataphin首頁,單擊頂部菜單欄研發(fā)。默認進入數(shù)據(jù)開發(fā)頁面。
按照下圖操作指引,進入新建原子指標(biāo)對話框。
在新建原子指標(biāo)對話框,配置參數(shù)。
配置基本信息區(qū)域參數(shù)。
參數(shù)
描述
業(yè)務(wù)實體
選擇業(yè)務(wù)對象或業(yè)務(wù)活動。
主題域
默認選中業(yè)務(wù)對象或業(yè)務(wù)活動所在的主題域。
英文名稱
輸入英文名稱時,Dataphin將根據(jù)輸入數(shù)據(jù)實時匹配數(shù)據(jù)標(biāo)準中已配置的詞根,您可以選擇推薦的詞根作為業(yè)務(wù)實體的英文名稱。更多信息,請參見新建和管理詞根。
英文名稱需要滿足以下命名規(guī)則:
僅支持字母、數(shù)字或下劃線(_)。
不能超過64個字符。
中文名稱
命名規(guī)則如下:
支持任何字符。
不能超過128個字符。
度量單位
選擇原子指標(biāo)的度量單位。包括貨幣單位、時間單位、比例單位、名次、對象量詞、重量單位和其他。
貨幣單位:分(人民幣)、元(人民幣)、萬元(人民幣)、百萬元(人民幣)、千萬元(人民幣)、億元(人民幣)、分(美元)、元(美元)、元(歐元)、元(港幣)。
時間單位:天、月、周、年、小時、分鐘、秒、季度、毫秒。
比例單位:小數(shù)、百分位數(shù)、千分位數(shù)。
名次:排名(名次)。
對象量詞:戶、筆、件、個、次、人日、家、手、張、包。
重量單位:噸、公斤。
其他:其他。
數(shù)據(jù)類型
選擇原子指標(biāo)的數(shù)據(jù)類型。包括string、bigint、double、datetime、timestamp、decimal、文本(varchar、char)、數(shù)值(int、smallint、tinyint、float)、日期時間(date)、其他(boolean、binary)。
描述
填寫對原子指標(biāo)的簡單描述,1000字符以內(nèi)。
配置計算邏輯區(qū)域參數(shù)。
您可以根據(jù)業(yè)務(wù)情況為原子指標(biāo)選擇數(shù)據(jù)時效并配置計算邏輯,數(shù)據(jù)時效包括天、小時和分鐘。
參數(shù)
描述
來源主表
選擇來源表。為保證建模標(biāo)準規(guī)范,來源表僅支持維度邏輯表或事實邏輯表。
統(tǒng)計周期標(biāo)識
統(tǒng)計周期標(biāo)識可指定某一個事件(業(yè)務(wù)過程)的發(fā)生時間字段。僅支持流程事實邏輯表(df表)和維度邏輯表,不支持事件事實邏輯表(di表)(也可以理解為默認為ds分區(qū)字段)。
計算邏輯
編寫定義原子指標(biāo)的計算邏輯。例如
count(distinct order_id)
,其中order_id
為來源邏輯表模型中的字段。說明單擊可應(yīng)用列表中的字段,可將字段添加到計算邏輯編輯器中。
是否可累加
是否可累加是指在相同統(tǒng)計粒度下指標(biāo)(派生指標(biāo))相加是否有業(yè)務(wù)含義或符合業(yè)務(wù)規(guī)則。一般來說,去重計數(shù)的指標(biāo)是不可累加的。
例如,用戶粒度下的成交金額累加是有業(yè)務(wù)含義的,張三的成交金額100,李四的成交金額200,即兩人共成交 300;產(chǎn)品粒度下的購買人數(shù)累加在業(yè)務(wù)上就沒有意義,A品牌手機的購買者100,B品牌手機的購買者50,這個150可能被放大了,因為有人可能同時買了兩種產(chǎn)品,相加就將這個人多算了一次。
配置完成后,單擊保存并提交,提交原子指標(biāo)。
后續(xù)步驟
如果項目的模式為Dev-Prod,則您需要發(fā)布原子指標(biāo)至生產(chǎn)環(huán)境。具體操作,請參見管理發(fā)布任務(wù)。
完成原子指標(biāo)創(chuàng)建后,您可根據(jù)創(chuàng)建的原子指標(biāo)創(chuàng)建所需派生指標(biāo)。具體操作,請參見創(chuàng)建派生指標(biāo)。