本文為您介紹卡方分布擬合組件。
功能說明
卡方分布擬合組件支持對給定數據點進行卡方分布擬合,利用KS檢驗數據是否服從卡方分布,輸出擬合后的概率分布,以及KS檢驗結果、卡方分布自由度。
計算邏輯原理
卡方分布:卡方分布是統(tǒng)計推斷中應用最廣泛的概率分布之一。其定義為:若個獨立的隨機變量
,且均符合標準正態(tài)分布,則這個隨機變量的平方和
為服從自由度為的卡方分布,記為
也可以記為:
卡方分布的期望和方差分別為:
其中,為卡方分布的自由度。
KS檢驗:KS檢驗可以用于檢驗數據是否符合某種分布,其原假設H0:兩個數據分布一致或者數據符合理論分布。進行KS檢驗會返回兩個值D和p值。其中D表示兩個分布之間的最大距離,所以D越小,因為這兩個分布的差距越小,分布也就越一致;p值,也就是假設檢驗里面的p值,p值若小于顯著性水平a,則拒絕原假設;若大于顯著性水平,則接受原假設,p越大,說明兩個分布越一致。從以上分析中看出,一般情況下,D值越小,p值越大。
參數說明
IN端口-輸入參數
參數名 | 參數描述 | 是否必填 | 輸入數據類型 | 數據源類型 |
擬合變量 | 需要做卡方分布擬合的變量。 | 是 | 整數或浮點數 說明 若存在非數值數據,則會拋出異常。 |
|
OUT端口-輸出參數
參數名 | 參數描述 | 輸出數據類型 |
概率分布 | 輸出擬合變量擬合后的概率分布。 | 浮點數 |
其他參數
參數名 | 參數描述 | 是否必填 | 參數默認值 | 參數范圍 |
采樣點數 | 對擬合后的概率密度函數進行采樣。 | 是 | 100 | [10,9999999] |
顯著性水平 | KS檢驗的p值小于顯著性水平(alpha),則不服從卡方分布。 | 是 | 0.05 |
|
擬合評價 | 擬合效果展示,展示的指標分別為:擬合是否服從卡方分布、KS檢驗D值、KS檢驗p值、卡方分布的自由度。 | 否 | 無 | 無 |