GMM聚類
本文為您介紹GMM聚類組件。
功能說明
GMM(Gaussian Mixture Model)是一個將事物分解為若干的基于高斯概率密度函數(shù)(正態(tài)分布曲線)形成的模型,混合高斯分布( MoG)由多個混合成分組成,每一個混合成分對應(yīng)一個高斯分布。當(dāng)聚類問題中各個類別的尺寸不同、聚類間有相關(guān)關(guān)系的時候,往往使用混合高斯分布更合適。
計算邏輯原理
高斯混合模型試圖找到多維高斯模型概率分布的混合表示,從而擬合出任意形狀的數(shù)據(jù)分布。
圖:GMM聚類過程
參數(shù)說明
IN端口
參數(shù)名 | 參數(shù)描述 | 是否必填 | 輸入數(shù)據(jù)類型 | 數(shù)據(jù)源類型 |
特征變量 | 配置模型特征變量。 | 是 | 整數(shù)或浮點(diǎn)數(shù) 說明 若存在非數(shù)值數(shù)據(jù),則會拋出異常。 |
|
OUT端口
參數(shù)名 | 參數(shù)描述 | 輸入數(shù)據(jù)類型 |
輸出 | 聚類完成后輸出具體的聚類類別“l(fā)abel”。 | 整型 |
算法參數(shù)
參數(shù)名 | 參數(shù)描述 | 是否必填 | 參數(shù)默認(rèn)值 | 參數(shù)范圍 |
混合成分?jǐn)?shù)量 | 混合高斯模型個數(shù)。 | 是 | 2 | [2,99999999] |
協(xié)方差類型 |
| 是 | 完全協(xié)方差矩陣 |
|
EM 迭代停止閾值 | EM迭代停止閾值,當(dāng)下限平均增益低于此閾值時,EM迭代將停止。 | 是 | 0.001 | [0,99999999] |
協(xié)方差對角非負(fù)正則化 | 協(xié)方差對角非負(fù)正則化,保證協(xié)方差矩陣均為正,非負(fù)正則化添加到協(xié)方差的對角線上。 | 是 | 0.000001 | [0,99999999] |
最大迭代次數(shù) | 要執(zhí)行的EM迭代次數(shù)。 | 是 | 100 | [1,99999999] |
初始化次數(shù) | 要執(zhí)行的初始化次數(shù),用于產(chǎn)生最佳初始參數(shù)。 | 是 | 1 | [1,99999999] |
其他參數(shù)
參數(shù)名 | 參數(shù)描述 |
模型結(jié)果 | 模型結(jié)果展示模型聚類效果以及聚類結(jié)果,其中“CH分?jǐn)?shù)(即Calinski-Harabasz指標(biāo))”和“輪廓系數(shù)”反應(yīng)聚類效果,值越大,說明聚類效果越好。 |