本文為您介紹工況識別-訓練組件。
計算邏輯原理
使用聚類、降維等無監(jiān)督學習方法對工業(yè)數(shù)據(jù)進行分析,對不同工況數(shù)據(jù)分別建模。
參數(shù)說明
IN端口-輸入?yún)?shù)
參數(shù)名 | 參數(shù)描述 | 是否必填 | 輸入數(shù)據(jù)類型 | 數(shù)據(jù)源類型 |
特征變量 | 用于建立訓練模型的特征變量。 | 是 | 整數(shù)或浮點數(shù) (說明:若存在非數(shù)值數(shù)據(jù),則會拋出異常) |
|
其他參數(shù)
參數(shù)名 | 參數(shù)描述 | 是否必填 | 參數(shù)默認值 | 參數(shù)范圍 |
識別方式 | 工況識別的方式。智能:算法將根據(jù)數(shù)據(jù)情況自動選擇合適的方法進行工況類別識別;自定義:需要用戶自行選擇具體的降維、聚類等方法進行工況類別識別。 | 是 | 智能 |
|
識別方式:自定義
參數(shù)名 | 參數(shù)描述 | 是否必填 | 參數(shù)默認值 | 參數(shù)范圍 |
是否降維 | 選擇是否對數(shù)據(jù)做降維處理。 | 否 | 是 |
|
聚類方法 | 選擇具體的聚類算法。 | 否 | k均值聚類 |
|
是否降維:是
參數(shù)名 | 參數(shù)描述 | 是否必填 | 參數(shù)默認值 | 參數(shù)范圍 |
降維方法 | 選擇具體的降維算法。 | 否 | 主成分分析 |
|
保留維度 | 降維后的特征維度數(shù)量。默認為0,算法會自動尋找最佳保留維度。需要同時小于等于樣本數(shù)和特征變量個數(shù)。 | 否 | 0 | [0,99999999] |
聚類方法:K均值聚類
參數(shù)名 | 參數(shù)描述 | 是否必填 | 參數(shù)默認值 | 參數(shù)范圍 |
是否批量 | 數(shù)據(jù)量多時可采用批量處理,可以提升處理速度。 | 否 | 否 |
|
是否批量:是
參數(shù)名 | 參數(shù)描述 | 是否必填 | 參數(shù)默認值 | 參數(shù)范圍 |
批量大小 | 批量處理的數(shù)據(jù)量大小。即用來跑Mini Batch KMeans算法的采樣集的大小,默認是100。如果發(fā)現(xiàn)數(shù)據(jù)集的類別較多或者噪音點較多,需要增加這個值以達到較好的聚類效果。 | 否 | 100 | [10,99999999] |
小批量控制 | 根據(jù)不會對平滑慣性產生改進的連續(xù)小批量控制提前停止。即連續(xù)多少個Mini Batch沒有改善聚類效果的話,就停止算法, 和最大迭代次數(shù)一樣是為了控制算法運行時間的。默認是10,一般用默認值就足夠了。 | 否 | 10 | [1,100] |
聚類方法:k均值聚類、均值漂移聚類、高斯混合聚類
參數(shù)名 | 參數(shù)描述 | 是否必填 | 參數(shù)默認值 | 參數(shù)范圍 |
聚類數(shù)下限 | 聚類類別數(shù)量下限。用于尋找最優(yōu)聚類類別數(shù)。 | 否 | 2 | [2,15] |
聚類數(shù)上限 | 聚類類別數(shù)量上限。用于尋找最優(yōu)聚類類別數(shù)。 | 否 | 5 | [2,15] |
聚類方法:k均值聚類、高斯混合聚類
參數(shù)名 | 參數(shù)描述 | 是否必填 | 參數(shù)默認值 | 參數(shù)范圍 |
最大迭代次數(shù) | 單次運行的聚類算法的最大迭代次數(shù)。 | 否 | 300 | [10,1000] |
聚類方法:均值漂移聚類
參數(shù)名 | 參數(shù)描述 | 是否必填 | 參數(shù)默認值 | 參數(shù)范圍 |
算法加速 | 指定最少的種子數(shù)目。為了加速算法,只接受那些至少有min_bin_freq 點的 bin 作為種子。 | 否 | 1 | [1,100] |
輸出參數(shù)
參數(shù)名 | 參數(shù)描述 |
模型結果 | 查看模型結果或發(fā)布模型。展示的結果包括工況數(shù)以及工況識別效果。其中“CH分數(shù)(即Calinski-Harabasz指標)”和“輪廓系數(shù)”反映工況識別效果,值越大,說明識別效果越好,輪廓系數(shù)取值范圍為[-1,1]。 |