邏輯回歸
本文為您介紹邏輯回歸組件。
功能說明
邏輯回歸(LogisticRegression)是一種用于解決二分類(0 or 1)問題的模型,用于估計某種事物的可能性。盡管名字是邏輯回歸,但它是一種用于分類而不是回歸的線性模型。Logistic 回歸在文獻中也稱為 logit 回歸、最大熵分類 (MaxEnt) 或?qū)?shù)線性分類器。在該模型中,描述單個試驗可能結(jié)果的概率使用邏輯函數(shù)建模 。
計算邏輯原理
邏輯回歸的思路是,先擬合決策邊界(不局限于線性,還可以是多項式),再建立這個邊界與分類的概率聯(lián)系,從而得到了二分類情況下的概率。本質(zhì)是假設(shè)數(shù)據(jù)服從這個分布,然后使用極大似然估計做參數(shù)的估計。
參數(shù)說明
IN端口
參數(shù)名 | 參數(shù)描述 | 是否必填 | 輸入數(shù)據(jù)類型 | 數(shù)據(jù)源類型 |
特征變量 | 配置模型特征列 | 是 | 整數(shù)或浮點數(shù) 說明 若存在非數(shù)值數(shù)據(jù),則會拋出異常。 |
|
目標(biāo)變量 | 配置模型目標(biāo)列 | 是 | 整數(shù)或浮點數(shù)或字符 |
|
模型端口
參數(shù)名 | 參數(shù)描述 | 輸出參數(shù) | 輸出數(shù)據(jù)類型 |
模型 | 輸出算法訓(xùn)練后模型存儲的地址。 | 模型地址 | 字符 |
算法參數(shù)
參數(shù)名 | 參數(shù)描述 | 是否必填 | 參數(shù)默認(rèn)值 | 參數(shù)范圍 |
懲罰類型 | 用于指定懲罰中使用的規(guī)范 | 否 | L2 |
|
正則強度的倒數(shù) | 必須為正浮點數(shù),與支持向量機一樣,較小的值指定更強的正則化 | 否 | 1.0 | [0, 99999999] |
是否使用截距 | 指定是否應(yīng)將常量(aka偏置或截距)添加到?jīng)Q策函數(shù) | 否 | 是 |
|
分類權(quán)重 | 用于表示分類模型中各種類型的權(quán)重 | 否 | None | 可以是一個字典或者’balanced’字符串,默認(rèn)為不輸入,也就是不考慮權(quán)重,即為None |
求解器 | 用于優(yōu)化問題的算法 | 否 | lbfgs |
|
最大迭代次數(shù) | 求解程序收斂所需的最大迭代次數(shù) | 否 | 100 | [1, 10000] |
分類方式 |
| 否 | 自動 |
|
測試集比例 | 測試模型的數(shù)據(jù)占總輸入數(shù)據(jù)的比例,用于計算模型的評價指標(biāo)。 | 是 | 0.2 | [0,1] |
測試集生成方式 | 根據(jù)選定方式,選取部分?jǐn)?shù)據(jù)作為測試集,剩余部分作為訓(xùn)練集。
| 是 | 隨機 |
|
其他參數(shù)
參數(shù)名 | 參數(shù)描述 |
模型結(jié)果 | 可以查看建模成功后的模型評價結(jié)果和發(fā)布模型。 |