數(shù)據(jù)集拆分
更新時(shí)間:
本文介紹了將數(shù)據(jù)集拆分為訓(xùn)練數(shù)據(jù)集和預(yù)測(cè)數(shù)據(jù)集的 API 及示例。
函數(shù)路徑
fascia.data.horizontal.dataframe.train_test_split
函數(shù)定義
def train_test_split(data: HDataFrame,
ratio: float,
random_state: int = None,
shuffle: bool = True) -> (HDataFrame, HDataFrame):
參數(shù)
參數(shù) | 類型 | 描述 |
---|---|---|
data | HDataFrame | 待拆分的聯(lián)邦數(shù)據(jù)集。 |
ratio | Float | 拆分比例,取值范圍為 0~1,可精確到千分之一。 |
random_state | Integer | 隨機(jī)數(shù)種子。若指定,則相同種子的拆分結(jié)果固定。默認(rèn)為 None。 |
shuffle | Bool | 是否重排序。默認(rèn)為 True。 |
示例
from fascia.data.horizontal.dataframe import train_test_split
#對(duì)已有的聯(lián)邦數(shù)據(jù)集進(jìn)行拆分并分別保存
#假設(shè)fed_df是已經(jīng)創(chuàng)建好的聯(lián)邦數(shù)據(jù)集
train_set, test_set = train_test_split(fed_df, 0.7)
save_fed_dataframe(train_set, '$output1')
save_fed_dataframe(test_set, '$output2')
返回值定義
返回內(nèi)容為 2 個(gè)聯(lián)邦表構(gòu)成的元組。
文檔內(nèi)容是否對(duì)您有幫助?