python sklearn模型中random_state參數的意義

????????random_state 相當于隨機數種子random.seed() 。random_state 與 random seed 作用是相同的。

隨機數種子代碼演示:在1-100中取10個隨機數

????????第一段和第二段代碼完全相同,都沒有設置 random seed。它每次取的結果就不同,它的隨機數種子與當前系統(tǒng)時間有關。

????????第三段和第四段代碼設置了相同的 random seed(123),它們取的隨機數就完全相同,多運行幾次也是這樣。

????????第五段和第六段代碼設置了 不同的random seed ,于是運行取隨機數的結果也不同。

????????如果你在需要設置隨機數種子的地方都設置好,那么當別人重新運行你的代碼的時候就能得到完全一樣的結果,復現(xiàn)和你一樣的過程。

random_state參數:

? ? ? ?例如:在sklearn可以隨機分割訓練集和測試集(交叉驗證),只需要在代碼中引入model_selection.train_test_split就可以了:

from sklearn import model_selection

x_train, x_test, y_train,y_test=model_selection.train_test_split(x,y,test_size=0.2,random_state=0)

????????這里的random_state就是為了保證程序每次運行都分割一樣的訓練集和測試集。否則,同樣的算法模型在不同的訓練集和測試集上的效果不一樣。

????????當你用sklearn分割完測試集和訓練集,確定模型和初始參數以后,你會發(fā)現(xiàn)程序每運行一次,都會得到不同的準確率,無法調參。這個時候就是因為沒有加random_state。加上以后就可以調參了。

參考文獻:sklearn中的random_state

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容