Vastaa
Kyllä, siinä on ero. Jos pakkaat päätöksentekopuita sklearnissa, päätät silti käyttää kaikkia ominaisuuksia jokaisessa päätöksentekopuussa. Satunnaisissa metsissä käytät kuitenkin osajoukkoa.
Virallinen sklearn-dokumentaatio kokoonpanomenetelmistä olisi voinut olla hieman selvempi ero, tässä on se mitä sanotaan:
- ” Kun näytteet otetaan korvaavalla tavalla, menetelmä tunnetaan nimellä Bagging ”
- ” Satunnaisissa metsissä (katso RandomForestClassifier- ja RandomForestRegressor-luokat) jokainen yhdistelmän puu on rakennettu näytteestä, joka on otettu korvaavalla näytteellä (ts. bootstrap-näyte) harjoitussarjasta . ”
Joten näyttää siltä, ettei ole mitään eroa, jos pussitat päätöksentekopuita, eikö? On käynyt ilmi, että dokumentaatiossa todetaan myös:
” Lisäksi, kun jokainen solmu jaetaan puun rakentamisen aikana, paras jako löytyy joko kaikista syöttöominaisuuksista tai satunnaisesta osajoukosta max_features
. ”
Tämä on siis yksi tapa lisätä satunnaisuutta rajoittamalla jakojen ominaisuuksien määrää. Käytännössä on hyödyllistä virittää max_features
, jotta saat hyvän istuvuuden.
Kommentit
- Se ' ei ole kukin puu , joka vastaanottaa alaryhmän ehdokasominaisuuksia, se ' s kutakin jako .
- @Matthew Drury Kiitos huomautuksista, korjattu.