Ennek a kérdésnek már megvannak a válaszai :
Válasz
Igen, van különbség. A sklearnben, ha döntési fákat csomagol, akkor is minden döntési fán minden funkciót felhasznál. Véletlenszerű erdőkben azonban a funkciók egy részhalmazát használja.
A hivatalos sklearn dokumentáció az összeállítási módszerekről valamivel egyértelműbb lehetett volna a különbség, itt van ez, amit mond:
- “ Ha a mintákat kicseréljük, akkor a módszert Bagging néven ismerjük. Véletlenszerű erdőkben (lásd a RandomForestClassifier és a RandomForestRegressor osztályokat) az együttes minden fája egy mintából épül fel, amelyet a tréningkészletből helyettesítenek (azaz egy bootstrap mintát) . “
Tehát úgy tűnik, nincs különbség, ha döntési fákat csomagolsz, igaz? Kiderült, hogy a dokumentáció a következőket is tartalmazza: / em> max_features
. “
Ez tehát még egy módja a véletlenszerűség bevezetésének, azáltal, hogy korlátozza a hasítások jellemzőinek számát. A gyakorlatban hasznos a max_features
hangolása a megfelelő illeszkedés érdekében.
Megjegyzések
- ' nem mindegyik fa , amely megkapja a jelölt tulajdonságainak egy részhalmazát, hanem ' mindegyik felosztás .
- @Matthew Drury Köszönjük, hogy rámutattál, kijavítottad.