Csomagolási osztályozó vs RandomForestClassifier [duplicate]

Ennek a kérdésnek már megvannak a válaszai :

Válasz

Igen, van különbség. A sklearnben, ha döntési fákat csomagol, akkor is minden döntési fán minden funkciót felhasznál. Véletlenszerű erdőkben azonban a funkciók egy részhalmazát használja.

A hivatalos sklearn dokumentáció az összeállítási módszerekről valamivel egyértelműbb lehetett volna a különbség, itt van ez, amit mond:

  1. Ha a mintákat kicseréljük, akkor a módszert Bagging néven ismerjük. Véletlenszerű erdőkben (lásd a RandomForestClassifier és a RandomForestRegressor osztályokat) az együttes minden fája egy mintából épül fel, amelyet a tréningkészletből helyettesítenek (azaz egy bootstrap mintát) . “

Tehát úgy tűnik, nincs különbség, ha döntési fákat csomagolsz, igaz? Kiderült, hogy a dokumentáció a következőket is tartalmazza: / em> max_features. “

Ez tehát még egy módja a véletlenszerűség bevezetésének, azáltal, hogy korlátozza a hasítások jellemzőinek számát. A gyakorlatban hasznos a max_features hangolása a megfelelő illeszkedés érdekében.

Megjegyzések

  • ' nem mindegyik fa , amely megkapja a jelölt tulajdonságainak egy részhalmazát, hanem ' mindegyik felosztás .
  • @Matthew Drury Köszönjük, hogy rámutattál, kijavítottad.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük