Säilytysluokittelija vs RandomForestClassifier [kaksoiskappale]

Tähän kysymykseen on jo annettu vastauksia :

Vastaa

Kyllä, siinä on ero. Jos pakkaat päätöksentekopuita sklearnissa, päätät silti käyttää kaikkia ominaisuuksia jokaisessa päätöksentekopuussa. Satunnaisissa metsissä käytät kuitenkin osajoukkoa.

Virallinen sklearn-dokumentaatio kokoonpanomenetelmistä olisi voinut olla hieman selvempi ero, tässä on se mitä sanotaan:

  1. Kun näytteet otetaan korvaavalla tavalla, menetelmä tunnetaan nimellä Bagging
  2. Satunnaisissa metsissä (katso RandomForestClassifier- ja RandomForestRegressor-luokat) jokainen yhdistelmän puu on rakennettu näytteestä, joka on otettu korvaavalla näytteellä (ts. bootstrap-näyte) harjoitussarjasta . ”

Joten näyttää siltä, ettei ole mitään eroa, jos pussitat päätöksentekopuita, eikö? On käynyt ilmi, että dokumentaatiossa todetaan myös:

Lisäksi, kun jokainen solmu jaetaan puun rakentamisen aikana, paras jako löytyy joko kaikista syöttöominaisuuksista tai satunnaisesta osajoukosta max_features. ”

Tämä on siis yksi tapa lisätä satunnaisuutta rajoittamalla jakojen ominaisuuksien määrää. Käytännössä on hyödyllistä virittää max_features, jotta saat hyvän istuvuuden.

Kommentit

  • Se ' ei ole kukin puu , joka vastaanottaa alaryhmän ehdokasominaisuuksia, se ' s kutakin jako .
  • @Matthew Drury Kiitos huomautuksista, korjattu.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *