예, 차이가 있습니다. sklearn에서 의사 결정 트리를 백화하면 여전히 각 의사 결정 트리에서 모든 기능을 사용하게됩니다. 그러나 랜덤 포레스트에서는 일부 기능을 사용합니다.
공식 sklearn 문서의 앙상블 링 방법 이 좀 더 명확 할 수 있습니다. 차이점은 다음과 같습니다.
- “ 대체로 샘플을 그릴 때이 방법은 Bagging이라고합니다. “
- ” 랜덤 포레스트 (RandomForestClassifier 및 RandomForestRegressor 클래스 참조)에서 앙상블의 각 트리는 학습 세트에서 대체로 추출한 샘플 (예 : 부트 스트랩 샘플)로 구축됩니다 . “
그래서 의사 결정 나무를 집어 넣어도 차이가없는 것 같죠? 문서에는 다음과 같은 내용도 나와 있습니다.
“ 게다가 트리를 구성하는 동안 각 노드를 분할 할 때 모든 입력 기능 또는 크기의 임의 하위 집합에서 최상의 분할을 찾습니다. max_features
. “
이는 분할에서 기능 수를 제한하여 임의성을 도입하는 또 다른 방법입니다. 실제로는 잘 맞도록 max_features
를 조정하는 것이 유용합니다.
댓글