Di seguito è riportato un esempio di grafico a dispersione fittizio di x, y dove BLUE (0)
e RED(1)
sono il” target “. Il punto giallo è il mio input e sto chiedendo qual è la previsione secondo cui questo è BLUE (0)
o RED(1)
Utilizzando Gaussian Naive Bayes (GaussianNB), ottengo una previsione di 0 con una probabilità del 99,99% (ha senso)
Ora, quando uso Bernoulli Naive Bayes (BernoulliNB), ottengo una previsione di ROSSO (1) con una probabilità di 0,4202. (A proposito, anche il Multinominal NB è spento: 0,57%)
Domande:
- Quando si userà Bernoulli Naive Bayes (apprezzare un esempio) e
- Perché in questo caso la previsione di Bernoulli è così sbagliata?
Risposta
Bernoulli Naive Bayes è solo per caratteristiche binarie. Allo stesso modo, Bayes ingenuo multinomiale tratta le caratteristiche come probabilità di eventi. Il tuo esempio è fornito per le caratteristiche a valore reale non binarie $ (x, y) $, che non si trovano esclusivamente nellintervallo $ [0,1] $, quindi i modelli non si applicano alle tue caratteristiche.
Un tipico esempio (tratto dalla pagina wiki) per NB Bernoulli o multinomiale è la classificazione dei documenti, dove le caratteristiche rappresentano la presenza di un termine (nel caso di Bernoulli) o la probabilità di un termine (in il caso multinomiale).
Commenti
- FYI: Bernoulli Naive Bayes vs. Multinomial Naive Bayes