Abaixo está um exemplo de um gráfico de dispersão fictício de x, y onde BLUE (0)
e RED(1)
são o” alvo “. O ponto amarelo é minha entrada e estou perguntando qual é a previsão de que seja BLUE (0)
ou RED(1)
Usando Gaussian Naive Bayes (GaussianNB), obtenho uma previsão de 0 com uma probabilidade de 99,99% (faz sentido)
Agora, quando eu uso Bernoulli Naive Bayes (BernoulliNB), obtenho uma previsão de VERMELHO (1) com uma probabilidade de 0,4202. (BTW, NB Multinominal também está desativado: 0,57%)
Perguntas:
- Quando se usará Bernoulli Naive Bayes (aprecie um exemplo) e
- Por que, neste caso, a previsão de Bernoulli está tão errada?
Resposta
Bernoulli Naive Bayes é apenas para recursos binários. Da mesma forma, Bayes ingênuo multinomial trata os recursos como probabilidades de evento. Seu exemplo é dado para recursos de valor real não binários $ (x, y) $, que não se encontram exclusivamente no intervalo $ [0,1] $, portanto, os modelos não se aplicam aos seus recursos.
Um exemplo típico (retirado da página wiki) para Bernoulli ou NB multinomial é a classificação de documentos, onde os recursos representam a presença de um termo (no caso de Bernoulli) ou a probabilidade de um termo (em caso multinomial).
Comentários
- FYI: Bernoulli Naive Bayes vs. Multinomial Naive Bayes