Nedan följer ett exempel på en dummy-spridningsdiagram på x, y där BLUE (0)
och RED(1)
är” målet ”. Den gula punkten är min inmatning och jag frågar vad som är förutsägelsen att detta antingen är BLUE (0)
eller RED(1)
Genom att använda Gaussian Naive Bayes (GaussianNB) får jag en förutsägelse av 0 med en sannolikhet på 99,99% (vettigt)
Nu när jag använder Bernoulli Naive Bayes (BernoulliNB) får jag en förutsägelse av RÖD (1) med en sannolikhet på 0,4202. (BTW, Multinominal NB är också av: 0,57%)
Frågor:
- När ska man använda Bernoulli Naive Bayes (uppskatta ett exempel) och
- Varför i det här fallet är Bernoullis förutsägelse så avstängd?
Svar
Bernoulli Naive Bayes är endast för binära funktioner. På samma sätt behandlar multinomialaiva Bayes funktioner som händelsesannolikheter. Ditt exempel ges för icke-binära verkliga värden $ (x, y) $, som inte exklusivt ligger i intervallet $ [0,1] $, så modellerna gäller inte för dina funktioner.
Ett typiskt exempel (hämtat från wikisidan) för antingen Bernoulli eller multinomial NB är dokumentklassificering, där funktionerna representerar närvaron av en term (i Bernoulli-fallet) eller sannolikheten för en term (i det multinomiala fallet).
Kommentarer
- FYI: Bernoulli Naive Bayes vs. Multinomial Naive Bayes