Nedenfor er et eksempel på et dummy-spredningsdiagram på x, y der BLUE (0)
og RED(1)
er» målet «. Den gule prikken er min innspill og jeg spør hva som er spådommen om at dette enten er BLUE (0)
eller RED(1)
Ved å bruke Gaussian Naive Bayes (GaussianNB) får jeg en prediksjon på 0 med en sannsynlighet på 99,99% (fornuftig)
Nå, når jeg bruker Bernoulli Naive Bayes (BernoulliNB), får jeg en spådom av RØD (1) med en sannsynlighet på 0,4202. (BTW, Multinominal NB er også av: 0,57%)
Spørsmål:
- Når skal man bruke Bernoulli Naive Bayes (setter pris på et eksempel) og
- Hvorfor i dette tilfellet er Bernoullis spådommer ikke så bra?
Svar
Bernoulli Naive Bayes er kun for binære funksjoner. På samme måte behandler multinomiale naive Bayes funksjoner som sannsynlighet for hendelser. Eksemplet ditt er gitt for ikke-binære virkeligverdige funksjoner $ (x, y) $, som ikke utelukkende ligger i intervallet $ [0,1] $, så modellene gjelder ikke funksjonene dine.
Et typisk eksempel (hentet fra wiki-siden) for enten Bernoulli eller multinomial NB er dokumentklassifisering, der funksjonene representerer tilstedeværelsen av et begrep (i Bernoulli-tilfellet) eller sannsynligheten for et begrep (i det multinomiale tilfellet).
Kommentarer
- FYI: Bernoulli Naive Bayes vs. Multinomial Naive Bayes