Nedenfor er et eksempel på et dummy-spredningsdiagram på x, y hvor BLUE (0)
og RED(1)
er” målet “. Den gule prik er mit input, og jeg spørger, hvad der er forudsigelsen om, at dette enten er BLUE (0)
eller RED(1)
Ved at bruge Gaussian Naive Bayes (GaussianNB) får jeg en forudsigelse på 0 med en sandsynlighed på 99,99% (giver mening)
Nu når jeg bruger Bernoulli Naive Bayes (BernoulliNB), får jeg en forudsigelse af RØD (1) med en sandsynlighed på 0,4202. (BTW, multinominal NB er også deaktiveret: 0,57%)
Spørgsmål:
- Hvornår vil man bruge Bernoulli Naive Bayes (værdsat et eksempel) og
- Hvorfor i dette tilfælde er Bernoullis forudsigelse så slukket?
Svar
Bernoulli Naive Bayes er kun til binære funktioner. Tilsvarende behandler multinomiale naive Bayes funktioner som begivenhedssandsynligheder. Dit eksempel er givet for ikke-binære realværdiansatte funktioner $ (x, y) $, som ikke udelukkende ligger i intervallet $ [0,1] $, så modellerne gælder ikke for dine funktioner.
Et typisk eksempel (taget fra wiki-siden) for enten Bernoulli eller multinomial NB er dokumentklassificering, hvor funktionerne repræsenterer tilstedeværelsen af et udtryk (i Bernoulli-tilfælde) eller sandsynligheden for et udtryk (i det multinomiale tilfælde).
Kommentarer
- FYI: Bernoulli Naive Bayes vs. Multinomial Naive Bayes