Bayes optimal klassifikator vs sandsynlighedsforhold

Jeg bliver lidt forvirret af alle de probabilistiske klassifikatorer.

  1. Bayerne optimal klassifikator er angivet som $ max (p (x | C) p (C)) $, og hvis alle klasser har lige tidligere, reduceres det til $ max (p (x | C)) $

  2. Sandsynlighedsforholdet er angivet som $ \ frac {p (x | C1)} {p (x | C2)} $

Hvis jeg kun har 2 klasser med lige forud, hvad er forskellen mellem den optimale klassifikator for bayes og sandsynlighedsforholdet? Vil de ikke begge give mig den samme klasse som output?

Kommentarer

  • De er helt forskellige ting, så kan du afklare, hvad der får dig til at overveje dem " stort set den samme "?
  • Jeg har desværre redigeret mit spørgsmål. Jeg håber, at mit spørgsmål er klarere nu.
  • Det, du beskriver, ser ud til at være en Bayes-klassifikator, ikke en Bayes optimal klassifikator.

Svar

De er ikke de samme, men i dit tilfælde kunne de bruges til det samme formål.

Optimal Bayes-klassificering er

$$ \ DeclareMathOperator * {\ argmax} {arg \, max} \ argmax_ {c \ i C} p (c | X ) $$

dvs. blandt alle hypoteser, tag $ c $, der maksimerer den bageste sandsynlighed. Du bruger Bayes sætning

$$ \ underbrace {p (c | X)} _ {\ text {posterior}} \ propto \ underbrace {p (X | c)} _ {\ text {sandsynlighed} } \ underbrace {p (c)} _ {\ text {prior}} $$

men da der bruges ensartet prior (alle $ c $ er lige sandsynlige, så $ p (c) \ propto 1 $ ) reducerer det til sandsynligheden -funktionen

$$ p (c | X) \ propto p (X | c) $$

Forskellen mellem at maksimere sandsynlighedsfunktionen og sammenligne sandsynlighedsforholdene er, at man med sandsynlighedsforholdet kun sammenligner to sandsynligheder, mens man ved at maksimere sandsynligheden kan overveje flere hypoteser. Så hvis du kun har to hypoteser, vil de stort set gøre det samme . Forestil dig dog, at du havde flere klasser. I så fald ville det være en virkelig ineffektiv vej at sammenligne hver af dem med alle de andre par for par.

Bemærk, at sandsynlighedsforholdet også tjener et andet formål end at finde ud af, hvilken af de to modeller der har større sandsynlighed. Sandsynlighedsforholdet kan bruges til hypotesetest , og det fortæller dig, hvor meget mere (eller mindre) sandsynligt er, at en af modellerne sammenligner med den anden. Desuden kan du gøre det samme, når du sammenligner de bageste fordelinger ved at bruge Bayes-faktor på lignende måde.

Kommentarer

  • Tak! Jeg planlagde at redigere mit spørgsmål for at stille det maksimale sandsynlighedsestimat, da det ligner bayes-klassifikatoren! Tak for at fjerne min tvivl!

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *