come posso calcolare la varianza di p come derivata da una distribuzione binomiale? Diciamo che lancio n monete e ottengo k teste. Posso stimare p come k / n, ma come posso calcolare la varianza in quella stima?
Mi interessa in modo da poter controllo della varianza nelle mie stime del rapporto quando sto confrontando punti con un numero diverso di prove. Sono più sicuro della stima di p quando n è maggiore, quindi vorrei essere in grado di modellare quanto sia affidabile la stima.
Grazie in anticipo!
esempio:
- 40/100. La MLE di p sarebbe 0.4, ma qual è la varianza in p?
- 4/10. Il MLE sarebbe ancora 0.4, ma la stima è meno affidabile, quindi dovrebbe esserci più varianza in p.
Risposta
Se $ X $ è $ \ text {Binomiale} (n, p) $ allora MLE di $ p $ è $ \ hat {p} = X / n $.
Una variabile binomiale può essere pensata come la somma di $ n $ variabili casuali di Bernoulli. $ X = \ sum_ {i = 1} ^ n Y_i $ dove $ Y_i \ sim \ text {Bernoulli} (p) $.
così possiamo calcolare la varianza del MLE $ \ hat {p} $ come
$$ \ begin {align *} \ text {Var} [\ hat {p} ] & = \ text {Var} \ left [\ dfrac {1} {n} \ sum_ {i = 1} ^ n Y_i \ right] \\ & = \ dfrac {1} {n ^ 2} \ sum_ {i = 1} ^ n Var [Y_i] \\ & = \ dfrac {1 } {n ^ 2} \ sum_ {i = 1} ^ np (1-p) \\ & = \ dfrac {p (1-p)} {n} \ end {align *} $$
Quindi puoi vedere che la varianza del MLE diventa più piccola per $ n $ grandi, ed è anche più piccola per $ p $ vicino a 0 o 1. In termini di $ p $ è massimizzato quando $ p = 0,5 $.
Per alcuni intervalli di confidenza puoi controllare Intervalli di confidenza binomiali
Commenti
- Penso che il link sia simile a quello che ' sto cercando, ma voglio un valore che sia equivalente alla varianza di p. Come posso ottenerlo dallintervallo di confidenza?
- Ho modificato la mia risposta originale per rispondere più da vicino alla tua domanda.
- Come gestisci che la formula della varianza richiede p ma tu hai solo una stima di p?
- Potresti considerare di utilizzare una trasformazione di stabilizzazione della varianza come $ arcsin (\ sqrt {\ hat {p}}) $ e quindi ottieni che la varianza della variabile trasformata è $ \ tfrac {1} {4n} $