Calcolare la deviazione standard dalla dimensione del campione, dalla media e dallintervallo di confidenza?

Mi chiedo se posso calcolare a ritroso la deviazione standard dalla media, dalla dimensione del campione e dallintervallo di confidenza.

Ad esempio: mean age = 40,2; dimensione del campione = 427; e intervallo di confidenza del 95% = (38,9-41,5)

E se è così, può essere applicato alla misura percentuale, ad esempio: percentuale di uomini = 64,2%; dimensione del campione = 427; e intervallo di confidenza al 95% = (59,4-68,7).

Commenti

  • Se stai assumendo una distribuzione normale, la formula per gli endpoint del lintervallo di confidenza è strettamente una funzione della deviazione standard del campione. Vengono fornite la media delle altre variabili e la dimensione del campione. Non ' non so cosa intendi per " misura percentuale ". Quindi non posso ' aiutarti in questo.
  • Per misura in percentuale intendo semplicemente che il 64,2% del campione è maschio.

Risposta

  • La deviazione standard per percentuale / proporzione è:
    \ begin {align} \ sigma & = \ sqrt {p (1-p)} \\ [5pt] & = \ sqrt {0.642 (1-0.642)} \\ [5pt] & = 0.4792 \ end {align} Quindi, quando viene fornita una percentuale, puoi trovare direttamente lo std deviazione.

  • Per monitoraggio a ritroso , sappiamo, $ CI = p \ pm z \ frac {\ sigma} {\ sqrt {N}} $

    Per il 95%, $ z = 1,96 $ , N = 427, $ p = 0,642 $

    $ \ sigma =? $

Quindi usa la formula sopra e sostituisci.

  • Se il tuo la dimensione del campione è inferiore a 30 (N < 30) , devi utilizzare un valore t invece del valore Z ( calcolatore del valore t ). Il valore t ha gradi di libertà $ df = N-1 $ e $ {\ rm prob} = (1- \ alpha) / 2 $ .

Quindi la formula è: $ CI = p \ pm t _ {(N-1) } \ frac {\ sigma} {\ sqrt {N}} $

Commenti

  • Questo metodo utilizza il teorema del limite centrale e quindi è accurato solo nel limite di $ N $ grandi.
  • Hai ragione, ho dato la formula poiché la domanda aveva una dimensione del campione grande > 30. Quindi il CLT è già in vigore. Per dimensioni del campione più piccole possiamo usare la distribuzione T invece della distribuzione Z con un adeguato grado di libertà.
  • $ \ sigma = \ sqrt (p ∗ (1 − p)) $ è applicabile alla distribuzione di Bernoulli solo, non applicabile ad altre distribuzioni.

Risposta

Un po tardi per la festa, ma ho notato che la seconda parte della domanda non è stata completamente affrontata: “può essere applicata alla misura percentuale”?

A seguito del commento dei PO, presumo che per “misura percentuale” ci riferiamo a qualche risultato binario ( Maschio / Femmina, Destro / Mancino ecc.).

In questo caso le variabili sono descritte da una distribuzione di probabilità discreta, mentre letà è una variabile continua ed è descritta da una distribuzione di probabilità continua. Una scelta comune per la distribuzione delle variabili binarie è la distribuzione binomiale. Gli intervalli di confidenza per il binomio possono essere costruiti in diversi modi ( wiki ). Lo studio originale avrebbe dovuto descrivere come sono derivati quegli intervalli di confidenza.

Tieni presente che puoi ancora utilizzare la formula fornita da user3808268 per ottenere la “deviazione standard”, ma sarebbe difficile interpretarlo in modo significativo.

Risposta

Dalla descrizione che hai fornito, la tua prima domanda riguarda la distribuzione delletà delle persone. Normale (cioè gaussiana ) si applica a questo tipo di applicazioni.

Sarà utile sapere come è stato calcolato lintervallo di confidenza (CI), perché ci sono molti modi possibili in cui è stato calcolato CI. Ad esempio, se la distribuzione è di distribuzione normale e la CI è stata calcolata utilizzando t-test, quindi la SD può essere stimata con la seguente equazione:

SD = sqrt (n) * (ci_upper – ci_lower) / (2 * tinv ((1-CL) / 2; n-1)),

dove CL è il livello di confidenza, ci_upper e ci_lower sono rispettivamente i limiti superiore e inferiore di CI e “tinv () “è linverso di Student” s cdf.

Altrimenti, se è di distribuzione normale, ma è stata utilizzata una SD nota nel calcolo CI, allora la SD può essere calcolata con la seguente equazione:

SD = sqrt (n) * (ci_upper – ci_lower) / (sqrt (8) * erfinv (CL)),

wh ere “erfinv ()” è la funzione di errore inverso.

La tua seconda domanda riguarda la distribuzione del sesso delle persone (es.maschio o femmina). Dai dati che hai fornito, sembra che ci siano k = 274 maschi tra n = 427 di campioni interi. La distribuzione di Bernoulli si applica a questa applicazione. In questo caso, la varianza (della popolazione maschile) = p * (1-p) = 0,2299 e SD = sqrt (0,2299) = 0,4795, dove p è il valore medio. Tieni presente che " valiance = mean * (1-mean) " è applicabile solo alla distribuzione di Bernoulli.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *