Esempi di vita reale di distribuzioni comuni

Sono uno studente laureato che sviluppa un interesse per le statistiche. Mi piace soprattutto il materiale, ma a volte ho difficoltà a pensare alle applicazioni nella vita reale. In particolare, la mia domanda riguarda le distribuzioni statistiche comunemente usate (normale – beta-gamma ecc.). Immagino che per alcuni casi ottengo le proprietà particolari che rendono la distribuzione abbastanza carina, ad esempio proprietà senza memoria di esponenziale. Ma per molti altri casi, non ho unintuizione sia sullimportanza che sullarea di applicazione delle distribuzioni comuni che vediamo nei libri di testo.

Probabilmente ci sono molte buone fonti che affrontano le mie preoccupazioni, io Sarei felice se potessi condividerli. Sarei molto più motivato nel materiale se potessi associarlo a esempi di vita reale.

Commenti

Risposta

Wikipedia ha una pagina che elenca molte distribuzioni di probabilità con collegamenti a maggiori dettagli su ciascuna distribuzione. Puoi guardare lelenco e seguire i collegamenti per avere unidea migliore dei tipi o f applicazioni per le quali vengono comunemente utilizzate le diverse distribuzioni.

Ricorda solo che queste distribuzioni sono usate per modellare la realtà e come ha detto Box: “tutti i modelli sono sbagliati, alcuni sono utili”.

Ecco alcune delle distribuzioni comuni e alcuni dei motivi per cui sono utili:

Normale: questo è utile per osservare le medie e altre combinazioni lineari (ad es. coefficienti di regressione) a causa del CLT. In relazione a ciò, se si sa che qualcosa si verifica a causa di effetti additivi di molte piccole cause diverse, il normale può essere una distribuzione ragionevole: ad esempio, molte misure biologiche sono il risultato di più geni e più fattori ambientali e quindi sono spesso approssimativamente normali .

Gamma: Distorta a destra e utile per cose con un minimo naturale a 0. Comunemente utilizzata per i tempi trascorsi e alcune variabili finanziarie.

Esponenziale: caso speciale del Gamma. È senza memoria e si ridimensiona facilmente.

Chi quadrato ($ \ chi ^ 2 $): caso speciale del Gamma. Nasce come somma di variabili normali al quadrato (così utilizzato per le varianze).

Beta: definito tra 0 e 1 (ma potrebbe essere trasformato per essere tra altri valori), utile per proporzioni o altre quantità che devono essere comprese tra 0 e 1.

Binomiale: quanti “successi” su un dato numero di prove indipendenti con la stessa probabilità di “successo”.

Poisson: comune per i conteggi. Belle proprietà che se il numero di eventi in un periodo di tempo o area segue un Poisson, allora il numero nel doppio del tempo o dellarea segue ancora il Poisson (con il doppio della media): questo funziona per laggiunta di Poissons o il ridimensionamento con valori diversi da 2.

Tieni presente che se gli eventi si verificano nel tempo e il tempo tra le occorrenze segue un esponenziale, il numero che si verificano in un periodo di tempo segue un Poisson.

Binomiale negativo: conta con il minimo 0 (o altro valore a seconda della versione) e nessun limite superiore. Concettualmente è il numero di “fallimenti” prima di k “successi”. Il binomio negativo è anche una miscela di variabili di Poisson le cui medie provengono da una distribuzione gamma.

Geometrico: caso speciale per binomiale negativo dove è il numero di “fallimenti” prima del primo “successo”. Se tronchi (arrotondando per difetto) una variabile esponenziale per renderla discreta, il risultato è geometrico.

Commenti

  • Bene, grazie per la tua risposta. Tuttavia, wikipedia fornisce una descrizione più generale che ‘ mi piace. Fondamentalmente, la mia domanda è perché alcune distribuzioni sono belle? Per dare una possibile risposta in caso di distribuzione normale, può essere correlato al teorema centrale limitato – che dice che se campionate una quantità infinita di osservazioni potete effettivamente vedere in asympotics che una statistica sufficiente di quelle osservazioni, data lindipendenza, ha una distribuzione normale . Sto cercando altri esempi del genere ..
  • Non esattamente una distribuzione reale, ma per quanto riguarda bimodale? Non riesco ‘ a pensare a nessun esempio di vita reale comunemente visto dopo aver scoperto che le molte differenze di genere nelluomo non sono bimodali.
  • Aggiungi multinomiale

Risposta

Acquista e leggi almeno i primi 6 capitoli (prime 218 pagine) di William J. Feller ” Introduzione alla teoria della probabilità e alle sue applicazioni, volume 2 “ http://www.amazon.com/dp/0471257095/ref=rdr_ext_tmb .Almeno leggi tutti i problemi per la soluzione e preferibilmente prova a risolverne il maggior numero possibile. Non è necessario che tu abbia letto il Vol 1, che a mio parere non è particolarmente meritorio.

Nonostante lautore sia morto 45 anni e mezzo fa, prima ancora che il libro fosse finito, questo è semplicemente il il libro più bello che ci sia, escluso nessuno, per sviluppare unintuizione nella probabilità e nei processi stocastici, e comprendere e sviluppare una sensazione per le varie distribuzioni, come si relazionano ai fenomeni del mondo reale e vari fenomeni stocastici che possono e si verificano. E con il solido base che costruirai da esso, sarai ben servito nelle statistiche.

Se riesci a superare i capitoli successivi, cosa che diventa un po più difficile, sarai anni luce avanti a quasi tutti. In poche parole, se conosci Feller Vol 2, conosci la probabilità (e i processi stocastici); il che significa che, tutto ciò che non sai, come i nuovi sviluppi, sarai in grado di apprendere e padroneggiare rapidamente costruendo su quelle solide fondamenta.

Quasi tutto ciò che è stato menzionato in precedenza in questo thread è in Feller Vol 2 (non tutto il materiale in Kendall Advanced Theory of Statistics, ma leggere quel libro sarà un gioco da ragazzi dopo Feller Vol 2), e molto altro ancora, tutto in un modo che dovrebbe sviluppare il tuo pensiero stocastico e intuizione. Johnson e Kotz è utile per le minuzie su varie distribuzioni di probabilità, Feller Vol 2 è utile per imparare a pensare in modo probabilistico e sapere cosa estrarre da Johnson e Kotz e come usarlo.

Risposta

La teoria asintotica porta alla distribuzione normale, ai tipi di valori estremi, alle leggi stabili e al Poisson. Lesponenziale e il Weibull tendono a presentarsi come tempo parametrico per le distribuzioni degli eventi. Nel caso del Weibull è un tipo di valore estremo per il minimo di un campione. Relativamente ai modelli parametrici per le osservazioni distribuite normalmente, le distribuzioni chi quadrato, t e F derivano dal test di ipotesi e dalla stima dellintervallo di confidenza. Il chi quadrato compare anche nellanalisi della tabella di contingenza e nei test di bontà dei fit. Per studiare la potenza dei test abbiamo le distribuzioni t e F non centrali. La distribuzione ipergeometrica si verifica nel test esatto di Fisher per le tabelle di contingenza. La distribuzione binomiale è importante quando si fanno esperimenti per stimare le proporzioni. Il binomio negativo è una distribuzione importante per modellare la sovradispersione in un processo puntuale. Questo dovrebbe darti un buon inizio pratico distribuzioni parametriche. Per le variabili casuali non negative su (0, ∞) la distribuzione Gamma è flessibile per fornire una varietà di forme e anche la normale logaritmica è comunemente usata. In [0,1] la famiglia beta fornisce distirbuzioni simmetriche inclusa luniforme come distribuzioni inclinate a sinistra o inclinate a destra.

Dovrei anche menzionare che se vuoi conoscere tutti i dettagli nitidi sulle distribuzioni nelle statistiche ci sono le serie classiche di libri di Johnson e Kotz che includono distribuzioni discrete, distribuzioni univariate continue e distribuzioni multivariate continue e anche il volume 1 della Teoria avanzata della statistica di Kendall e Stuart.

Commenti

  • Grazie mille per la risposta, è estremamente utile. Grazie ancora, mi ha davvero aiutato.

Risposta

Solo per aggiungere alle altre eccellenti risposte.

La distribuzione di Poisson è utile ogni volta che abbiamo variabili di conteggio, come altri hanno menzionato. Ma molto di più dovrebbe essere detto! Il poisson nasce asintoticamente da una variabile distribuita in modo binomiale, quando $ n $ (il numero di esperimenti di Bernoulli) aumenta senza limiti, e $ p $ (la probabilità di successo di ogni singolo esperimento () va a zero, in modo tale che $ \ lambda = np $ rimane costante, limitato da zero e infinito. Questo ci dice che è utile ogni volta che abbiamo un gran numero di eventi individualmente molto improbabili. Alcuni buoni esempi sono: incidenti, come il numero di incidenti automobilistici a New York in al giorno, poiché ogni volta che due auto passano / si incontrano cè una probabilità molto bassa di incidente, e il numero di tali opportunità è davvero astronomico! Ora tu stesso puoi pensare ad altri esempi, come il numero totale di incidenti aerei nel mondo in un anno. Il classico esempio in cui il numero di morti per colpi di cavallo nella cavalleria preussiana!

Quando il Poisson viene utilizzato in epidemiologia, per modellare il numero di casi di qualche malattia, spesso si trova che non si adatta bene: anche la varianza grande! Il Poisson ha varianza = media, che può essere facilmente visto dal limite del binomio: nel binomio la varianza è $ np (1-p) $, e quando $ p $ va a zero necessariamente $ 1-p $ va a uno, quindi la varianza va a $ np $, che è laspettativa, e entrambi vanno a $ \ lambda $.Un modo è cercare unalternativa al Poisson con varianza maggiore, non condizionata a eguagliare la media, come il binomio negativo. ¿Ma perché si verifica questo fenomeno di varianza maggiore? Una possibilità è che le probabilità individuali di malattia $ p $ per una persona non siano costanti, e nemmeno dipenda da qualche covariata osservata (ad esempio età, occupazione, abitudine al fumo, …) .Questa è chiamata eterogeneità non osservata e talvolta modelli utilizzati perché è chiamato modelli di fragilità, o modelli misti. Un modo per farlo è assumere che i $ p $ “s nella popolazione provengano da una qualche distribuzione, e supponendo che sia una distribuzione gamma, per esempio (il che rende la matematica più semplice …), otteniamo la distribuzione gamma-poisson – – che recupera il binomio negativo!

Risposta

Ricerca pubblicata di recente suggerisce che le prestazioni umane NON sono distribuite normalmente, contrariamente al pensiero comune. Sono stati analizzati i dati di quattro campi: (1) Accademici in 50 discipline, in base alla frequenza di pubblicazione nelle riviste più eminenti di disciplina specifica. (2 ) Intrattenitori, come attori, musicisti e scrittori, e il numero di prestigiosi premi, nomination o riconoscimenti ricevuti. (3) Politici in 10 nazioni e risultati di elezioni / rielezioni. (4) Atleti universitari e professionisti che guardano ai più individualizzati misure disponibili, come il numero di fuoricampo, le ricezioni negli sport di squadra e le vittorie totali nei singoli porti. Lautore scrive: “Abbiamo visto una distribuzione chiara e coerente della legge di potenza svolgersi in ogni studio, indipendentemente da quanto in modo restrittivo o ampio abbiamo analizzato i dati …”

Commenti

  • Chi ha suggerito che le prestazioni umane siano normalmente distribuite ?! Il principio 80-20 è stato suggerito da Pareto (1906!).

Risposta

La distribuzione di Cauchy è spesso usata in finanza per modellare i rendimenti degli asset. Degni di nota sono anche le distribuzioni Bounded e Unbounded di Johnson per la loro flessibilità (le ho applicate nella modellazione dei prezzi degli asset, nella generazione di elettricità e nellidrologia).

Risposta

Alcune distribuzioni di probabilità comuni

Alcune distribuzioni di probabilità comuni; Da qui

Distribuzione uniforme (discreta) – Hai tirato 1 dado e la probabilità di cadere tra 1, 2, 3, 4, 5 e 6 è uguale.

Uniforme discreta (da qui )

Distribuzione uniforme (continua) – Hai spruzzato polvere finissima verso un muro. Per una piccola area sul muro, le possibilità di far cadere la polvere in un punto del muro sono uniformi.

Hai una grande bombola di gas. Per ogni unità di superficie, il numero di molecole di gas che colpiscono per cm quadrato sulla parete interna al secondo sembra essere uniforme.

immagine Wikipedia di collisione di gas da qui

Distribuzione di Bernoulli – La prova di Bernoulli è (o prova binomiale) è un esperimento casuale con esattamente due possibili risultati, ” successo ” e ” errore “. In tale prova, la probabilità di successo è p, la probabilità di fallimento è q = 1-p.

Ad esempio, in un lancio di una moneta, possiamo avere 2 risultati: testa o coda. Per una moneta equa, la probabilità di testa è 1/2; la probabilità di coda è 1/2 è un tipo di distribuzione di Bernoulli che è anche uniforme.

In un lancio di una moneta se la moneta è ingiusta come la probabilità di ottenere la testa è 0,9, la probabilità di cadere una coda sarà 0,1.

Bernauli Bernauli Distribuzione con probabilità 0.6 e 0.4; da qui

Distribuzione binomiale – Se una prova di Bernoulli (con 2 esiti, rispettivamente con probabilità p e q = 1-p) viene eseguita per n volte; (come se una moneta fosse lanciata per n volte); ci sarà una piccola probabilità di ottenere tutte le teste e una piccola probabilità di ottenere tutte le code. Un certo valore di testa e un certo valore di coda sarebbero massimi. Questa distribuzione è stata chiamata distribuzione binomiale.

BINOMIAL Distribuzione binomiale con scacchiera.immagine modificata da WP

distribuzione di Poisson esempio da Wikipedia: un individuo che tiene traccia della quantità di posta che riceve ogni giorno potrebbe notare che riceve in media 4 lettere al giorno. Se i messaggi provengono da una fonte indipendente , quindi il numero di pezzi di posta ricevuti in un giorno obbedisce a una distribuzione di Poisson. cioè ci sarà una possibilità trascurabile di ricevere zero o 100 messaggi al giorno ma un massimo di un certo numero (qui 4) messaggi al giorno.

Allo stesso modo, supponiamo che in un prato immaginario e otteniamo circa 10 ciottoli in 1 km ^ 2. Con unarea proporzionalmente maggiore otteniamo proporzionalmente più ciottoli.Ma per un certo campione di 1 km ^ 2 è molto improbabile ottenere 0 o 100 ciottoli. probabilmente segue una distribuzione di Poisson.

Secondo Wikipedia, il numero di eventi di decadimento al secondo da una sorgente radioattiva, segue una distribuzione di Poisson.

Poisson Distribuzione di Poisson da Wikipedia

Distribuzione normale o Distribuzione gaussiana – se n numero di matrici rotolate simultaneamente, e dato che n è molto grande; la somma dei risultati di ogni stampo tenderebbe a raggrupparsi attorno a un valore centrale. Non troppo grande, non troppo piccolo. Questa distribuzione viene chiamata distribuzione normale o curva a campana.

triangolare Somma di 2 matrici, da qui

CLT
Con laumento del numero di matrici simultanee, la distribuzione si avvicina al gaussiano. Dal teorema del limite centrale

Allo stesso modo, se n numero di monete lanciate simultaneamente en è molto grande, ci sarebbe una piccola possibilità che arriverà a molte teste o troppe code. Il numero di teste si incentrerà su un certo valore. È simile alla distribuzione binomiale ma il numero di monete è ancora più grande.

Commenti

  • Per favore, menziona se cè qualche malinteso nel mio sforzo di cui sopra perché Ho paura della complessità delle statistiche.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *