Tosielämän esimerkkejä yleisistä jakautumisista

Olen grad-opiskelija, joka kiinnostaa kiinnostusta tilastoihin. Pidän materiaalista kaiken kaikkiaan, mutta minulla on joskus vaikea ajatella sovelluksia tosielämässä. Kysymykseni koskee erityisesti yleisesti käytettyjä tilastollisia jakaumia (normaali – beeta-gamma jne.). Luulen joissakin tapauksissa saan tietyt ominaisuudet, jotka tekevät jakelusta melko mukavan – esimerkiksi eksponentiaalisen muistittoman ominaisuuden. Mutta monissa muissa tapauksissa minulla ei ole intuitiota oppikirjoissa havaittujen yleisten jakelujen tärkeydestä ja soveltamisalueista.

Huolissani on todennäköisesti paljon hyviä lähteitä. olisi iloinen, jos voisit jakaa ne. Olisin paljon motivoituneempi materiaaliin, jos voisin liittää sen todellisiin esimerkkeihin.

Kommentit

Vastaus

Wikipediassa on sivu, jossa luetellaan monia todennäköisyysjakaumia linkeillä, joissa on tarkempia tietoja jokaisesta jakelusta. Voit selata luetteloa ja seurata linkkejä saadaksesi paremman tuntuman tyyppeistä o f sovelluksia, joihin eri jakeluja käytetään yleisesti.

Muista vain, että näitä jakeluja käytetään mallinnamaan todellisuutta ja kuten Box sanoi: ”kaikki mallit ovat vääriä, jotkut mallit ovat hyödyllisiä”.

Tässä on joitain yleisiä jakaumia ja joitain syitä niiden hyödyllisyyteen:

Normaali: Tästä on hyötyä keskiarvojen ja muiden lineaaristen yhdistelmien (esim. regressiokertoimet) CLT: n takia. Tähän liittyy, jos jotain tiedetään syntyvän useiden pienten syiden additiivisten vaikutusten vuoksi, normaali voi olla kohtuullinen jakauma: esimerkiksi monet biologiset toimenpiteet ovat seurausta useista geeneistä ja monista ympäristötekijöistä, ja siksi ne ovat usein likimäärin normaaleja .

Gamma: Oikea vinossa ja hyödyllinen asioille, joiden luonnollinen minimi on 0. Yleisesti käytetty kuluneisiin aikoihin ja joihinkin taloudellisiin muuttujiin.

Eksponentiaalinen: gamman erityistapaus. Se on muistiton ja skaalautuu helposti.

Chi-neliö ($ \ chi ^ 2 $): gamman erityistapaus. Nousee neliömäisten normaalimuuttujien summana (jota käytetään variansseihin).

Beeta: Määritetty välillä 0 ja 1 (mutta voidaan muuntaa muiden arvojen väliin), hyödyllinen suhteille tai muille määrille, joiden on oltava välillä 0 ja 1.

Binomial: Kuinka monta ”menestystä” tietystä riippumattomien kokeiden määrästä samalla todennäköisyydellä ”menestykseen”.

Poisson: Yhteinen laskelmille. Hienoja ominaisuuksia, että jos tapahtumien määrä ajanjaksolla tai alueella seuraa Poisson-arvoa, kaksinkertainen aika tai alue-luku seuraa edelleen Poissonia (kaksinkertaisella keskiarvolla): tämä toimii lisäämällä Poissoneja tai skaalaamalla muilla arvoilla kuin 2.

Huomaa, että jos tapahtumia tapahtuu ajan myötä ja tapahtumien välinen aika seuraa eksponentiaalista, niin ajanjaksolla esiintyvä määrä seuraa Poissonia.

Negatiivinen binomi: Laskee vähimmäisarvolla 0 (tai muu arvo versiosta riippuen) eikä ylärajaa. Käsitteellisesti se on ”epäonnistumisten” lukumäärä ennen k ”onnistumista”. Negatiivinen binomi on myös sekoitus Poisson-muuttujia, joiden keskiarvo tulee gammajakaumasta.

Geometrinen: erityistapaus negatiiviselle binomille, jossa se on ”epäonnistumisten” lukumäärä ennen ensimmäistä ”menestystä”. Jos katkaiset (pyöristät alaspäin) eksponentiaalisen muuttujan tekemään siitä erillisen, tulos on geometrinen.

Kommentit

  • Kiitos vastauksestasi. Wikipedia tarjoaa kuitenkin yleisemmän kuvauksen, josta pidän ’. Pohjimmiltaan kysymykseni on, miksi jotkut jakelut ovat mukavia? Mahdollisen vastauksen antaminen normaalijakauman tapauksessa voi liittyä keskitettyyn rajoitettuun lauseeseen – mikä tarkoittaa, että jos otat loputtoman määrän havaintoja, voit itse nähdä asympoteissa, että näiden havaintojen riittävä tilasto riippumattomuudella on normaali . Etsin lisää tällaisia esimerkkejä ..
  • Ei aivan todellinen jakauma, mutta entä bimodaali? En voi ’ ajatella yleisesti nähtyjä tosielämän esimerkkejä sen jälkeen, kun huomasin, että monet ihmisen sukupuolieroista eivät ole bimodaalisia.
  • Lisää multinomi

Vastaa

Osta ja lue ainakin William J. Fellerin 6 ensimmäistä lukua (ensimmäiset 218 sivua) ” Johdanto todennäköisyysteoriaan ja sen sovelluksiin, osa 2 ” http://www.amazon.com/dp/0471257095/ref=rdr_ext_tmb .Ainakin lue kaikki ratkaisun ongelmat ja yritä mieluiten ratkaista niin monta kuin mahdollista. Sinun ei tarvitse lukea 1. osaa, joka ei mielestäni ole erityisen ansiokas.

Huolimatta siitä, että kirjoittaja kuoli 45 1/2 vuotta sitten, ennen kuin kirja edes valmistui, tämä on yksinkertaisesti hienointa kirjaa on, ei yhtään, intuition kehittämiseksi todennäköisyys- ja stokastisissa prosesseissa sekä ymmärrystä ja tunnetta erilaisille jakaumille, miten ne liittyvät todellisen maailman ilmiöihin ja erilaisiin stokastisiin ilmiöihin, joita voi ja tapahtuu. perusta, jonka rakennat siitä, sinua palvellaan hyvin tilastoissa.

Jos pystyt tekemään sen myöhemmissä luvuissa, mikä vaikeutuu jonkin verran, olet valovuosien edessä melkein kaikkia. jos tiedät Feller Vol 2: n, tiedät todennäköisyydet (ja stokastiset prosessit); mikä tarkoittaa, että kaikki mitä et tiedä, kuten uudet kehityssuunnat, voit nopeasti ottaa vastaan ja hallita rakentamalla tuon vankan perustan.

Lähes kaikki tässä ketjussa aiemmin mainitut tiedot ovat Feller Vol 2 (ei kaikkea Kendall Advanced Theory of Statistics -materiaalia, mutta kirjan lukeminen tulee olemaan kakku Feller Vol 2: n jälkeen), ja enemmän, paljon enemmän, kaikki se tavalla, jonka pitäisi kehittää stokastista ajatteluasi ja intuitio. Johnson ja Kotz ovat hyödyllisiä erilaisten todennäköisyysjakaumien yksityiskohdille, Feller Vol 2 on hyödyllinen oppia ajattelemaan probabilistisesti ja tietämään, mitä Johnsonista ja Kotzista voidaan poimia ja miten niitä käytetään.

Vastaus

Asymptoottinen teoria johtaa normaalijakaumaan, ääriarvotyyppeihin, vakaat lait ja Poisson. Eksponentiaalinen ja Weibull ovat taipuvaisia tulemaan parametrisina aikoina tapahtumajakaumiin. Weibullin tapauksessa se on ääriarvotyyppi näytteen vähimmäismäärälle. Normaalisti jakautuneiden havaintojen parametrimalleihin liittyen chi-neliö-, t- ja F-jakaumat syntyvät hypoteesitestauksessa ja luottamusvälien estimoinnissa. Testien tehon tutkimiseen meillä on ei-keskipitkät t- ja F-jakaumat. Hypergeometrinen jakauma syntyy Fisherin tarkassa varautumistilastotestissä. Binomijakauma on tärkeä, kun tehdään kokeita osuuksien arvioimiseksi. Negatiivinen binomi on tärkeä jakauma mallien ylidispersion mallinnamiseksi pisteprosessissa. Sen pitäisi antaa sinulle hyvä alku käytännön parametriset häiriöt. (0, ∞) ei-negatiivisille satunnaismuuttujille gammajakauma on joustava tarjoamaan erilaisia muotoja, ja myös logaritmia normaalisti käytetään. [0,1]: ssä beetaperhe tarjoaa symmetriset etäisyydet, myös yhtenäinen jakeluina vinossa vasemmalla tai oikealla.

Haluan myös mainita, että jos haluat tietää kaikki hienot yksityiskohdat tilastojen jakeluista, on Johnsonin ja Kotzin klassinen sarja kirjoja, jotka sisältävät erillisiä jakeluita, jatkuvat yksimuuttujaiset ja jatkuvat monivaihtelevat jakaumat sekä myös Kendallin ja Stuartin edistyneen tilastoteorian osa 1.

Kommentit

  • Kiitos paljon vastauksesta, tämä on erittäin hyödyllistä. Kiitos vielä kerran, se todella auttoi minua.

Vastaa

Lisää vain muihin erinomaisiin vastauksiin.

Poisson-jakauma on hyödyllinen aina, kun meillä on laskentamuuttujia, kuten muut ovat maininneet. Mutta paljon enemmän pitäisi sanoa! Poisson syntyy asymptoottisesti binomisesti jakautuneesta muuttujasta, kun $ n $ (Bernoulli-kokeiden määrä) kasvaa ilman rajoja ja $ p $ (kunkin yksittäisen kokeen onnistumistodennäköisyys () menee nollaan siten, että $ \ lambda = np $ pysyy vakiona, erotettuna nollasta ja äärettömyydestä. Tämä kertoo meille, että se on hyödyllistä aina, kun meillä on paljon yksittäisiä erittäin epätodennäköisiä tapahtumia. Hyviä esimerkkejä ovat: onnettomuudet, kuten auto-onnettomuuksien määrä New Yorkissa vuonna päivässä, koska joka kerta, kun kaksi autoa ohittaa / kohtaa, onnettomuuden todennäköisyys on hyvin pieni, ja tällaisten mahdollisuuksien määrä on todellakin tähtitieteellinen! Nyt voit itse miettiä muita esimerkkejä, kuten lentokoneiden kaatumisten kokonaismäärä maailmassa Klassinen esimerkki, jossa hevoset tappoivat Preussin ratsuväkeä!

Kun Poissonia käytetään epidemiologiassa, joskus havaitaan, että se ei sovi joidenkin sairauksien määrän mallintamiseen. hyvin: Varianssi on liian suuri! Poissonilla on varianssi = keskiarvo, joka voidaan helposti nähdä binomiaalirajasta: binomiaalissa varianssi on $ np (1-p) $, ja kun $ p $ menee nollaan, välttämättä $ 1-p $ menee yhteen, joten varianssi menee odotusarvoon $ np $, ja molemmat menevät kohtaan $ \ lambda $.Yksi tapa on etsiä Poisson-vaihtoehtoa suuremmalla varianssilla, joka ei ole ehdollistettu keskiarvoon, kuten negatiivinen binomi. ¿Mutta miksi tämä suuremman varianssin ilmiö tapahtuu? Yksi mahdollisuus on, että sairauden yksilölliset todennäköisyydet $ p $ eivät ole vakioita eivätkä kumpikaan riipu joistakin havaituista kovariaateista (esimerkiksi iästä, ammatista, tupakointitilasta jne.). Tätä kutsutaan havainnoimattomaksi heterogeenisuudeksi, ja joskus malleja käytetään for is kutsutaan haurausmalleiksi tai sekamalleiksi. Yksi tapa tehdä tämä on olettaa, että populaation $ p $ ”: t ovat peräisin jostakin jakaumasta, ja olettaen, että se on esimerkiksi gammajakauma (mikä tekee matematiikasta yksinkertaisempaa …), saamme gamma-poisson-jakauman – – joka palauttaa negatiivisen binomin!

Vastaa

Äskettäin julkaistu tutkimus viittaa siihen, että ihmisen suorituskykyä EI normaalisti jaeta, toisin kuin yleisesti ajateltiin. Analysoitiin neljän alan tietoja: (1) Akateemiset tutkijat 50 tieteenalalla julkaisutiheyden perusteella kaikkein näkyvimmissä tieteenalakohtaisissa lehdissä. (2) ) Viihdyttäjät, kuten näyttelijät, muusikot ja kirjailijat, ja arvostettujen palkintojen, nimitysten tai erojen lukumäärä. (3) Poliitikot 10 maassa ja vaalien / uudelleenvalintojen tulokset. (4) Kollegiaaliset ja ammattilaisurheilijat, jotka etsivät yksilöllisimpiä käytettävissä olevat toimenpiteet, kuten kotiomien lukumäärä, vastaanotot joukkueurheilussa ja kokonaisvoitot yksittäisissä sarjoissa satamissa. Kirjoittaja kirjoittaa: ”Näimme jokaisessa tutkimuksessa selkeän ja johdonmukaisen valta-lakijakauman riippumatta siitä, kuinka suppeasti tai laajasti analysoimme tietoja …”

Kommentit

  • Kuka ehdotti, että ihmisen suorituskyky jakautuu normaalisti ?! Pareto (1906!) Ehdotti 80-20-periaatetta.

Vastaus

Cauchy-jakelua käytetään usein rahoituksessa varojen tuoton mallintamiseksi. Huomionarvoisia ovat myös Johnsonin rajatut ja rajoittamattomat jakaumat niiden joustavuuden vuoksi (olen soveltanut niitä mallinnettaessa omaisuuserien hintoja, sähköntuotantoa ja hydrologiaa).

Vastaus

Joitakin yleisiä todennäköisyysjakaumia

Joitakin yleisiä todennäköisyysjakaumia; tästä

Yhtenäinen jakelu (erillinen) – Valsit 1 kappaleen ja todennäköisyys kaatua jompaankumpaan 1, 2, 3, 4, 5 ja 6 on yhtä suuri.

Yhtenäinen erillinen ( täältä )

Tasainen jakauma (jatkuva) – Ruiskutit erittäin hienoa jauhetta seinää kohti. Pienellä alueella seinällä pölyn putoamisen mahdollisuudet seinän kohdalla ovat tasaiset.

Sinulla on iso kaasupullo. Kaikkien yksiköiden pinta-alojen kohdalla sisäseinän neliösenttimetriä kohden lyövien kaasumolekyylien lukumäärä sekunnissa on näennäisesti yhtenäinen.

kaasutörmäys Wikipedia-kuva täältä

Bernoulli-jakauma – Bernoullin tutkimus on (tai binomi-koe) on satunnainen koe, jolla on täsmälleen kaksi mahdollista tulosta, ” menestys ” ja ” epäonnistuminen ”. Tällaisessa kokeessa onnistumisen todennäköisyys on p, epäonnistumisen todennäköisyys on q = 1-p.

Esimerkiksi kolikonheitolla meillä voi olla kaksi lopputulosta – pää tai häntä. Kohtuullisen kolikon kohdalla pään todennäköisyys on 1/2; hännän todennäköisyys on 1/2, se on eräänlainen Bernoulli-jakauma, joka on myös tasainen.

Jos kolikko heittää, jos kolikko on epäoikeudenmukainen, esimerkiksi pään saamisen todennäköisyys on 0,9, hännän putoamisen todennäköisyys on 0,1.

Bernauli Bernauli-jakauma todennäköisyyksillä 0,6 ja 0,4; tästä

Binomisijakauma – Jos Bernoulli-tutkimus (kahdella tuloksella, todennäköisyydellä p ja q = 1-p) suoritetaan n kertaa; (kuten jos kolikkoa heitetään n kertaa); on pieni todennäköisyys saada kaikki pää, ja olisi pieni todennäköisyys saada kaikki hännät. Tietty arvo pään ja tietty arvo hännän olisi suurin. Tätä jakelua kutsutaan binomijakaumaksi.

BINOMIAL Binomiaalijakauma ja ruutu.kuvaa muokattu osoitteesta WP

Poisson ”jakelu esimerkki Wikipediasta: jokainen henkilö, joka seuraa päivittäin saamansa postimäärää, saattaa huomata saavansa keskimäärin 4 kirjainta päivässä. Jos sähköpostit ovat riippumattomista lähteistä , niin päivässä vastaanotettujen postilaatikkojen määrä noudattaa Poisson-jakelua, ts. on merkityksetön mahdollisuus saada nolla tai 100 postia päivässä, mutta enintään tietty määrä (tässä 4) postia päivässä.

Vastaavasti; oletetaan, että kuvitteellisella niityllä e kiertää 10 kiviä 1 km ^ 2: ssa. Suhteellisesti suuremmalla alueella saamme suhteellisesti enemmän kiviä. Mutta tietylle 1 km ^ 2 näytteelle on hyvin epätodennäköistä, että saisit 0 tai 100 kiviä. todennäköisesti se seuraa Poissonin jakaumaa.

Wikipedian mukaan radioaktiivisesta lähteestä tulevien hajoamistapahtumien määrä seuraa Poissonin jakaumaa.

Poisson Poissonin jakelu Wikipediasta

Normaalijakauma tai Gaussin jakauma – jos n lukumäärä kuolee samanaikaisesti, ja koska n on erittäin suuri kunkin kuoleman lopputuloksen summa olisi yleensä ryhmitelty keskeisen arvon ympärille. Ei liian iso, ei liian pieni. Tätä jakaumaa kutsutaan normaalijakaumaksi tai kellon muotoiseksi käyräksi.

kolmiomainen summa 2 kuolemasta täältä

CLT
Samanaikaisten kuolemien lisääntyessä jakauma lähestyy Gaussiania. keskimmäisestä rajalausekkeesta

Vastaavasti, jos n kolikoiden määrää heitetään samanaikaisesti ja n on hyvin suuri, meillä olisi pieni mahdollisuus pääsee moniin päihin tai liian moniin hänniin. Pään määrä keskittyy tietyn arvon ympärille. Se on samanlainen kuin binomijakauma, mutta kolikoiden lukumäärä on vieläkin suurempi.

Kommentit

  • Mainitse, jos yllä olevassa pyrkimyksessäni on väärinkäsitys, koska Pelkään tilastojen monimutkaisuutta.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *