Végzős hallgató vagyok, aki érdeklődik a statisztika iránt. Nagyon tetszik az anyag, de néha nehezen gondolkodom a való életbe való alkalmazásokon. Pontosabban a kérdésem az általánosan használt statisztikai eloszlásokra vonatkozik (normál – béta-gamma stb.). Gondolom, egyes esetekben megkapom azokat a tulajdonságokat, amelyek miatt az elosztás meglehetősen szép – például az exponenciális memória nélküli tulajdonság. De sok más esetben nincs intuícióm a közös eloszlások fontosságáról és alkalmazási területeiről, amelyeket a tankönyvekben látunk.
Valószínűleg sok jó forrás foglalkozik aggodalmaimmal, én örülnék, ha megoszthatná ezeket. Sokkal motiváltabb lennék az anyagban, ha valós példákkal társítanám.
Hozzászólások
Válasz
A Wikipédiának van egy oldala, amely sok valószínűségeloszlást sorol fel linkekkel az egyes disztribúciókról részletesebben. A listát áttekintve követheti a linkeket, hogy jobban érezze az o típusokat f alkalmazások, amelyekhez a különböző disztribúciókat általában használják.
Ne feledje, hogy ezeket a disztribúciókat a valóság modellezésére használják, és ahogy Box mondta: “minden modell hibás, néhány modell hasznos”.
Íme néhány általános eloszlás és néhány ok, amiért hasznosak:
Normál: Ez az eszközök és más lineáris kombinációk (pl. regressziós együtthatók) a CLT miatt. Ehhez kapcsolódik, ha tudható, hogy valami sok különböző apró ok additív hatása miatt merül fel, akkor a normális lehet ésszerű eloszlás: például sok biológiai intézkedés több gén és több környezeti tényező eredménye, és ezért gyakran megközelítőleg normális .
Gamma: Jobb ferde és hasznos olyan dolgokhoz, amelyeknél a természetes minimum 0. Általában az eltelt időkre és néhány pénzügyi változóra használják.
Exponenciális: a Gamma speciális esete. Memória nélküli és könnyen méretezhető.
Chi-négyzet ($ \ chi ^ 2 $): a Gamma speciális esete. Négyzetes normálváltozók összegeként keletkezik (így használjuk a varianciákra).
Béta: 0 és 1 között definiálva (de átalakítható más értékek közé), arányokhoz vagy egyéb olyan mennyiségekhez használható, amelyek között kell lennie 0 és 1.
Binomial: Hány “siker” adott számú független kísérletből, azonos “siker” valószínűséggel.
Poisson: Gyakori a számlálásoknál. Remek tulajdonságok, hogy ha egy adott időszakban vagy területen az események száma Poisson-t követ, akkor az idő vagy a terület kétszeresének száma továbbra is a Poisson-t követi (az átlag kétszeresével): ez Poisonok hozzáadásához vagy skálázáshoz szolgál más értékekkel, mint 2.
Ne feledje, hogy ha az események idővel bekövetkeznek, és az események közötti idő exponenciát követ, akkor az adott időszakban előforduló szám Poisson-t követ.
Negatív binomiál: Minimálisan számít 0 (vagy más érték, melyik verziótól függ) és nincs felső határ. Fogalmilag ez a “kudarcok” száma a k “sikerek” előtt. A negatív binomiál olyan Poisson-változók keveréke is, amelyek átlagai gamma-eloszlásból származnak.
Geometriai: speciális eset negatív binomiálhoz, ahol ez az első “siker” előtti “kudarcok” száma. Ha az exponenciális változót diszkrétvé teszi (lefelé kerekíti), az eredmény geometriai.
Megjegyzések
- Nos, köszönöm a válaszát. A wikipédia azonban egy általánosabb leírást tartalmaz, amely nekem ‘ tetszik. Alapvetően az a kérdésem, hogy miért jó néhány disztribúció? Ha normális eloszlás esetén választ akarunk adni, ez összefüggésben lehet a központi korlátozott tétellel – amely azt mondja, hogy ha végtelen mennyiségű megfigyelést mintavételez, akkor az aszimpotikákban láthatja, hogy ezeknek a megfigyeléseknek a megfelelő statisztikája, adott függetlenség esetén normális . További ilyen példákat keresek.
- Nem éppen valós eloszlás, de mi van a bimodallal? Nem tudok ‘ gondolni a valós életben gyakran látott példákra, miután megállapítottam, hogy az emberi nemek közötti sok különbség nem bimodális.
- Multinomiális
Válasz
Vásárolja meg és olvassa el William J. Feller legalább első 6 fejezetét (az első 218 oldalt) ” Bevezetés a valószínűségelméletbe és alkalmazásaiba, 2. kötet “ http://www.amazon.com/dp/0471257095/ref=rdr_ext_tmb .Legalább olvassa el az összes megoldási problémát, és lehetőleg próbáljon meg minél többet megoldani. Nem kell elolvasnia az 1. kötetet, amely véleményem szerint nem különösebben érdemleges.
Annak ellenére, hogy a szerző 45 évvel ezelőtt meghalt 45 évvel ezelőtt, még mielőtt a könyv elkészült volna, ez egyszerűen a a legkiválóbb könyv – bármi sem létezik – a valószínűség és a sztochasztikus folyamatok intuíciójának kialakításához, valamint a különböző eloszlások megértéséhez és érzésének megértéséhez, annak hogyan viszonyulnak a valós világ jelenségeihez és a különféle sztochasztikus jelenségekhez, amelyek előfordulhatnak és előfordulhatnak. alapot fogsz építeni belőle, jól fogsz szolgálni a statisztikákban.
Ha ezt sikerül elérned a következő fejezetekben, ami némileg nehezebbé válik, akkor fényévekkel jársz majdnem mindenki előtt. Egyszerűen fogalmazva: ha ismeri a Feller 2. kötetet, akkor ismeri a valószínűséget (és a sztochasztikus folyamatokat); ami azt jelenti, hogy bármi, amit nem tud, például új fejlesztések, gyorsan fel tudja venni és elsajátíthatja az erre a szilárd alapra építve.
Szinte minden, amit ebben a szálban korábban említettek, benne van Feller 2. kötet (nem minden anyag a Kendall Advanced Theory of Statistics-ben, de ennek a könyvnek az elolvasása sütemény lesz a Feller 2. kötet után), és még sok minden más oly módon, amely fejleszti sztochasztikus gondolkodását és az intuíció. Johnson és Kotz jól használható a különböző valószínűségi eloszlások apróságaihoz, a Feller 2. kötet hasznos a valószínű gondolkodású gondolkodás megtanulásához, valamint ahhoz, hogy mit tudjon kivonni Johnsonból és Kotzból, és hogyan használja.
Válasz
Az aszimptotikus elmélet a normális eloszláshoz, a szélső értéktípusokhoz, a stabil törvényekhez és a Poisson-hoz vezet. Az exponenciális és a Weibull általában az eseményeloszlások paraméteres idejeként merül fel. A Weibull esetében ez egy extrém értéktípus a minta minimumához. A normál eloszlású megfigyelések paraméteres modelljeivel kapcsolatban a chi négyzet, a t és az F eloszlás felmerül a hipotézis tesztelés és a konfidencia intervallum becslés során. A chi négyzet a kontingencia táblázat elemzésében és az illeszkedési tesztek jóságában is felmerül. A tesztek teljesítményének tanulmányozásához megvan a nemcentrális t és F eloszlás. A hipergeometrikus eloszlás Fisher kontingenciatáblákra vonatkozó pontos tesztjében merül fel. A binomiális eloszlás fontos az arányok becslésére irányuló kísérletek során. A negatív binomiál fontos eloszlás a pontszerű folyamatban való túlzott diszperzió modellezéséhez. Ennek jó kezdetet kell nyújtania a gyakorlati paraméteres disztribúciók. A (0, ∞) nem negatív véletlen változók esetében a Gamma eloszlás rugalmas a különböző alakzatok biztosításához, és a log normálist is gyakran használják. [0,1] -en a béta család szimmetrikus diszturbációkat biztosít, beleértve az egyenruhát is mivel a disztribúciók balra vagy jobbra ferdülnek.
Azt is meg kell említenem, hogy ha meg akarja ismerni a statisztikák terjesztésének minden apró részletét, akkor Johnson és Kotz klasszikus könyvsorozata diszkrét terjesztéseket tartalmaz, folyamatos egyváltozós elosztások és folyamatos többváltozós eloszlások, valamint Kendall és Stuart Haladó Statisztikai Elméletének 1. kötete.
Megjegyzések
- Nagyon köszönöm a választ, ez rendkívül hasznos. Még egyszer köszönöm, ez nagyon segített nekem.
Válasz
Csak azért, hogy hozzáadjam a többi kiváló válaszhoz.
A Poisson-eloszlás akkor hasznos, amikor számlálóváltozóink vannak, amint mások említették. De sokkal többet kellene mondani! A poisson aszimptotikusan keletkezik egy binomiálisan elosztott változóból, amikor a $ n $ (a Bernoulli-kísérletek száma) korlátok nélkül növekszik, és a $ p $ (az egyes kísérletek sikerének valószínűsége () nullára megy, oly módon, hogy $ \ A lambda = np $ állandó marad, elhatárolva a nullától és a végtelenségtől. Ez azt mondja nekünk, hogy hasznos, ha nagyszámú, egyénileg nagyon valószínűtlen eseményről van szó. Néhány jó példa: balesetek, például New York-i autóbalesetek száma naponta, mivel minden egyes alkalommal, amikor két autó elhalad / találkozik, nagyon alacsony a baleset valószínűsége, és az ilyen lehetőségek száma valóban csillagászati! Most maga is gondolkodhat más példákon, például a repülőgép-balesetek teljes számán a világon Egy év alatt. A klasszikus példa, ahol a lovak pusztulásával járó halálozások száma a preusiai lovasságban!
Amikor a Poissont az epidemiológiában használják, bizonyos betegségek számának modellezésére gyakran kiderül, hogy ez nem megfelelő nos: A variancia is nagy! A Poisson-nak variancia = átlag van, ami a binomiális határból könnyen látható: A binomiálban a variancia $ np (1-p) $, és amikor $ p $ nullára megy, szükségszerűen $ 1-p $ megy egyre, tehát a variancia $ np $ -ra megy, ami az elvárás, és mindkettő a $ \ lambda $ -ra megy.Az egyik módja a Poisson alternatívájának megkeresése nagyobb varianciával, nincs feltéve, hogy egyenlő legyen az átlaggal, például a negatív binomiál. ¿De miért fordul elő ez a nagyobb szórású jelenség? Az egyik lehetőség az, hogy a betegség $ p $ egyéni valószínűsége nem állandó, és nem függ néhány megfigyelt kovariáltól (mondjuk kor, foglalkozás, dohányzási állapot, stb.). Ezt nevezzük megfigyeletlen heterogenitásnak, és néha olyan modelleket használnak, mert az is gyenge modelleknek vagy vegyes modelleknek nevezik. Ennek egyik módja, ha feltételezzük, hogy a populációban lévő $ p $ “s valamilyen eloszlásból származik, és ha például gamma eloszlást feltételezünk (ami egyszerűbb matematikát eredményez …), akkor megkapjuk a gamma-poisson eloszlást – – amely helyreállítja a negatív binomiált!
Válasz
Nemrégiben publikált kutatás azt sugallja, hogy az emberi teljesítmény NEM szokásosan oszlik meg, ellentétben a közönséges gondolatokkal. Négy terület adatait elemezték: (1) 50 tudományterületen dolgozó akadémikusok, a publikálási gyakoriság alapján a legkiemelkedőbb tudományág-specifikus folyóiratokban. (2) ) Szórakoztatók, például színészek, zenészek és írók, valamint a rangos díjak, jelölések és megkülönböztetések száma. (3) Tíz nemzet politikusai és választási / újraválasztási eredmények. (4) Kollégiumi és hivatásos sportolók figyelik a leginkább egyénre szabottakat a rendelkezésre álló intézkedések, például az otthoni futások száma, a csapatsportfogadások és az egyéni győzelmek összessége kikötők. A szerző ezt írja: “Minden tanulmányban világos és következetes hatalmi-törvényi eloszlást láthattunk, függetlenül attól, hogy mennyire szűken vagy tágan elemeztük az adatokat …”
Megjegyzések
- Ki javasolta, hogy az emberi teljesítmény normálisan oszlasson el ?! A 80-20 elvet Pareto (1906!) Javasolta.
Válasz
A Cauchy-elosztást gyakran használják finanszírozásban az eszköz hozamának modellezésére. Figyelemre méltóak a Johnson Bounded and Unbounded disztribúciói is rugalmasságuk miatt (ezeket alkalmaztam az eszközárak, az áramtermelés és a hidrológia modellezésében). válasz “>
Néhány gyakori valószínűségeloszlás; innen
Egységes elosztás (diszkrét) – 1 dobót dobtál, és az 1, 2, 3, 4, 5 és 6 bármelyikének esésének valószínűsége egyenlő.
( itt )
Egységes eloszlás (folyamatos) – Nagyon finom port szórt a fal felé. Kis falfelület esetén egyenletes az esély arra, hogy a falon lévő por lehulljon.
Nagy gázpalackja van. Bármely egységnyi területre a belső falon másodpercenként négyzetcentiméterenként eljutó gázmolekulák száma látszólag egyenletes.
Bernoulli eloszlás – A Bernoulli-próba (vagy binomiális próba) egy véletlenszerű kísérlet, pontosan két lehetséges eredménnyel, ” sikerrel ” és ” hiba “. Egy ilyen kísérletben a siker valószínűsége p, a kudarc valószínűsége q = 1-p.
Például egy érme dobálásakor 2 eredményünk lehet: fej vagy farok. Egy tisztességes érme esetében a fej valószínűsége 1/2; a farok valószínűsége 1/2, ez egyfajta Bernoulli-eloszlás, amely szintén egyenletes.
Ha egy érme tisztességtelen, például egy érme dobása, például a fej megszerzésének valószínűsége 0,9, akkor a farok esésének valószínűsége 0,1 lesz.
Bernauli eloszlás 0,6 és 0,4 valószínűséggel; innen
Binomiális eloszlás – Ha Bernoulli-próbát (2 kimenettel, illetve p és q = 1-p valószínűséggel) n-szer lefuttatunk; (például ha egy érmét n-szer dobálnak); egy kis valószínűséggel megkapja az egész fejet, és egy kis valószínűséggel az összes farok. A fej és a farok egy bizonyos értéke maximális lenne. Ezt a disztribúciót binomiális eloszlásnak hívják.
binomiális elosztás pipával.kép módosítva: WP
Poisson “terjesztése – példa a Wikipédiából: az az ember, aki nyomon követi a naponta érkező levelek mennyiségét, észreveheti, hogy átlagosan napi 4 levelet kap. Ha a levelek független forrásból származnak , akkor az egy napon beérkezett levelek száma megfelel a Poisson-terjesztésnek, azaz elhanyagolható esély lesz arra, hogy napi nulla vagy 100, de naponta legfeljebb bizonyos számú (itt 4) levél érkezzen.
Hasonlóképpen; tegyük fel, hogy egy képzeletbeli réten e megkerüli 10 kavicsot 1 km ^ 2-ben. Arányosan nagyobb területtel arányosan több kavicsot kapunk. De egy bizonyos 1 km ^ 2 -es minta esetében nem valószínű, hogy 0 vagy 100 kavicsot kapna. valószínűleg Poisson-terjesztést követ.
A Wikipedia szerint egy radioaktív forrásból származó másodpercenkénti bomlási események száma Poisson-eloszlást követi.
Poisson terjesztése a Wikipédiából
Normál eloszlás vagy Gauss-eloszlás – ha n halott száma egyszerre gurult, és mivel n nagyon nagy; az egyes halálok kimenetelének összege általában egy központi érték köré csoportosul. Nem túl nagy, nem túl kicsi. Ezt az eloszlást normál eloszlásnak vagy harang alakú görbének hívják.
Összeg 2 meghal, itt
Az egyidejű halálok növekvő számával az eloszlás megközelíti a Gaussian-t. A központi korláttételből
Hasonlóképpen, ha n érmék száma dobálódik egyidejűleg, és n nagyon nagy, akkor van egy kis esély arra, hogy sok fejhez vagy túl sok farokhoz jut. A fejek száma egy bizonyos érték körül középre kerül. Ez hasonló a binomiális elosztáshoz, de az érmék száma még nagyobb.
Megjegyzések
- Kérjük, említse meg, hogy van-e tévhit a fenti erőfeszítésemben, mert Félek a statisztikák összetettségétől.
EstimatedDistribution
függvényhez .