Voiko joku tarjota esimerkin unimodaalisesta jakaumasta, jonka vinous on nolla, mutta joka ei ole symmetrinen?

Toukokuussa 2010 Wikipedian käyttäjä Mcorazao lisäsi lauseen vinousartikkeliin , jonka ”A nolla-arvo osoittaa, että arvot ovat suhteellisen tasaisesti jakautuneet keskiarvon molemmille puolille, tyypillisesti mutta eivät välttämättä tarkoita symmetristä jakaumaa. ” Wiki-sivulla ei kuitenkaan ole todellisia esimerkkejä jakeluista, jotka rikkovat tämän säännön. Googlen ”esimerkin epäsymmetriset jakaumat, joissa ei ole vinoa”, ei myöskään anna todellisia esimerkkejä, ainakin 20 ensimmäisessä tuloksessa.

Käyttämällä määritelmää, jonka mukaan vinous lasketaan $ \ operaattorin nimi {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \ , \ Big] $ ja R-kaava

sum((x-mean(x))^3)/(length(x) * sd(x)^3) 

Voin rakentaa pienen , mielivaltainen jakauma, jotta vinous olisi pieni. Esimerkiksi jakelu

x = c(1, 3.122, 5, 4, 1.1) 

tuottaa vinon $ -5.64947 \ cdot10 ^ {- 5} $. Mutta tämä on pieni näyte, ja lisäksi poikkeama symmetriasta ei ole suuri. Joten, onko mahdollista rakentaa suurempi jakauma yhdellä huipulla, joka on erittäin epäsymmetrinen, mutta jonka vinous on silti lähes nolla?

Kommentit

  • Haluatko jakelun olevan yksimuotoinen vai ei? Otsikko sanoo niin, mutta tekstissä tuskin mainitaan tätä asiaa.
  • @Dilip Kyllä, minusta ’ pidän mielenkiintoisempana, jos jakelu olisi yksimuotoista, koska vinous , keskeisenä hetkenä, ei ’ ole oikeastaan järkeä toisin.

Vastaa

Harkitse erillisiä jakaumia. $: lla tuettu k $ -arvot $ x_1, x_2, \ ldots, x_k $ määritetään ei-negatiivisilla todennäköisyyksillä $ p_1 , p_2, \ ldots, p_k $ edellyttäen, että (a) ne ovat yhtä kuin 1 ja (b) vinouskerroin on 0 (mikä vastaa kolmatta keskimomenttia nollaa). Tämä jättää $ k-2 $ vapausastetta (yhtälöiden ratkaisemisessa, ei tilastollisessa!). Voimme toivoa löytävänsä yksimuotoisia ratkaisuja.

Esimerkkien etsimisen helpottamiseksi etsin ratkaisuja, joita tuetaan pienellä symmetrisellä vektorilla $ \ mathbf {x} = (- 3, -2, -1,0,1,2,3) $ , jolla on ainutlaatuinen tila $ 0 $ , nolla keskiarvo ja nolla vinous. Yksi tällainen ratkaisu on $ (p_1, \ ldots, p_7) = (1396, 3286, 9586, 47386, 8781, 3930, 1235) / 75600 $ .

Todennäköisyysfunktio

Voit nähdä, että se on epäsymmetrinen.

Täällä ”on selvemmin epäsymmetrinen ratkaisu $ \ mathbf {x} = (-3, -1,0,1,2) $ (joka on epäsymmetrinen) ja $ p = (1,18, 72, 13, 4) / 108 $ :

Todennäköisyysfunktio 2

Nyt on selvää, mitä tapahtuu: , koska keskiarvo on yhtä suuri kuin $ 0 $ , negatiiviset arvot vaikuttavat $ (- 3) ^ 3 = -27 $ ja 18 $ \ kertaa (- 1) ^ 3 = -18 $ kolmannelle hetkelle, kun taas positiiviset arvot vaikuttavat $ 4 \ kertaa 2 ^ 3 = 32 $ ja $ 13 \ kertaa 1 ^ 3 = 13 $ , tasapainottamalla tarkasti negatiivisen maksut. Voimme ottaa symmetrisen jakauman arvosta $ 0 $ , kuten $ \ mathbf {x} = (- 1,0,1 ) $ painikkeella $ \ mathbf {p} = (1,4,1) / 6 $ ja siirrä pieni massa kohdasta $ + 1 $ $ + 2 $ , pieni massa $ + 1 $ alas $ – 1 $ ja pieni massa $ – 3 $ , pitäen keskiarvon $ 0 $ ja vinouden myös $ 0 $ -kohdassa luoden samalla epäsymmetrian . Sama lähestymistapa ylläpitää jatkuvan jakauman nollakeskiarvoa ja nolla vinoutta samalla kun se tekee epäsymmetrisestä; jos emme ole liian aggressiivisia massansiirron suhteen, se pysyy yksimuotoisena.


Muokkaa: Jatkuvat jakaumat

Koska ongelma jatkuu, antakaamme selkeä esimerkki jatkuvista jakeluista. Peter Flomilla oli hyvä idea: katso normaalien seoksia. Kahden normaalin seosta ei tehdä: kun sen vinous häviää, se on symmetrinen. Seuraava yksinkertaisin tapaus on kolmen normaalin sekoitus.

Kolmen normaalin seokset sopivan sijainnin ja mittakaavan valinnan jälkeen riippuvat kuudesta todellisesta parametrista, ja siksi niillä tulisi olla enemmän kuin tarpeeksi joustavuutta epäsymmetrisen, nollaviivaisen ratkaisun tuottamiseksi . Niiden löytämiseksi meidän on osattava laskea normaalien seosten vinous. Näiden joukosta etsimme kaikkia yksimodaalisia (on mahdollista, ettei niitä ole).

Nyt $ r ^ \ text {th } Normaalin normaalijakauman} $ (ei-keskeinen) -momentti on nolla, kun $ r $ on pariton ja muuten yhtä suuri kuin $ 2 ^ {r / 2} \ Gamma \ vasen (\ frac {1-r} {2} \ oikea) / \ sqrt {\ pi} $ . Kun skaalataan tämä normaalijakauma siten, että sen keskihajonta on $ \ sigma $ , $ r ^ \ text {th } $ -määrä kerrotaan luvulla $ \ sigma ^ r $ . Kun siirrämme mitä tahansa jakelua $ \ mu $ , uusi $ r ^ \ text {th} $ hetki voidaan ilmaista hetkinä, jotka ovat enintään $ r $ . Jakautumisten sekoituksen hetki (eli niiden painotettu keskiarvo) on sama yksittäisten momenttien painotettu keskiarvo. Lopuksi vinous on nolla tarkalleen, kun kolmas keskeinen momentti on nolla, ja tämä lasketaan helposti kolmen ensimmäisen momentin suhteen.

Tämä antaa meille algebrallisen hyökkäyksen ongelmaan. Yksi löytämäni ratkaisu on yhtä suuri seos kolmesta normaalista, joiden parametrit $ (\ mu, \ sigma) $ ovat yhtä suuria kuin $ ( 0,1) $ , $ (1 / 2,1) $ ja $ (0, \ sqrt {127/18}) \ approx (0, 2.65623) $ . Sen keskiarvo on $ (0 + 1/2 + 0) / 3 = 1/6 $ . Tämä kuva näyttää pdf: n sinisenä ja jakelun pdf: n käänsi keskiarvonsa ympäri punaisella. Se, että ne eroavat toisistaan, osoittaa, että ne ovat molemmat epäsymmetrisiä. (Tila on noin $ 0,0519216 $ , erilainen kuin $ 1/6 $ .) Molemmilla on rakenteeltaan vinoutta nolla .

Jatkuvia esimerkkejä

Tontit osoittavat, että nämä ovat yksimuotoisia. (Voit tarkistaa paikalliset maksimiarvot Calculuksen avulla.)

Kommentit

  • (+1) Erittäin liukas vastaus. Toimiiko tämä kuitenkin jatkuvilla jakeluilla? Eikö ’ t aiheuttaisi pieniä pieniä toimintatiloja? En ehkä ajattele suoraan …
  • Sinä ’ ajattelet melko hyvin, Makro: Meidän kaikkien pitäisi olla niin skeptisiä. Temppu on siirtää pieniä määriä, jotka ovat jakautuneet laajalle alueelle. Ensimmäisen johdannaisen testin avulla voit tarkistaa mahdolliset tilat ja antaa myös perustan todisteelle siitä, että riittävän tämän muodon pienet siirtymät eivät tuota uusia toimintatiloja.
  • Kiitos vastauksesta! Tämä on samanlainen kuin ajattelin intuitiivisesti, vaikka en voinut ’ sanoa sitä hyvin sanoin – että sinun täytyy ” tasapainottaa ” massa jakauman kummallakin puolella. Saanen miettimään, onko olemassa tasapainotapoja, joilla voidaan suorittaa tämä tasapainotus.
  • Yksi tapa, Andy, on aloittaa erillisellä ratkaisulla ja sitten yhdistää se normaalijakaumalla. Tässä tapauksessa yksimuotoisuusvaatimus pakottaa tämän normaalijakauman olemaan suuri keskihajonta. Silti, jos konvoluutio ei muuta merkittävästi vaadittavia ominaisuuksia (kuten nollaviivaisuutta) tai se muuttaa sitä ennustettavissa olevilla tavoilla, sinulla on matemaattinen kahva ongelmaan. Jossain mielessä viimeaikaista muokkaustani voidaan pitää hyökkäyksenä, vaikka se ’ ei ole ehdottomasti konvoluutio (koska kolmella normaalilla on erilaiset keskihajonnat). > Olen tarkistanut, Andy: erillisen liuoksen sekoittaminen normaalijakaumalla ei muuta vinoutta. Kun annat tälle normaalijakaumalle keskihajonnan noin 0,57 tai enemmän, tulos on yksimuotoinen. Kuten alla olevan erillisen jakauman tavoin, sillä on edelleen nolla keskiarvo, nolla vinous ja epäsymmetrinen. Tämän sekoittaminen normaalin normaalijakauman kanssa tarkoittaa kontrolloitua massan liikkumista normaalin normaalin ja diskreetin jakauman välillä: tämä saattaa täyttää pyyntösi ” stereotyyppiselle ” -menetelmä.

Vastaa

Tässä on yksi, jonka löysin osoitteesta https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html # joka on mielestäni mukava ja toistettu R: ssä: käänteinen Burr- tai Dagum-jakauma, jonka muodon parametrit ovat $ k = 0,0629 $ ja $ c = 18.1484 $:

$$ g (x) = ckx ^ {- (c + 1)} [1 + x ^ {- c}] ^ {- (k + 1)} $$

Sen keskiarvo on 0.5387, keskihajonta 0,2907, vinous 0,0000 ja kurtoosi 2,0000. Lähde kutsuu sitä myös ”norsun jakautumiseksi”: kirjoita kuvan kuvaus tähän

R-toisintoni luotiin

 library(actuar) library(knotR) # a nonsymmetric distribution with zero skewness # see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# c <- 18.1484 k <- 0.0629 x <- seq(0,1.5,by=.0001) elephant.density <- dinvburr(x, k, c) plot(x,elephant.density, type="l") polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey") points(0.8,0.8, pch=19, cex=2) # "ears" created via https://www.desmos.com/calculator/cahqdxeshd ear.x <- c(0.686, 0.501, 0.42, 0.68) ear.y <- c(0.698, 0.315, 1.095, 0.983) myseg(bezier(cbind(ear.x, ear.y)), type="l") EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k) EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k) (skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196  

Kuten tämä tulos osoittaa, vinous on ei nollasta neljään numeroon näille parametriarvoille. Tässä on pieni optimoija kohteille $ k $ ja $ c $:

 # optimize skewness a bit further skewval <- 1 while (skewval > 10^(-10)){ optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c) skewval <- optskew.k$f.root k <- optskew.k$root optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k) skewval <- optskew.c$f.root c <- optskew.c$root } 

tuottaa

> print(c) [1] 18.89306 > print(k) [1] 0.05975542 > print(skewval) [1] -1.131464e-15 

Kommentit

  • Kiitos muokkauksesta. Tästä huolimatta en voinut toistaa 0,0000: n tai 4-numeroisen vinoutta, jolloin saatiin 0,0001245138 (katso seuraava muokkaus R-koodissa).
  • $ c $ ja $ voidaan todennäköisesti löytää yksinkertaisella optimoijalla. k $ -arvot niin, että vinous on mahdollisimman lähellä nollaa. Sen pitäisi olla pari ylimääräistä riviä tai ehkä jopa yksi. Sinulla on jo menetysfunktio analyyttisesti laskettu viimeisellä rivilläsi, onko R: ssä sopiva yleinen optimoija?
  • Oikeastaan 0.0003756196. 0.0001245138 oli jo jonkin verran alustavaa optimointia, joka annettiin täällä vahingossa. Tulen katsomaan.
  • @amoeba, yritin optimoida vähän, mutta en väitä, että tekisin sen fiksusti, minulla on vain vähän kokemusta optimoinnista.
  • Vinous, jonka ’ nolla-kolme numeroa (lähes neljä) oli mielestäni paljon; se ’ ei pidä tarkemman arvon ansiosta sen näyttävän erilaiselta. Jos vinous ylittää nollan läheisyydessä ja ’ selvittää, mihin suuntiin arvoja voidaan säätää, jos tarkkuutta tarvitaan, luulen, että ’ s riittää. Mutta kiitos lisäponnisteluista. (Se ’ on muuten kaunis esimerkki.)

Vastaa

Tarkastellaan reaalilinjan positiivisen puoliskon jakaumaa, joka kasvaa lineaarisesti 0: sta moodiin ja on sitten eksponentiaalinen moodin oikealla puolella, mutta on jatkuva tilassa.

Tämä voi kutsutaan kolmiomainen-eksponentiaalijakaumaksi (vaikka se näyttää usein hieman hainevältä).

Olkoon $ \ theta $ moodin sijainti ja $ \ lambda $ on eksponentiaalinen.

Kun $ \ lambda \ theta $ kasvaa, jakelu vähenee asteittain vähemmän. Kun $ \ lambda \ theta $ nousee yli $ \ n. 6,15 $, kolmas hetki siirtyy positiivisesta negatiiviseksi:

Kolmikulmainen-eksponentiaalinen, nollaviivaisuudella

Brizzi (2006) $ ^ {[1]} $ viittaa tähän jakeluperheeseen ”kahden kasvon” jakeluna ja käsittelee tämä jakopiste, jossa kolmannen hetken vinous on nolla. von Hippel (2005) $ ^ {[2]} $ esittää esimerkin, joka on melkein siinä jakopisteessä täällä

Lanka Epänormaaleissa jakaumissa, joissa vinous ja nolla kurtoosi? on joitain epäsymmetrisiä esimerkkejä, mukaan lukien pieni erillinen esimerkki ja toinen jatkuva yksimodaalinen:

Epäsymmetrinen Gaussin seos, jolla ei ole vinoutumista

Diskreetit unimodaaliset jakaumat – tai vastaavasti näytteet – nollaviivaisuudet ovat melko helppoja rakentaa, suuria tai pieniä.

Tässä on esimerkki, jota voit pitää näytteenä tai (jakamalla raakataajuudet 3000: lla) pmf: ksi ( ”x” -arvot ovat otettuja arvoja, ”n” ovat kertojen määrä, jolloin arvo esiintyy näytteessä):

x: -2 -1 0 1 2 3 4 5 6 7 8 9 10 n: 496 498 562 1434 2 1 1 1 1 1 1 1 1 

Yllä olevasta rakennettu todennäköisyysmassafunktion kaavio

Tämä esimerkki on rakennettu f rom 3-pisteen jakaumat:

x: -2 1 c n: c(c-1)(c+1)/6 c(c-1)(c+1)/3 - c 1 

eri arvoilla $ c $ välillä 3-10. Tämä parametrisoi ($ c $: lla) 3-pisteen ”atomin” ”on $ \ sum_i n_ix_i = 0 $ ja $ \ sum_i n_ix_i ^ 3 = 0 $, mikä puolestaan tarkoittaa, että $ c $: n eri vaihtoehtojen seoksilla ei ole vinoutta. (Et voi tehdä mitään pienempää kuin jakauma kolmelle pisteelle, jolla on epäsymmetria ja kolmas keskeinen momentti nolla. Kokoelma yksinkertaisia kappaleita vain muutaman pisteen yli, kuten nämä, tekevät siististä rakennuspalikoista, joista voidaan tehdä suurempia rakenteita.)

On olemassa kaikenlaisia muita tällaisia ”atomeja”, joita voidaan rakentaa, mutta tässä esimerkissä käytetään vain tätä tyyppiä. Joihinkin tällaisiin atomien yhdistelmiin lisätään muutama symmetrisesti sijoitettu arvo jäljellä olevien reikien täyttämiseksi ja taata yksimuotoisuus tuhoamatta keskiarvon ja kolmannen hetken rakennetta.

$ [1] $ Brizzi, M.(2006),
”Kolmiomaiset ja eksponentiaaliset ominaisuudet yhdistävä vino malli: kaksipuolinen jakauma ja sen tilastolliset ominaisuudet”
Itävallan tilastolehti , 35 : 4, p455–462
http://www.stat.tugraz.at/AJS/ausg064/

$ [2] $ von Hippel, PT (2005),
”Keskiarvo, mediaani ja vinous: Oppikirjan säännön korjaaminen”
Journal of Statistics Education, osa 13, Numero 2,
http://ww2.amstat.org/publications/jse/v13n2/vonhippel.html

Kommentit

  • Voisiko sitä kutsua ehkä ” Shark-fin ” kenties?
  • @Glen_b Täysin Shark-fin.

Vastaa

Nollan vinoutta varten tarvitsemme $$ \ operaattorin nimi {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = 0 $$ tai vastaavasti $$ \ operaattorin nimi {E} \ Big [ \ iso (\ tfrac {X- \ mu} {\ sigma} \ iso) ^ {\! 3} \, \ iso | X \ leq \ mu \ Big] + \ operaattorin nimi {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ gt \ mu \ Big] = 0. $$

Valitse nyt annetulle keskiarvolle ja varianssille mikä tahansa kaksi jakaumaa $ Y $ ja $ Z $ nollamassalla $ \ mu: n oikealla puolella $ ja $$ \ operaattorin nimi {E} \ Big [\ big (\ tfrac {Y- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = \ operaattorin nimi {E} \ Big [ \ big (\ tfrac {Z- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] $$ ja määritä $ X $ vastaamaan $ Y $, jos vasemmalla on $ \ mu $ ja $ (\ mu – Z) $ muuten. (Eivät tiedä tarkkaa merkintää tälle, kukaan haluaa auttaa?)

Tuloksena oleva jakelu on epämuodollinen, jos $ Y $: n ja $ Z $: n PDF-tiedostot kasvavat $ \ mu: n vasemmalla puolella $ (sen lisäksi, että se on nolla $ \ mu $: n oikealla puolella).

Kommentit

  • Kuinka voit taata, että jakelu on yksimuotoista?
  • Kiitos tämän osoittamisesta. $ Y $: n ja $ Z $: n PDF-tiedostojen on oltava tiukasti kasvavia, kunnes $ \ mu $, ja pudotettava sitten nollaan.
  • Tämä on oikea idea, mutta se vaatii vielä jonkin verran työtä, koska $ \ sigma $ voi muuttua yhdistettäessä $ Y $ ja $ Z $.
  • @whuber: Hitto. Tiesin, että siellä oli olla jokin kuoppa … 🙂

vastaus

Seuraava erillinen jakauma on epäsymmetrinen ja siinä on nolla vinous: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Löysin sen Doric et ai., Qual Quant (2009) 43: 481 -493; DOI 10.1007 / s11135-007-9128-9

Kommentit

  • +1 Se tarkistaa ja se ’ on yksimuotoinen. Se ’ on yksinkertaisin mahdollinen esimerkki.

Vastaa

Varma. Kokeile tätä:

skew= function (x, na.rm = FALSE) { if (na.rm) x <- x[!is.na(x)] #remove missing values sum((x - mean(x))^3)/(length(x) * sd(x)^3) #calculate skew } set.seed(12929883) x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1)) skew(x) plot(density(x)) 

(Teit kovat asiat jo!)

Kommentit

  • mukava, pidän siitä. +1
  • Se ’ ei ole bimodaalinen … se ’ on kamala multi -modaalinen. Yritä piirtää tiheys; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
  • Tällä tavalla luotu data ei todellakaan ole yksimuotoista. Kaikki mitä sinun tarvitsee tehdä nähdäksesi, että leikkaa ja liitä koodi, sanatarkasti. Normaalisti jakautuneiden muuttujien seos ei todellakaan ole koskaan yksimodaalinen (ellei tietysti yksi seoksen osuuksista ole 1).
  • @Macro, että ’ s ei oikein. Katso esimerkiksi tiivistelmä Roeder 1994 (JASA) -lehdestä hyvin tunnetusta tuloksesta, että ” kahden normaalisekoituksen tiheys ei ole kaksimuotoinen, ellei keinoja erota vähintään 2 standardipoikkeamat ”. Jos se erotetaan pienemmällä kuin tämä, seos on yksimodaalinen.
  • Olet ’ oikeassa @vieras. ’ unohdin tämän mahdollisuuden, kun kirjoitin viestini

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *