Tud-e valaki példát felmutatni egy unimodális eloszlásra, amelynek ferdesége nulla, de nem szimmetrikus?

2010 májusában a Wikipedia felhasználó, Mcorazao hozzáadott egy mondatot a ferdeségű cikkhez , amely “A a nulla érték azt jelzi, hogy az értékek viszonylag egyenletesen oszlanak el az átlag mindkét oldalán, jellemzően, de nem feltétlenül szimmetrikus eloszlást jelentenek. ” A wiki oldalon azonban nincsenek tényleges példák olyan disztribúciókra, amelyek megszegik ezt a szabályt. A “Google aszimmetrikus eloszlások nulla ferdeséggel” keresése szintén nem ad valódi példákat, legalábbis az első 20 eredményben.

Azon definíció segítségével, hogy a ferdeséget a $ \ operátornév {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \ , \ Big] $, és az R képlet

sum((x-mean(x))^3)/(length(x) * sd(x)^3) 

Konstruálhatok egy kicsi , tetszőleges eloszlás, hogy alacsony legyen a ferdeség. Például a terjesztés

x = c(1, 3.122, 5, 4, 1.1) 

$ -5.64947 \ cdot10 ^ {- 5} $ torzítást eredményez. De ez egy kis minta, ráadásul a szimmetriától való eltérés nem nagy. Tehát lehet-e nagyobb eloszlást létrehozni egy csúccsal, amely nagyon aszimmetrikus, de mégis közel nulla ferdeséggel rendelkezik?

Megjegyzések

  • Szeretné, hogy az elosztás unimodális legyen, vagy sem? A cím ezt mondja, de a szöveg alig említi ezt a pontot.
  • @Dilip Igen, én ‘ érdekesebbnek találnám, ha az eloszlás unimodális lenne, mivel a ferdeség , mint központi mozzanat, nincs igazán más értelme ‘.

Válasz

Vegye figyelembe a diszkrét eloszlásokat. Olyan, amelyet a $ támogat A k $ értékeket $ x_1, x_2, \ ldots, x_k $ nem negatív valószínűségek határozzák meg $ p_1 , p_2, \ ldots, p_k $ , feltéve, hogy (a) összeadódnak 1-vel, és (b) a ferdeségi együttható értéke 0 (ami egyenértékű azzal, hogy a harmadik központi pillanat nulla). Ez $ k-2 $ szabadságfokot hagy (egyenletmegoldó értelemben, nem pedig a statisztikai!). Remélhetőleg unimodális megoldásokat találunk.

A példák keresésének megkönnyítése érdekében olyan megoldásokat kerestem, amelyeket egy kis szimmetrikus vektor $ \ mathbf {x} támogat. = (- 3, -2, -1,0,1,2,3) $ egyedi móddal $ 0 $ , nulla átlag és nulla ferdeség. Az egyik ilyen megoldás a $ (p_1, \ ldots, p_7) = (1396, 3286, 9586, 47386, 8781, 3930, 1235) / 75600 $ .

Valószínűségfüggvény

Láthatja, hogy aszimmetrikus.

Itt “nyilvánvalóan aszimmetrikus megoldás a $ \ mathbf {x} = (-3, -1,0,1,2) $ (ami aszimmetrikus) és $ p = (1,18, 72, 13, 4) / 108 $ :

2 valószínűségi függvény

Most már nyilvánvaló, mi folyik itt: , mert az átlag megegyezik $ 0 $ , a negatív értékek $ (- 3) ^ 3 = -27 $ és $ 18 \ alkalommal (- 1) ^ 3 = -18 $ a harmadik pillanatig, míg a pozitív értékek hozzájárulnak $ 4 \ szor 2 ^ 3 = 32 $ és $ 13 \ times 1 ^ 3 = 13 $ , pontosan egyensúlyban a negatív hozzájárulások. Szimmetrikus eloszlást vehetünk fel a $ 0 $ körül, például $ \ mathbf {x} = (- 1,0,1 ) $ a $ \ mathbf {p} = (1,4,1) / 6 $ mezővel, és helyezzen el egy kis tömeget a $ + 1 $ $ + 2 $ , egy kis tömeg a $ + 1 értéktől $ le $ – 1 $ , és enyhe tömeg $ – 3 $ , megtartva az átlagot $ 0 $ és a ferdeséget a $ 0 $ értéknél is, miközben aszimmetriát hoz létre . Ugyanez a megközelítés fog működni a folyamatos eloszlás nulla átlagának és nulla ferdeségének fenntartása mellett, aszimmetrissé téve azt; ha nem vagyunk túl agresszívek a tömegváltással, akkor az unimodális marad.


Szerkesztés: Folyamatos eloszlások

Mivel a probléma folyamatosan jelentkezik, adjuk meg explicit példa folyamatos eloszlásokkal. Peter Flomnak volt egy jó ötlete: nézze meg a normálok keverékeit. Két normál keveréke nem fog megtörténni: ha a ferdesége eltűnik, akkor szimmetrikus lesz. A következő legegyszerűbb eset három normál keveréke.

Három normál keveréke a hely és a méret megfelelő megválasztása után hat valós paramétertől függ, ezért több mint elegendő rugalmassággal kell rendelkeznie az aszimmetrikus, nulla ferdeségű megoldás előállításához. . Némelyik megtalálásához tudnunk kell, hogyan kell kiszámítani a normálok keverékeinek ferdeségeit. Ezek között megkeressük azokat, amelyek unimodálisak (lehetséges, hogy nincsenek).

Most általában a $ r ^ \ text {th } A normál normál eloszlás $ (nem központi) momentuma nulla, ha a $ r $ páratlan és egyébként megegyezik a $ 2 ^ {r / 2} \ Gamma \ balra (\ frac {1-r} {2} \ jobbra) / \ sqrt {\ pi} $ . Amikor átméretezzük a szokásos normál eloszlást úgy, hogy a szórása $ \ sigma $ legyen, a $ r ^ \ text {th } $ pillanatot megszorozzuk a $ \ sigma ^ r $ értékkel. Amikor bármilyen terjesztést áthelyezünk $ \ mu $ , az új $ r ^ \ text {th} $ A pillanat kifejezhető a $ r $ értékig terjedő pillanatokban. Az eloszlások keverékének momentuma (vagyis azok súlyozott átlaga) megegyezik az egyes momentumok súlyozott átlagával. Végül a ferdeség pontosan akkor nulla, amikor a harmadik központi pillanat nulla, és ez könnyen kiszámítható az első három pillanat szempontjából.

Ez algebrai támadást jelent számunkra a probléma ellen. Az egyik megoldás, amelyet találtam, három normál egyenlő keveréke, amelynek paraméterei $ (\ mu, \ sigma) $ megegyeznek a $ ( 0,1) $ , $ (1 / 2,1) $ és $ (0, \ sqrt {127/18}) \ kb (0, 2.65623) $ . Átlaga megegyezik a $ (0 + 1/2 + 0) / 3 = 1/6 $ értékkel. Ez a kép a pdf-t kék színnel, az eloszlás pdf-jét pedig vörös színnel átfordította az átlagá val. Az, hogy különböznek, mindkettő aszimmetrikus. (A mód kb. $ 0.0519216 $ , nem egyenlő a $ 1/6 $ átlagával.) Mindkettőjük nulla ferdeséggel rendelkezik .

Folyamatos példák

A cselekmények jelzik, hogy ezek nem modálisak. (A helyi maximumok megtalálásához a Calculus használatával ellenőrizheti.)

Megjegyzések

  • (+1) Nagyon sima válasz. Ez mégis folyamatos disztribúcióval fog működni? Nem hozhatna létre ‘ t az apró kis módokat? Lehet, hogy nem egyenesen gondolkodom …
  • Ön ‘ elég jól gondolkodik, Makró: mindannyian olyan szkeptikusak kellene lennünk. A trükk az, hogy apró mennyiségeket kell elosztani széles tartományokban. Az első derivált teszt lehetővé teszi, hogy ellenőrizze a lehetséges módokat, és megalapozza annak bizonyítását is, hogy kellően ennek a formának az apró eltolódásai nem nem hoznak létre új módokat. li>
  • Köszönöm a választ! Ez hasonló ahhoz, amire intuitívan gondoltam, bár nem tudtam ‘ ezt jól megfogalmazni szavakkal – hogy ” egyensúlyban kell lennie ” a tömeg az eloszlás mindkét oldalán. Elgondolkodtat, hogy vannak-e sztereotípiás módszerek arra, hogy ezt a kiegyensúlyozó műveletet végrehajtsa.
  • Az egyik módja, Andy, egy diszkrét megoldással indul, majd normál eloszlással vonja össze. Ebben az esetben az unimodalitási követelmény arra a normális eloszlásra kényszeríti a nagy szórást. Ennek ellenére, ha a konvolúció nem változtatja meg érezhetően a szükséges tulajdonságokat (például a nulla ferdeséget), vagy kiszámítható módon megváltoztatja, akkor matematikai kezelése van a problémának. Bizonyos értelemben a legutóbbi szerkesztésem ilyen támadásnak tekinthető, bár ‘ ez nem szigorúan konvolúció (mert a három normálnak eltér a szórása).
  • Ellenőriztem, Andy: a diszkrét oldat normál eloszlású összekeverése nem változtatja meg a ferdeséget. Ha ennek a normális eloszlásnak 0,57 vagy annál nagyobb szórást ad meg, az eredmény unimodális. Az alapul szolgáló diszkrét eloszláshoz hasonlóan továbbra is nulla átlaga, nulla ferdesége van és aszimmetrikus. Ha ezt összekeverjük egy normál normál eloszlással, akkor a normális normál és a diszkrét eloszlás között szabályozott tömegmozgás valósul meg: ez teljesítheti a ” sztereotip módszer.

Válasz

Itt található az, amelyet a https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html # amit szépnek találok és R-ben reprodukálok: inverz Burr vagy Dagum eloszlás, amelynek alakparaméterei $ k = 0,0629 $ és $ c = 18.1484 $:

$$ g (x) = ckx ^ {- (c + 1)} [1 + x ^ {- c}] ^ {- (k + 1)} $$

Jelentése 0.5387, szórás 0,2907, ferdeség 0,0000 és kurtosis 2,0000. A forrás “elefántterjesztésnek” is nevezi: írja ide a kép leírását

Az R-ben készült reprodukcióm

 library(actuar) library(knotR) # a nonsymmetric distribution with zero skewness # see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# c <- 18.1484 k <- 0.0629 x <- seq(0,1.5,by=.0001) elephant.density <- dinvburr(x, k, c) plot(x,elephant.density, type="l") polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey") points(0.8,0.8, pch=19, cex=2) # "ears" created via https://www.desmos.com/calculator/cahqdxeshd ear.x <- c(0.686, 0.501, 0.42, 0.68) ear.y <- c(0.698, 0.315, 1.095, 0.983) myseg(bezier(cbind(ear.x, ear.y)), type="l") EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k) EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k) (skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196  

Amint ez a kimenet mutatja, a ferdeség nem egészen nulla és négy számjegy között ezek a paraméterértékek. Itt van egy kis optimalizáló a $ k $ és a $ c $ számára:

 # optimize skewness a bit further skewval <- 1 while (skewval > 10^(-10)){ optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c) skewval <- optskew.k$f.root k <- optskew.k$root optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k) skewval <- optskew.c$f.root c <- optskew.c$root } 

hozam

> print(c) [1] 18.89306 > print(k) [1] 0.05975542 > print(skewval) [1] -1.131464e-15 

Megjegyzések

  • Köszönjük a szerkesztést. Ez azt jelenti, hogy nem tudtam reprodukálni a 0,0000 és 4 számjegy közötti ferdeséget, így 0,0001245138 értéket kaptam (lásd a következő szerkesztést az R kódban).
  • Valószínűleg futtathatunk egy egyszerű optimalizálót a $ c $ és $ megtalálásához k $ értékeket úgy, hogy a ferdeség a lehető legközelebb legyen a nullához. Néhány további sornak vagy esetleg egynek kell lennie. Az utolsó sorban már analitikusan kiszámoltad a veszteségfüggvényt, van-e megfelelő általános optimalizáló az R-ben?
  • Valójában 0,0003756196. A 0.0001245138 már némi kezdeti optimalizálás után történt, tévedésből adták itt. Megnézem.
  • @amoeba, próbáltam kicsit optimalizálni, de nem állítom, hogy ezt okosan csináltam volna, kevés tapasztalatom van az optimalizálással kapcsolatban.
  • A ferdeség, amely ‘ nulla-három számjegyű (közel négy) volt, rengeteg volt a fejemben; ‘ nem tetszik, hogy egy pontosabb érték ettől másképp fog kinézni. Ha a ferdeség nulla lesz ezen a környéken, és ‘ egyértelművé teszi, hogy milyen irányokban kell az értékeket módosítani, ha nagyobb pontosságra van szükség, akkor úgy gondolom, hogy ‘ s elegendő. De dicséret a további erőfeszítésekért. (Egyébként ez a ‘ kedves példa.)

Válasz

Tekintsünk egy eloszlást a valós vonal pozitív felén, amely lineárisan növekszik 0-ról a módra, majd exponenciális a módtól jobbra, de a módban folyamatos.

Ez lehetséges nevezzük háromszög-exponenciális eloszlásnak (bár gyakran úgy néz ki, mint egy cápauszony).

Legyen $ \ theta $ a mód helye, és $ \ lambda $ legyen a exponenciális.

A $ \ lambda \ theta $ növekedésével az eloszlás fokozatosan egyre kevésbé torzul. Ahogy a $ \ lambda \ theta $ meghaladja a $ \ kb. 6.15 $ értéket, a harmadik pillanat pozitívról negatívra vált:

Háromszög-exponenciális, nulla ferdeséggel

Brizzi (2006) $ ^ {[1]} $ erre az elosztási családra “kétarcú” disztribúcióként hivatkozik, és tárgyalja ez a keresztezési pont, ahol a harmadik pillanat ferdesége nulla. von Hippel (2005) $ ^ {[2]} $ egy példát mutat be, amely “majdnem abban a keresztezési pontban van itt

A szál A nem normális eloszlások nulla ferdeséggel és nulla felesleges kurtosissal? vannak aszimmetrikus példák, köztük egy kis diszkrét és egy folytonos unimodális:

Unimodális Gauss-keverék, nulla ferdeséggel

Diszkrét unimodális eloszlások – vagy ekvivalensen, minták – nulla ferdeséggel meglehetősen könnyen elkészíthetők, nagyok vagy kisebbek.

Itt egy példa, amelyet mintaként vagy (a nyers frekvenciák 3000-vel osztásával) pmf-ként kezelhetünk. az “x” értékek a felvett értékek, az “n” az értékek előfordulásának száma a mintában):

x: -2 -1 0 1 2 3 4 5 6 7 8 9 10 n: 496 498 562 1434 2 1 1 1 1 1 1 1 1 

A valószínűség tömegfüggvényének a fentiekből felépített ábrája

Ez a példa f rom 3 pontos eloszlások:

x: -2 1 c n: c(c-1)(c+1)/6 c(c-1)(c+1)/3 - c 1 

a $ c $ különböző értékei között 3 és 10 között. Ez a paraméterezett ($ c $ által) 3 pontos “atom” “rendelkezik $ \ sum_i n_ix_i = 0 $ és $ \ sum_i n_ix_i ^ 3 = 0 $ értékkel, ami viszont azt jelenti, hogy a $ c $ különböző választási lehetőségei közötti keverékek nulla torzításúak. (Nem tehet kisebbet, mint három pont közötti eloszlás, amelynek aszimmetriája és a harmadik központi momentuma nulla. Egyszerű darabok gyűjteménye csak néhány ponton, például ezek szép építőelemeket alkotnak, amelyekből nagyobb szerkezetek készíthetők.)

Mindenféle más ilyen atom létrehozható, de ez a példa csak ezt a fajtát használja. Az ilyen atomkombinációkhoz hozzáadunk néhány szimmetrikusan elhelyezett értéket a fennmaradó lyukak kitöltéséhez és garantálja az unimodalitást anélkül, hogy tönkretenné az átlag és a harmadik pillanat szerkezetét.

$ [1] $ Brizzi, M.(2006),
“A háromszög és az exponenciális tulajdonságokat ötvöző ferde modell: a kétarcú eloszlás és statisztikai tulajdonságai”
Austrian Journal of Statistics , 35 : 4, p455–462
http://www.stat.tugraz.at/AJS/ausg064/

$ [2] $ von Hippel, PT (2005),
“Átlag, középérték és ferdeség: tankönyvszabály javítása”
Journal of Statistics Education 13. évfolyam, 2. szám,
http://ww2.amstat.org/publications/jse/v13n2/vonhippel.html

Megjegyzések

  • Lehet, hogy ezt talán ” Shark-fin ” -nek hívhatnánk?
  • @Glen_b Valójában teljesen Shark-fin.

Válasz

A nulla ferdeséghez $$ \ operátornévre van szükségünk {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = 0 $$, vagy ennek megfelelő, $$ \ operatorname {E} \ Big [ \ nagy (\ tfrac {X- \ mu} {\ sigma} \ nagy) ^ {\! 3} \, \ nagy | X \ leq \ mu \ Big] + \ operátor neve {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ gt \ mu \ Big] = 0. $$

Most, adott átlag és szórás esetén válassza ki a két eloszlást $ Y $ és $ Z $ nulla tömeggel a $ \ mu jobb oldalán $ és $$ \ operátornév {E} \ Big [\ big (\ tfrac {Y- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = \ operatorname {E} \ Big [ \ big (\ tfrac {Z- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] $$ és definiálja a $ X $ értéket úgy, hogy megfeleljen a $ Y $ értékre, ha marad $ $ mu $ és $ (\ mu – Z) $ egyébként. (Nem tudja ennek pontos jelölését, bárki szeretne segíteni?)

A kapott disztribúció unimodális lesz, ha a $ Y $ és $ Z $ PDF-fájlok nőnek a $ \ mu bal oldalán $ (amellett, hogy nulla a $ \ mu $ jobb oldalán).

Megjegyzések

  • Hogyan garantálhatja, hogy az elosztás unimodális?
  • Köszönjük, hogy felhívta erre a figyelmet. A $ Y $ és $ Z $ PDF-fájlokat szigorúan növelni kell, amíg $ \ mu $, majd nullára kell esni.
  • Ez a megfelelő ötlet, de még mindig szüksége van némi munkára, mert a $ \ sigma $ megváltozhat a $ Y $ és a $ Z $ kombinálásakor.
  • @whuber: Damn. Tudtam, hogy volt némi buktatónak lenni: 🙂

Válasz

A következő diszkrét eloszlás aszimmetrikus és null ferdeség: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Doric és mtsai., Qual Quant (2009) 43: 481 cikkében találtam. -493; DOI 10.1007 / s11135-007-9128-9

Megjegyzések

  • +1 Megnézi és ez ‘ unimodális. Ez ‘ a lehető legegyszerűbb példa.

Válasz

Biztos. Próbálja ki ezt:

skew= function (x, na.rm = FALSE) { if (na.rm) x <- x[!is.na(x)] #remove missing values sum((x - mean(x))^3)/(length(x) * sd(x)^3) #calculate skew } set.seed(12929883) x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1)) skew(x) plot(density(x)) 

(A nehéz dolgokat már megtette!)

Megjegyzések

  • kedves, tetszik. +1
  • Ez ‘ nem bimodális … ez ‘ szörnyen multi -modális. Próbálja meg ábrázolni a sűrűséget; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
  • Az így generált adatok természetesen nem unimodálisak. Mindössze annyit kell tennie, hogy lássa, kivágja és beilleszti a kódot, szó szerint. Valójában a normálisan elosztott változók keveréke soha nem lesz unimodális (kivéve, ha a keverék egyik aránya természetesen 1).
  • @Macro, hogy ‘ s Nem megfelelő. Lásd például Roeder 1994 (JASA) absztraktját arról a jól ismert eredményről, hogy ” két vegyes normál sűrűsége nem bimodális, hacsak az eszközöket nem választja el legalább 2 szórások “. Ha ennél kevesebbel választják el őket, akkor a keverék nem modális.
  • Ön ‘ igaza van a @guestnek. ‘ megfeledkeztem erről a lehetőségről, amikor bejegyeztem

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük