Poate cineva să ofere un exemplu de distribuție unimodală care are o asimetrie zero, dar care nu este simetrică?

În mai 2010, utilizatorul Wikipedia Mcorazao a adăugat o propoziție la articol de asimetrie că „A valoarea zero indică faptul că valorile sunt distribuite relativ uniform pe ambele părți ale mediei, de obicei, dar nu implică neapărat o distribuție simetrică. ” Cu toate acestea, pagina wiki nu are exemple reale de distribuții care încalcă această regulă. Googlingul „exemplu de distribuții asimetrice cu asimetrie zero”, de asemenea, nu oferă exemple reale, cel puțin în primele 20 de rezultate.

Utilizând definiția că distorsiunea este calculată de $ \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \ , \ Big] $ și formula R

sum((x-mean(x))^3)/(length(x) * sd(x)^3) 

pot construi un mic , distribuție arbitrară pentru a reduce asimetria. De exemplu, distribuția

x = c(1, 3.122, 5, 4, 1.1) 

produce o înclinare de -5,64947 $ \ cdot10 ^ {- 5} $. Dar acesta este un eșantion mic și, în plus, abaterea de la simetrie nu este mare. Deci, este posibil să se construiască o distribuție mai mare cu un vârf care este extrem de asimetric, dar care are încă o asimetrie de aproape zero?

Comentarii

  • Doriți sau nu distribuția să fie unimodală? Titlul spune acest lucru, dar textul abia menționează acest punct.
  • @Dilip Da, mi se pare mai interesant dacă distribuția ar fi fost unimodală, deoarece asimetria , ca moment central, ‘ nu are sens altfel.

Răspunde

Luați în considerare distribuții discrete. Una care este acceptată pe $ k $ valori $ x_1, x_2, \ ldots, x_k $ este determinată de probabilități non-negative $ p_1 , p_2, \ ldots, p_k $ sub rezerva condițiilor ca (a) să însumeze 1 și (b) coeficientul de asimetrie este egal cu 0 (ceea ce este echivalent cu al treilea moment central fiind zero). Aceasta lasă $ k-2 $ grade de libertate (în sensul rezolvării ecuațiilor, nu în cel statistic!). Putem spera să găsim soluții unimodale.

Pentru a facilita căutarea exemplelor, am căutat soluții acceptate pe un mic vector simetric $ \ mathbf {x} = (- 3, -2, -1,0,1,2,3) $ cu un mod unic la $ 0 $ , medie zero și zero asimetrie. O astfel de soluție este $ (p_1, \ ldots, p_7) = (1396, 3286, 9586, 47386, 8781, 3930, 1235) / 75600 $ .

Funcția de probabilitate

Puteți vedea că este asimetrică.

Aici este o soluție mai evident asimetrică cu $ \ mathbf {x} = (-3, -1,0,1,2) $ (care este asimetric) și $ p = (1,18, 72, 13, 4) / 108 $ :

Funcția de probabilitate 2

Acum este evident ce se întâmplă: deoarece media este egală cu $ 0 $ , valorile negative contribuie $ (- 3) ^ 3 = -27 $ și $ 18 \ ori (- 1) ^ 3 = -18 $ la al treilea moment în timp ce valorile pozitive contribuie $ 4 \ times 2 ^ 3 = 32 $ și $ 13 \ times 1 ^ 3 = 13 $ , echilibrând exact negativul contribuții. Putem lua o distribuție simetrică de aproximativ $ 0 $ , cum ar fi $ \ mathbf {x} = (- 1,0,1 ) $ cu $ \ mathbf {p} = (1,4,1) / 6 $ și deplasați o masă mică din $ + 1 $ la $ + 2 $ , o mică masă de la $ + 1 $ până la $ – 1 $ și o cantitate ușoară de masă până la $ – 3 $ , păstrând media la $ 0 $ și asimetria la $ 0 $ , în timp ce creați o asimetrie . Aceeași abordare va funcționa pentru a menține zero media și zero asimetrie a unei distribuții continue, făcând-o asimetrică; dacă „nu suntem prea agresivi cu schimbarea masei, aceasta va rămâne unimodală.


Edit: Distribuții continue

Deoarece problema continuă să apară, să oferim un exemplu explicit cu distribuții continue. Peter Flom a avut o idee bună: uită-te la amestecuri de valori normale. Un amestec de două normale nu va fi făcut: atunci când asimetria sa dispare, va fi simetrică. Următorul caz cel mai simplu este un amestec de trei normale.

Amestecurile a trei valori normale, după o alegere adecvată a locației și a scalei, depind de șase parametri reali și, prin urmare, ar trebui să aibă o flexibilitate mai mult decât suficientă pentru a produce o soluție asimetrică, zero-asimetrică . Pentru a găsi unele, trebuie să știm cum să calculăm asimetria amestecurilor de valori normale. Dintre acestea, vom căuta altele care sunt unimodale (este posibil să nu existe).

Acum, în general, $ r ^ \ text {th } $ (non-central) moment al unei distribuții normale standard este zero atunci când $ r $ este impar și altfel este egal cu $ 2 ^ {r / 2} \ Gamma \ left (\ frac {1-r} {2} \ right) / \ sqrt {\ pi} $ . Când redimensionăm distribuția normală standard pentru a avea o abatere standard de $ \ sigma $ , $ r ^ \ text {th } Momentul $ este înmulțit cu $ \ sigma ^ r $ . Când schimbăm orice distribuție cu $ \ mu $ , noul $ r ^ \ text {th} $ momentul poate fi exprimat în termeni de momente până la $ r $ inclusiv. Momentul unui amestec de distribuții (adică o medie ponderată a acestora) este aceeași medie ponderată a momentelor individuale. În cele din urmă, asimetria este zero exact atunci când al treilea moment central este zero și acest lucru este calculat cu ușurință în termenii primelor trei momente.

Acest lucru ne oferă un atac algebric asupra problemei. O soluție pe care am găsit-o este un amestec egal de trei normale cu parametri $ (\ mu, \ sigma) $ egală cu $ ( 0,1) $ , $ (1 / 2,1) $ și $ (0, \ sqrt {127/18}) \ approx (0, 2.65623) $ . Media sa este egală cu $ (0 + 1/2 + 0) / 3 = 1/6 $ . Această imagine arată pdf-ul în albastru și pdf-ul distribuției răsturnat despre media sa în roșu. Faptul că diferă arată că ambele sunt asimetrice. (Modul este de aproximativ 0,0519216 $ $ , inegal cu media $ 1/6 $ .) Amândoi au o asimetrie zero prin construcție .

Exemple continue

Comploturile indică faptul că acestea sunt unimodale. (Puteți verifica folosind Calcul pentru a găsi maximele locale.)

Comentarii

  • (+1) Răspuns foarte slab. Va funcționa totuși cu distribuții continue? ‘ nu ar crea potențial moduri mici? Poate că nu mă gândesc corect …
  • Vă ‘ vă gândiți destul de bine, Macro: ar trebui să fim cu toții atât de sceptici. Trucul este de a schimba cantități mici repartizate pe game largi. Un test de primă derivată vă va permite să verificați posibile moduri și oferă, de asemenea, baza pentru o dovadă că suficient de mici mici schimbări ale acestei forme nu vor produce noi moduri.
  • Vă mulțumim pentru răspuns! Acest lucru este similar cu ceea ce gândeam intuitiv, deși nu am putut ‘ să-l exprim în cuvinte bine – că trebuie să ” ” masa de pe fiecare parte a distribuției. Mă face să mă întreb dacă există moduri stereotipe în care se poate efectua acest act de echilibrare.
  • O modalitate, Andy, este să începi cu o soluție discretă și apoi să o convolți cu o distribuție normală. În acest caz, cerința de unimodalitate va forța distribuția normală să aibă o abatere standard mare. Chiar și așa, dacă convoluția nu modifică în mod apreciabil proprietățile necesare (cum ar fi asimetria zero) sau o schimbă în moduri previzibile, aveți o problemă matematică. Într-un anumit sens, editarea mea recentă poate fi privită ca un astfel de atac, deși ‘ nu este strict o convoluție (deoarece cele trei normale au abateri standard diferite).
  • Am verificat, Andy: implicarea soluției discrete cu o distribuție normală nu schimbă asimetria. Când acordați acestei distribuții normale o abatere standard de aproximativ 0,57 sau mai mare, rezultatul este unimodal. La fel ca distribuția discretă subiacentă, continuă să aibă o medie zero, o asimetrie zero și să fie asimetrică. Amestecarea acestui lucru cu o distribuție normală standard echivalează cu o mișcare controlată a masei între distribuția normală standard și distribuția discretă: care ar putea îndeplini cererea dvs. pentru un ” stereotip ” metodă.

Răspuns

Iată una pe care am găsit-o la https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html # pe care mi se pare frumos și reprodus în R: o distribuție inversă Burr sau Dagum cu parametri de formă $ k = 0,0629 $ și $ c = 18.1484 $:

$$ g (x) = ckx ^ {- (c + 1)} [1 + x ^ {- c}] ^ {- (k + 1)} $$

Are media 0.5387, abaterea standard 0,2907, asimetria 0,0000 și kurtosis 2,0000. Sursa îl numește și „distribuția elefantului”: introduceți descrierea imaginii aici

Reproducerea mea în R a fost creată cu

 library(actuar) library(knotR) # a nonsymmetric distribution with zero skewness # see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# c <- 18.1484 k <- 0.0629 x <- seq(0,1.5,by=.0001) elephant.density <- dinvburr(x, k, c) plot(x,elephant.density, type="l") polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey") points(0.8,0.8, pch=19, cex=2) # "ears" created via https://www.desmos.com/calculator/cahqdxeshd ear.x <- c(0.686, 0.501, 0.42, 0.68) ear.y <- c(0.698, 0.315, 1.095, 0.983) myseg(bezier(cbind(ear.x, ear.y)), type="l") EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k) EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k) (skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196  

După cum arată această ieșire, asimetria este nu chiar de la zero la patru cifre pentru aceste valori ale parametrilor. Iată un mic optimizator pentru $ k $ și $ c $:

 # optimize skewness a bit further skewval <- 1 while (skewval > 10^(-10)){ optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c) skewval <- optskew.k$f.root k <- optskew.k$root optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k) skewval <- optskew.c$f.root c <- optskew.c$root } 

randament

> print(c) [1] 18.89306 > print(k) [1] 0.05975542 > print(skewval) [1] -1.131464e-15 

Comentarii

  • Vă mulțumim pentru modificare. Acestea fiind spuse, nu am putut reproduce asimetria de 0,0000 până la patru cifre, obținând în schimb 0,0001245138 (vezi următoarea editare, în codul R).
  • Probabil se poate rula un simplu optimizator pentru a găsi $ c $ și $ k $ valori astfel încât asimetria să fie cât mai aproape de zero. Ar trebui să fie câteva linii suplimentare sau poate chiar una. Aveți deja funcția de pierdere calculată analitic în ultima dvs. linie, există un optimizator generic adecvat în R?
  • De fapt, 0,0003756196. 0.0001245138 a fost deja după o optimizare inițială, dată aici din greșeală. Voi arunca o privire.
  • @amoeba, am încercat să optimizez puțin, dar nu susțin că am făcut asta într-un mod inteligent, am puțină experiență în optimizare.
  • Asigurarea că ‘ are de la zero la trei cifre (aproape patru) îmi era destul de importantă; ‘ nu este ca o valoare mai precisă o va face să arate diferit. Dacă asimetria va trece de zero în acea vecinătate și ‘ este clar în ce direcții trebuie modificate valorile dacă este nevoie de mai multă precizie, consider că ‘ s suficient. Dar felicitări pentru efortul suplimentar. (Apropo, este ‘ un exemplu minunat.)

Răspuns

Luați în considerare o distribuție pe jumătatea pozitivă a liniei reale care crește liniar de la 0 la modul și apoi este exponențială la dreapta modului, dar este continuă la modul.

Acest lucru ar putea să fie numită distribuție exponențială triunghiulară (deși pare adesea un pic ca o înotătoare de rechin).

Fie $ \ theta $ locația modului și $ \ lambda $ parametrul ratei exponențial.

Pe măsură ce $ \ lambda \ theta $ crește, distribuția devine progresiv mai puțin înclinată. Pe măsură ce $ \ lambda \ theta $ crește peste $ \ aproximativ 6,15 $, al treilea moment trece de la pozitiv la negativ:

Triangular-Exponential with zero skewness

Brizzi (2006) $ ^ {[1]} $ se referă la această familie de distribuții drept distribuția „cu două fețe” și discută acest punct de încrucișare în care al treilea moment de asimetrie este zero. von Hippel (2005) $ ^ {[2]} $ prezintă un exemplu care „este aproape în acel punct de încrucișare aici

Firul Distribuții non-normale cu zero asimetrie și zero exces de kurtoză? are câteva exemple asimetrice, incluzând un mic exemplu discret și altul continuu unimodal:

Amestec gaussian unimodal cu asimetrie zero

Distribuții unimodale discrete – sau echivalent, mostre – cu asimetrie zero sunt destul de ușor de construit, de dimensiuni mari sau mici.

Iată un exemplu pe care îl puteți trata ca un eșantion sau (împărțind frecvențele brute la 3000) ca un pmf ( valorile „x” sunt valorile luate, „n” reprezintă de câte ori apare această valoare în eșantion):

x: -2 -1 0 1 2 3 4 5 6 7 8 9 10 n: 496 498 562 1434 2 1 1 1 1 1 1 1 1 

Un grafic al funcției de masă a probabilității construit din cele de mai sus

Acest exemplu este construit f distribuții în 3 puncte:

x: -2 1 c n: c(c-1)(c+1)/6 c(c-1)(c+1)/3 - c 1 

pe diferite valori de $ c $ între 3 și 10. Acest parametru (cu $ c $) „atom în 3 puncte „are $ \ sum_i n_ix_i = 0 $ și $ \ sum_i n_ix_i ^ 3 = 0 $, ceea ce înseamnă, la rândul său, că amestecurile din diferite opțiuni de $ c $ au zero asimetrie. (Nu puteți face nimic mai mic decât o distribuție pe trei puncte care are asimetrie și al treilea moment central zero. O colecție de piese simple în doar câteva puncte, cum ar fi acestea fac blocuri de construcție îngrijite din care pot fi realizate structuri mai mari.)

Există tot felul de alți astfel de „atomi” pe care îi poți construi, dar acest exemplu folosește doar acest tip. La o combinație de atomi precum aceștia se adaugă câteva valori plasate simetric pentru a umple găurile rămase și garantează unimodalitatea fără a distruge structura momentului mediu și al treilea.

$ [1] $ Brizzi, M.(2006),
„Un model înclinat care combină caracteristici triunghiulare și exponențiale: distribuția cu două fețe și proprietățile sale statistice”
Austrian Journal of Statistics , 35 : 4, p455–462
http://www.stat.tugraz.at/AJS/ausg064/

$ [2] $ von Hippel, PT (2005),
„Mean, Median, and Skew: Correction a Textbook Rule”
Journal of Statistics Education Volumul 13, Numărul 2,
http://ww2.amstat.org/publications/jse/v13n2/vonhippel.html

Comentarii

  • Poate s-o numească ” Shark-fin ” poate?
  • @Glen_b Total Shark-fin într-adevăr.

Răspuns

Pentru o asimetrie zero, avem nevoie de $$ \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = 0 $$ sau, echivalent, $$ \ operatorname {E} \ Big [ \ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ leq \ mu \ Big] + \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ gt \ mu \ Big] = 0. $$

Acum, pentru medie și varianță date, alegeți orice două distribuții $ Y $ și $ Z $ cu masă zero în partea dreaptă a $ \ mu $ și $$ \ operatorname {E} \ Big [\ big (\ tfrac {Y- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = \ operatorname {E} \ Big [ \ big (\ tfrac {Z- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] $$ și definiți $ X $ pentru a se potrivi cu $ Y $ dacă rămâneți din $ \ mu $ și $ (\ mu – Z) $ altfel. (Nu știți notația exactă pentru acest lucru, cineva dorește să vă ajute?)

Distribuția rezultată va fi unimodală dacă PDF-urile de $ Y $ și $ Z $ cresc în stânga lui $ \ mu $ (pe lângă faptul că este zero la dreapta lui $ \ mu $).

Comentarii

  • Cum garantați că distribuția este unimodală?
  • Vă mulțumim că ați subliniat acest lucru. PDF-urile de $ Y $ și $ Z $ vor trebui să crească strict până la $ \ mu $ și apoi să cadă la zero.
  • Acesta este ideea potrivită, dar mai are nevoie de ceva lucru, deoarece $ \ sigma $ se poate schimba atunci când combinați $ Y $ și $ Z $.
  • @whuber: La naiba. Știam că a avut a fi o capcană … 🙂

Răspuns

Următoarea distribuție discretă este asimetrică și are nul asimetrie: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Am găsit-o în lucrarea lui Doric și colab., Qual Quant (2009) 43: 481 -493; DOI 10.1007 / s11135-007-9128-9

Comentarii

  • +1 Verifică și este ‘ s unimodal. Acesta este ‘ cel mai simplu exemplu posibil.

Răspuns

Sigur. Încercați acest lucru:

skew= function (x, na.rm = FALSE) { if (na.rm) x <- x[!is.na(x)] #remove missing values sum((x - mean(x))^3)/(length(x) * sd(x)^3) #calculate skew } set.seed(12929883) x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1)) skew(x) plot(density(x)) 

(Ați făcut deja lucrurile dificile!)

Comentarii

  • frumos, îmi place. +1
  • ‘ nu este bimodal … ‘ este îngrozitor multi -modal. Încercați să trasați densitatea; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
  • Datele generate în acest mod nu sunt cu siguranță unimodale. Tot ce trebuie să faceți pentru a vedea că este tăiat și lipit codul, textual. Într-adevăr, un amestec de variabile distribuite în mod normal nu va fi niciodată unimodal (cu excepția cazului în care, desigur, una dintre proporțiile amestecului este 1).
  • @Macro, că ‘ s nu este corect. A se vedea, de exemplu, rezumatul lui Roeder 1994 (JASA) pentru rezultatul binecunoscut că ” densitatea a două normale mixte nu este bimodală decât dacă mijloacele sunt separate de cel puțin 2 abateri standard „. Dacă sunt separate cu mai puțin de acest lucru, amestecul este unimodal.
  • Ai ‘ dreptate @guest. ‘ am uitat de această posibilitate când mi-am făcut postarea

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *