Quelquun peut-il offrir un exemple de distribution unimodale qui a une asymétrie de zéro mais qui nest pas symétrique?

En mai 2010, lutilisateur de Wikipédia Mcorazao a ajouté une phrase à l article sur les biais que « A la valeur zéro indique que les valeurs sont réparties de manière relativement égale des deux côtés de la moyenne, ce qui implique généralement mais pas nécessairement une distribution symétrique.  » Cependant, la page wiki na pas dexemples réels de distributions qui enfreignent cette règle. Google « exemples de distributions asymétriques avec asymétrie nulle » ne donne pas non plus dexemples réels, du moins dans les 20 premiers résultats.

En utilisant la définition selon laquelle linclinaison est calculée par $ \ nom_opérateur {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \ , \ Big] $, et la formule R

sum((x-mean(x))^3)/(length(x) * sd(x)^3) 

Je peux construire un petit , distribution arbitraire pour réduire lasymétrie. Par exemple, la distribution

x = c(1, 3.122, 5, 4, 1.1) 

donne un biais de $ -5,64947 \ cdot10 ^ {- 5} $. Mais il sagit dun petit échantillon et de plus lécart de symétrie nest pas important. Alors, est-il possible de construire une distribution plus grande avec un pic qui est hautement asymétrique mais qui a toujours une asymétrie proche de zéro?

Commentaires

  • Voulez-vous que la distribution soit unimodale ou non? Le titre le dit, mais le texte mentionne à peine ce point.
  • @Dilip Oui, je ‘ trouverait plus intéressant si la distribution était unimodale, car asymétrique , en tant que moment central, ‘ t na pas vraiment de sens autrement.

Réponse

Considérez les distributions discrètes. Une qui est prise en charge sur $ k $ valeurs $ x_1, x_2, \ ldots, x_k $ est déterminé par des probabilités non négatives $ p_1 , p_2, \ ldots, p_k $ sous réserve des conditions que (a) ils totalisent 1 et (b) le coefficient dasymétrie est égal à 0 (ce qui équivaut à ce que le troisième moment central soit nul). Cela laisse $ k-2 $ degrés de liberté (au sens de la résolution déquation, pas au sens statistique!). On peut espérer trouver des solutions unimodales.

Pour faciliter la recherche dexemples, jai cherché des solutions supportées sur un petit vecteur symétrique $ \ mathbf {x} = (- 3, -2, -1,0,1,2,3) $ avec un mode unique à $ 0 $ , moyenne nulle et zéro asymétrie. Une de ces solutions est $ (p_1, \ ldots, p_7) = (1396, 3286, 9586, 47386, 8781, 3930, 1235) / 75600 $ .

Fonction de probabilité

Vous pouvez voir quelle est asymétrique.

Voici « une solution plus manifestement asymétrique avec $ \ mathbf {x} = (-3, -1,0,1,2) $ (qui est asymétrique) et $ p = (1,18, 72, 13, 4) / 108 $ :

Fonction de probabilité 2

Ce qui se passe est maintenant évident: car la moyenne est égale à $ 0 $ , les valeurs négatives contribuent $ (- 3) ^ 3 = -27 $ et 18 $ \ fois (- 1) ^ 3 = -18 $ au troisième moment tandis que les valeurs positives contribuent 4 $ \ times 2 ^ 3 = 32 $ et 13 $ \ fois 1 ^ 3 = 13 $ , équilibrant exactement le négatif contributions. Nous pouvons prendre une distribution symétrique sur $ 0 $ , comme $ \ mathbf {x} = (- 1,0,1 ) $ avec $ \ mathbf {p} = (1,4,1) / 6 $ , et décalez un peu la masse de $ + 1 $ à $ + 2 $ , une petite masse de $ + 1 $ jusquà $ – 1 $ , et une légère quantité de masse jusquà $ – 3 $ , en conservant la moyenne à $ 0 $ et lasymétrie à $ 0 $ également, tout en créant une asymétrie . La même approche fonctionnera pour maintenir une moyenne nulle et une asymétrie nulle dune distribution continue tout en la rendant asymétrique; si nous ne sommes pas trop agressifs avec le transfert de masse, il restera unimodal.


Edit: Distributions continues

Parce que le problème ne cesse de se poser, donnons un exemple explicite avec des distributions continues. Peter Flom a eu une bonne idée: regardez les mélanges de normales. Un mélange de deux normales ne fera pas laffaire: quand son asymétrie disparaîtra, il sera symétrique. Le cas suivant le plus simple est un mélange de trois normales.

Les mélanges de trois normales, après un choix approprié de lemplacement et de léchelle, dépendent de six paramètres réels et devraient donc avoir plus de suffisamment de flexibilité pour produire une solution asymétrique et asymétrique. . Pour en trouver, il faut savoir calculer les asymétries de mélanges de normales. Parmi ceux-ci, nous rechercherons ceux qui sont unimodaux (il est possible quil ny en ait pas).

Maintenant, en général, le $ r ^ \ text {th } $ moment (non central) dune distribution normale standard est nul lorsque $ r $ est impair et sinon égal à $ 2 ^ {r / 2} \ Gamma \ left (\ frac {1-r} {2} \ right) / \ sqrt {\ pi} $ . Lorsque nous redimensionnons cette distribution normale standard pour avoir un écart type de $ \ sigma $ , le $ r ^ \ text {th } $ moment est multiplié par $ \ sigma ^ r $ . Lorsque nous décalons une distribution de $ \ mu $ , le nouveau $ r ^ \ text {th} $ moment peut être exprimé en termes de moments jusquà et y compris $ r $ . Le moment dun mélange de distributions (cest-à-dire une moyenne pondérée de celles-ci) est la même moyenne pondérée des moments individuels. Enfin, lasymétrie est nulle exactement lorsque le troisième moment central est nul, et cela est facilement calculé en fonction des trois premiers moments.

Ceci nous donne une attaque algébrique sur le problème. Une solution que jai trouvée est un mélange égal de trois normales avec des paramètres $ (\ mu, \ sigma) $ égal à $ ( 0,1) $ , $ (1 / 2,1) $ et $ (0, \ sqrt {127/18}) \ approx (0, 2.65623) $ . Sa moyenne est égale à $ (0 + 1/2 + 0) / 3 = 1/6 $ . Cette image montre le pdf en bleu et le pdf de la distribution retourné sur sa moyenne en rouge. Le fait quils diffèrent montre quils sont tous les deux asymétriques. (Le mode est denviron 0,0519216 $ , différent de la moyenne de $ 1/6 $ .) Ils ont tous deux une asymétrie nulle par construction .

Exemples continus

Les graphiques indiquent quils sont unimodaux. (Vous pouvez vérifier en utilisant Calculus pour trouver les maxima locaux.)

Commentaires

  • (+1) Réponse très simple. Cela fonctionnera-t-il avec des distributions continues? Est-ce que ‘ t le décalage ne créerait-il pas de tout petits modes? Je ne pense peut-être pas bien…
  • Vous ‘ réfléchissez assez bien, Macro: nous devrions tous être si sceptiques. Lastuce consiste à déplacer de petites quantités réparties sur de larges plages. Un test dérivé premier vous permettra de vérifier les modes possibles et fournit également la base dune preuve que suffisamment de minuscules changements de cette forme ne produiront pas de nouveaux modes.
  • Merci pour la réponse! Ceci est similaire à ce que je pensais intuitivement, même si je ne pouvais ‘ t lexprimer correctement – que vous devez  » équilibrer  » la masse de chaque côté de la distribution. Je me demande sil existe des façons stéréotypées de faire cet exercice déquilibrage.
  • Une façon, Andy, est de commencer par une solution discrète et de la convoluer avec une distribution normale. Dans ce cas, lexigence dunimodalité forcera cette distribution normale à avoir un écart type important. Même dans ce cas, si la convolution ne modifie pas sensiblement les propriétés requises (telles que lasymétrie nulle), ou si elle la modifie de manière prévisible, vous avez une poignée mathématique sur le problème. Dans un certain sens, ma récente modification peut être considérée comme une telle attaque, bien que ‘ ne soit pas strictement une convolution (car les trois normales ont des écarts types différents).
  • Jai vérifié, Andy: la convolution de la solution discrète avec une distribution normale ne change pas lasymétrie. Lorsque vous attribuez à cette distribution normale un écart type denviron 0,57 ou plus, le résultat est unimodal. Tout comme la distribution discrète sous-jacente, elle continue davoir une moyenne nulle, une asymétrie nulle et dêtre asymétrique. Mélanger cela avec une distribution normale standard équivaut à un mouvement de masse contrôlé entre la distribution normale standard et la distribution discrète: cela pourrait répondre à votre demande dun  » stéréotypé  » méthode.

Réponse

En voici une que jai trouvée à https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html # que je trouve agréable et reproduit dans R: une distribution inverse de Burr ou Dagum avec des paramètres de forme $ k = 0,0629 $ et $ c = 18.1484 $:

$$ g (x) = ckx ^ {- (c + 1)} [1 + x ^ {- c}] ^ {- (k + 1)} $$

Cela signifie 0.5387, écart type 0,2907, asymétrie 0,0000 et kurtosis 2,0000. La source lappelle également la « distribution des éléphants »: entrez la description de limage ici

Ma reproduction en R a été créée avec

 library(actuar) library(knotR) # a nonsymmetric distribution with zero skewness # see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# c <- 18.1484 k <- 0.0629 x <- seq(0,1.5,by=.0001) elephant.density <- dinvburr(x, k, c) plot(x,elephant.density, type="l") polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey") points(0.8,0.8, pch=19, cex=2) # "ears" created via https://www.desmos.com/calculator/cahqdxeshd ear.x <- c(0.686, 0.501, 0.42, 0.68) ear.y <- c(0.698, 0.315, 1.095, 0.983) myseg(bezier(cbind(ear.x, ear.y)), type="l") EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k) EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k) (skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196  

Comme le montre cette sortie, lasymétrie est pas tout à fait de zéro à quatre chiffres pour ces valeurs de paramètres. Voici un petit optimiseur pour $ k $ et $ c $:

 # optimize skewness a bit further skewval <- 1 while (skewval > 10^(-10)){ optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c) skewval <- optskew.k$f.root k <- optskew.k$root optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k) skewval <- optskew.c$f.root c <- optskew.c$root } 

donnant

> print(c) [1] 18.89306 > print(k) [1] 0.05975542 > print(skewval) [1] -1.131464e-15 

Commentaires

  • Merci pour la modification. Cela dit, je nai pas pu reproduire lasymétrie de 0,0000 à quatre chiffres, obtenant à la place 0,0001245138 (voir la prochaine édition, dans le code R).
  • On peut probablement exécuter un optimiseur simple pour trouver $ c $ et $ k $ valeurs telles que lasymétrie soit aussi proche de zéro que possible. Ce devrait être quelques lignes supplémentaires ou peut-être même une. Vous avez déjà la fonction de perte calculée analytiquement dans votre dernière ligne, y a-t-il un optimiseur générique approprié dans R?
  • En fait, 0,0003756196. 0.0001245138 était déjà après une optimisation initiale, donnée ici par erreur. Je vais jeter un œil.
  • @amoeba, jai essayé doptimiser un peu, mais je ne prétends pas avoir fait cela de manière intelligente, jai peu dexpérience avec loptimisation.
  • Lasymétrie que ‘ s de zéro à trois chiffres (presque quatre) me semblait abondante; ce ‘ nest pas comme si une valeur plus précise la rendra différente. Si l’asymétrie passe à zéro dans ce voisinage et que ‘ indique les directions dans lesquelles modifier les valeurs si plus de précision est nécessaire, je pense que ‘ s suffisant. Mais bravo pour leffort supplémentaire. (Cest ‘ un bel exemple, dailleurs.)

Réponse

Considérons une distribution sur la moitié positive de la droite réelle qui augmente linéairement de 0 au mode puis est exponentielle à droite du mode, mais continue au mode.

Cela pourrait être appelée une distribution triangulaire-exponentielle (bien quelle ressemble souvent un peu à une aileron de requin).

Soit $ \ theta $ lemplacement du mode et $ \ lambda $ le paramètre de taux du exponentielle.

Au fur et à mesure que $ \ lambda \ theta $ augmente, la distribution devient progressivement moins asymétrique. Lorsque $ \ lambda \ theta $ augmente au-delà de $ \ environ 6,15 $, le troisième moment passe du positif au négatif:

Triangulaire-Exponentielle avec asymétrie nulle

Brizzi (2006) $ ^ {[1]} $ se réfère à cette famille de distributions comme la distribution « à deux faces », et discute ce point de croisement où lasymétrie du troisième moment est nulle. von Hippel (2005) $ ^ {[2]} $ présente un exemple qui « est presque à ce point de croisement ici

Le fil Distributions non normales avec asymétrie nulle et excès de kurtosis nul? a quelques exemples asymétriques, y compris un petit exemple discret et un autre unimodal continu:

Mélange gaussien unimodal avec asymétrie nulle

Distributions unimodales discrètes – ou de manière équivalente, des échantillons – avec une asymétrie nulle sont assez faciles à construire, de grande ou petite taille.

Voici un exemple, que vous pouvez traiter comme un échantillon ou (en divisant les fréquences brutes par 3000) comme un pmf ( les valeurs « x » sont les valeurs prises, les « n » sont le nombre de fois où cette valeur apparaît dans léchantillon):

x: -2 -1 0 1 2 3 4 5 6 7 8 9 10 n: 496 498 562 1434 2 1 1 1 1 1 1 1 1 

Un graphique de la fonction de masse de probabilité construite à partir de ce qui précède

Cet exemple est construit f distributions en 3 points:

x: -2 1 c n: c(c-1)(c+1)/6 c(c-1)(c+1)/3 - c 1 

sur différentes valeurs de $ c $ entre 3 et 10. Cet atome paramétré (par $ c $) « 3 points » « a $ \ sum_i n_ix_i = 0 $ et $ \ sum_i n_ix_i ^ 3 = 0 $, ce qui signifie à son tour que les mélanges parmi divers choix de $ c $ ont une asymétrie nulle. (Vous ne pouvez rien faire de plus petit quune distribution sur trois points qui présente une asymétrie et un troisième moment central zéro. Une collection de pièces simples sur seulement quelques points, comme celles-ci, constituent des blocs de construction nets à partir desquels des structures plus grandes peuvent être faites.)

Il y a toutes sortes dautres « atomes » que lon peut construire, mais cet exemple nutilise que celui-ci. A une combinaison datomes comme ceux-ci sajoute quelques valeurs placées symétriquement pour combler les trous restants et garantir lunimodalité sans détruire la structure du moyen et du troisième moment.

$ [1] $ Brizzi, M.(2006),
« Un modèle asymétrique combinant des caractéristiques triangulaires et exponentielles: la distribution à deux faces et ses propriétés statistiques »
Journal autrichien des statistiques , 35 : 4, p455–462
http://www.stat.tugraz.at/AJS/ausg064/

$ [2] $ von Hippel, PT (2005),
« Moyenne, médiane et asymétrie: correction dune règle de manuel »
Journal of Statistics Education Volume 13, Numéro 2,
http://ww2.amstat.org/publications/jse/v13n2/vonhippel.html

Commentaires

  • Peut-être lappeler le  » Shark-fin  » peut-être?
  • @Glen_b En effet, totalement Shark-fin.

Réponse

Pour une asymétrie nulle, nous avons besoin de $$ \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = 0 $$ ou, de manière équivalente, $$ \ operatorname {E} \ Big [ \ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ leq \ mu \ Big] + \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ gt \ mu \ Big] = 0. $$

Maintenant, pour une moyenne et une variance données, choisissez deux distributions quelconques $ Y $ et $ Z $ avec une masse nulle sur le côté droit de $ \ mu $ et $$ \ operatorname {E} \ Big [\ big (\ tfrac {Y- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = \ operatorname {E} \ Big [ \ big (\ tfrac {Z- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] $$ et définissez $ X $ pour correspondre à $ Y $ si à gauche de $ \ mu $ et $ (\ mu – Z) $ sinon. (Vous ne connaissez pas la notation exacte pour cela, quelquun voudrait vous aider?)

La distribution résultante sera unimodale si les PDF de $ Y $ et $ Z $ augmentent à gauche de $ \ mu $ (en plus dêtre zéro à droite de $ \ mu $).

Commentaires

  • Comment garantissez-vous que la distribution est unimodale?
  • Merci de lavoir signalé. Les fichiers PDF de $ Y $ et $ Z $ devront être strictement croissants jusquà $ \ mu $, puis tomber à zéro.
  • Cest la bonne idée, mais il faut encore du travail, car $ \ sigma $ peut changer en combinant $ Y $ et $ Z $.
  • @whuber: Merde. Je savais que avait être un piège … 🙂

Réponse

La distribution discrète suivante est asymétrique et a null asymétrie: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1 / 6. Je lai trouvé dans larticle de Doric et al., Qual Quant (2009) 43: 481 -493; DOI 10.1007 / s11135-007-9128-9

Commentaires

  • +1 Il vérifie et il est unimodal ‘. Cest ‘ lexemple le plus simple possible.

Réponse

Sûr. Essayez ceci:

skew= function (x, na.rm = FALSE) { if (na.rm) x <- x[!is.na(x)] #remove missing values sum((x - mean(x))^3)/(length(x) * sd(x)^3) #calculate skew } set.seed(12929883) x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1)) skew(x) plot(density(x)) 

(Vous avez déjà fait les choses difficiles!)

Commentaires

  • sympa, jaime ça. +1
  • Il ‘ nest pas bimodal … il ‘ est horriblement multi -modale. Essayez de tracer la densité; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
  • Les données générées de cette manière ne sont certainement pas unimodales. Tout ce que vous avez à faire pour voir cela est de copier-coller votre code, mot pour mot. En effet, un mélange de variables normalement distribuées ne sera jamais unimodal (à moins bien sûr que l’une des proportions du mélange soit 1).
  • @Macro, que ‘ s Pas correcte. Voir, par exemple, le résumé de Roeder 1994 (JASA) pour le résultat bien connu que  » la densité de deux normales mixtes nest pas bimodale à moins que les moyennes ne soient séparées par au moins 2 écarts types « . Sils sont séparés par moins que cela, le mélange est unimodal.
  • Vous ‘ avez raison @guest. Jai ‘ oublié cette possibilité lorsque jai publié mon message

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *