¿Alguien puede ofrecer un ejemplo de distribución unimodal que tenga una asimetría de cero pero que no sea simétrica?

En mayo de 2010, el usuario de Wikipedia Mcorazao agregó una oración al artículo de asimetría que «A el valor cero indica que los valores están distribuidos de manera relativamente uniforme a ambos lados de la media, lo que normalmente, pero no necesariamente, implica una distribución simétrica «. Sin embargo, la página wiki no tiene ejemplos reales de distribuciones que rompan esta regla. Buscar en Google «ejemplos de distribuciones asimétricas con asimetría cero» tampoco da ejemplos reales, al menos en los primeros 20 resultados.

Usando la definición de que el sesgo se calcula mediante $ \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \ , \ Big] $ y la fórmula R

sum((x-mean(x))^3)/(length(x) * sd(x)^3) 

Puedo construir una pequeña , distribución arbitraria para reducir la asimetría. Por ejemplo, la distribución

x = c(1, 3.122, 5, 4, 1.1) 

produce un sesgo de $ -5.64947 \ cdot10 ^ {- 5} $. Pero esta es una muestra pequeña y, además, la desviación de la simetría no es grande. Entonces, ¿es posible construir una distribución más grande con un pico que sea altamente asimétrico pero que aún tenga una asimetría cercana a cero?

Comentarios

  • ¿Quieres que la distribución sea unimodal o no? El título lo dice, pero el texto apenas menciona este punto.
  • @Dilip Sí, ‘ me parecería más interesante si la distribución fuera unimodal, ya que la asimetría , como momento central, no ‘ realmente tiene sentido de otra manera.

Respuesta

Considere distribuciones discretas. Una que sea compatible con $ k $ valores $ x_1, x_2, \ ldots, x_k $ está determinado por probabilidades no negativas $ p_1 , p_2, \ ldots, p_k $ sujeto a las condiciones de que (a) suman 1 y (b) el coeficiente de asimetría es igual a 0 (que es equivalente a que el tercer momento central sea cero). Eso deja $ k-2 $ grados de libertad (en el sentido de resolución de ecuaciones, ¡no en el estadístico!). Podemos esperar encontrar soluciones que sean unimodales.

Para facilitar la búsqueda de ejemplos, busqué soluciones compatibles con un pequeño vector simétrico $ \ mathbf {x} = (- 3, -2, -1,0,1,2,3) $ con un modo único en $ 0 $ , media cero y asimetría cero. Una de esas soluciones es $ (p_1, \ ldots, p_7) = (1396, 3286, 9586, 47386, 8781, 3930, 1235) / 75600 $ .

Función de probabilidad

Puede ver que es asimétrica.

Aquí hay una solución más obviamente asimétrica con $ \ mathbf {x} = (-3, -1,0,1,2) $ (que es asimétrico) y $ p = (1,18, 72, 13, 4) / 108 $ :

Función de probabilidad 2

Ahora es obvio lo que está pasando: porque la media es igual a $ 0 $ , los valores negativos contribuyen $ (- 3) ^ 3 = -27 $ y $ 18 \ times (- 1) ^ 3 = -18 $ hasta el tercer momento, mientras que los valores positivos contribuyen $ 4 \ times 2 ^ 3 = 32 $ y $ 13 \ times 1 ^ 3 = 13 $ , equilibrando exactamente lo negativo contribuciones. Podemos tomar una distribución simétrica de $ 0 $ , como $ \ mathbf {x} = (- 1,0,1 ) $ con $ \ mathbf {p} = (1,4,1) / 6 $ , y cambie un poco la masa de $ + 1 $ a $ + 2 $ , una pequeña masa de $ + 1 $ hasta $ – 1 $ , y una pequeña cantidad de masa hasta $ – 3 $ , manteniendo la media en $ 0 $ y la asimetría en $ 0 $ también, mientras se crea una asimetría . El mismo enfoque funcionará para mantener una media cero y una asimetría cero de una distribución continua mientras la hace asimétrica; si no somos demasiado agresivos con el cambio de masa, seguirá siendo unimodal.


Editar: Distribuciones continuas

Debido a que el problema sigue surgiendo, vamos a dar un ejemplo explícito con distribuciones continuas. Peter Flom tuvo una buena idea: observe las mezclas de normales. Una mezcla de dos normales no sirve: cuando su asimetría desaparezca, será simétrica. El siguiente caso más simple es una mezcla de tres normales.

Las mezclas de tres normales, después de una elección adecuada de ubicación y escala, dependen de seis parámetros reales y, por lo tanto, deberían tener una flexibilidad más que suficiente para producir una solución asimétrica con cero sesgos. . Para encontrar algunos, necesitamos saber cómo calcular las asimetrías de mezclas de normales. Entre estos, buscaremos cualquiera que sea unimodal (es posible que no haya ninguno).

Ahora, en general, el $ r ^ \ text {th } $ (no central) momento de una distribución normal estándar es cero cuando $ r $ es impar y de lo contrario es igual a $ 2 ^ {r / 2} \ Gamma \ left (\ frac {1-r} {2} \ right) / \ sqrt {\ pi} $ . Cuando cambiamos la escala de esa distribución normal estándar para tener una desviación estándar de $ \ sigma $ , el $ r ^ \ text {th } $ momento se multiplica por $ \ sigma ^ r $ . Cuando cambiamos cualquier distribución por $ \ mu $ , el nuevo $ r ^ \ text {th} $ El momento se puede expresar en términos de momentos hasta $ r $ inclusive. El momento de una mezcla de distribuciones (es decir, un promedio ponderado de ellas) es el mismo promedio ponderado de los momentos individuales. Finalmente, la asimetría es cero exactamente cuando el tercer momento central es cero, y esto se calcula fácilmente en términos de los primeros tres momentos.

Esto nos da un ataque algebraico al problema. Una solución que encontré es una mezcla igual de tres normales con parámetros $ (\ mu, \ sigma) $ igual a $ ( 0,1) $ , $ (1 / 2,1) $ y $ (0, \ sqrt {127/18}) \ approx (0, 2.65623) $ . Su media es igual a $ (0 + 1/2 + 0) / 3 = 1/6 $ . Esta imagen muestra el pdf en azul y el pdf de la distribución volteado sobre su media en rojo. Que difieran demuestra que ambos son asimétricos. (El modo es aproximadamente $ 0.0519216 $ , diferente a la media de $ 1/6 $ .) Ambos tienen cero asimetría por construcción .

Ejemplos continuos

Los gráficos indican que estos son unimodales. (Puede verificar usando Cálculo para encontrar máximos locales.)

Comentarios

  • (+1) Respuesta muy hábil. Sin embargo, ¿funcionará esto con distribuciones continuas? ¿No ‘ el cambio crearía potencialmente pequeños modos? Puede que no esté pensando con claridad …
  • Tú ‘ estás pensando bastante bien, Macro: todos deberíamos ser muy escépticos. El truco consiste en cambiar pequeñas cantidades repartidas en amplios rangos. Una prueba de primera derivada le permitirá verificar posibles modos y también proporcionará la base para una prueba de que cambios suficientemente pequeños de esta forma no producirán nuevos modos.
  • ¡Gracias por la respuesta! Esto es similar a lo que estaba pensando intuitivamente, aunque no pude ‘ t expresarlo bien en palabras: tienes que » equilibrar » la masa a cada lado de la distribución. Me hace preguntarme si hay formas estereotipadas en las que uno puede realizar este acto de equilibrio.
  • Una forma, Andy, es comenzar con una solución discreta y luego convertirla en una distribución normal. En este caso, el requisito de unimodalidad obligará a que la distribución normal tenga una gran desviación estándar. Aun así, si la convolución no cambia apreciablemente las propiedades requeridas (como la asimetría cero), o las cambia de manera predecible, usted tiene un control matemático del problema. En cierto sentido, mi edición reciente puede verse como un ataque, aunque ‘ no es estrictamente una convolución (porque las tres normales tienen diferentes desviaciones estándar).
  • He comprobado, Andy: convolucionar la solución discreta con una distribución normal no cambia la asimetría. Cuando le da a esa distribución normal una desviación estándar de alrededor de 0.57 o más, el resultado es unimodal. Al igual que la distribución discreta subyacente, sigue teniendo una media cero, una asimetría cero y es asimétrica. Mezclar esto con una distribución normal estándar equivale a un movimiento controlado de masa entre la distribución normal estándar y la discreta: eso podría satisfacer su solicitud de un » estereotipado » método.

Respuesta

Aquí hay uno que encontré en https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html # que encuentro agradable y reproducido en R: una distribución inversa de Burr o Dagum con parámetros de forma $ k = 0.0629 $ y $ c = 18.1484 $:

$$ g (x) = ckx ^ {- (c + 1)} [1 + x ^ {- c}] ^ {- (k + 1)} $$

Tiene media 0.5387, desviación estándar 0.2907, asimetría 0.0000 y curtosis 2.0000. La fuente también la llama «distribución de elefante»: ingrese la descripción de la imagen aquí

Mi reproducción en R se creó con

 library(actuar) library(knotR) # a nonsymmetric distribution with zero skewness # see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# c <- 18.1484 k <- 0.0629 x <- seq(0,1.5,by=.0001) elephant.density <- dinvburr(x, k, c) plot(x,elephant.density, type="l") polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey") points(0.8,0.8, pch=19, cex=2) # "ears" created via https://www.desmos.com/calculator/cahqdxeshd ear.x <- c(0.686, 0.501, 0.42, 0.68) ear.y <- c(0.698, 0.315, 1.095, 0.983) myseg(bezier(cbind(ear.x, ear.y)), type="l") EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k) EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k) (skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196  

Como muestra este resultado, la asimetría es no del cero a cuatro dígitos para estos valores de parámetro. Aquí hay un pequeño optimizador para $ k $ y $ c $:

 # optimize skewness a bit further skewval <- 1 while (skewval > 10^(-10)){ optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c) skewval <- optskew.k$f.root k <- optskew.k$root optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k) skewval <- optskew.c$f.root c <- optskew.c$root } 

produciendo

> print(c) [1] 18.89306 > print(k) [1] 0.05975542 > print(skewval) [1] -1.131464e-15 

Comentarios

  • Gracias por la edición. Dicho esto, no pude reproducir el sesgo de 0.0000 a cuatro dígitos, obteniendo 0.0001245138 en su lugar (vea la siguiente edición, en el código R).
  • Uno probablemente pueda ejecutar un optimizador simple para encontrar $ c $ y $ k $ valores tales que la asimetría sea lo más cercana a cero posible. Debería haber un par de líneas adicionales o quizás incluso una. Ya tiene la función de pérdida calculada analíticamente en su última línea, ¿hay un optimizador genérico adecuado en R?
  • En realidad, 0.0003756196. 0.0001245138 ya fue después de una optimización inicial, dada aquí por error. Voy a echar un vistazo.
  • @amoeba, intenté optimizar un poco, pero no pretendo haberlo hecho de una manera inteligente, tengo poca experiencia con la optimización.
  • La asimetría de que ‘ s de cero a tres dígitos (casi cuatro) era suficiente para mi mente; ‘ s no es como si un valor más preciso lo hiciera lucir diferente. Si la asimetría cruza cero en esa vecindad y ‘ está claro en qué direcciones ajustar los valores si se necesita más precisión, calculo que ‘ s suficiente. Pero felicitaciones por el esfuerzo adicional. (Por cierto, ‘ es un ejemplo encantador).

Respuesta

Considere una distribución en la mitad positiva de la línea real que aumenta linealmente desde 0 hasta el modo y luego es exponencial a la derecha del modo, pero es continua en el modo.

Esto podría llamarse una distribución triangular-exponencial (aunque a menudo se parece un poco a una aleta de tiburón).

Sea $ \ theta $ la ubicación del modo y $ \ lambda $ el parámetro de tasa de exponencial.

A medida que $ \ lambda \ theta $ aumenta, la distribución se vuelve progresivamente menos sesgada. A medida que $ \ lambda \ theta $ aumenta más allá de $ \ approx 6.15 $, el tercer momento pasa de positivo a negativo:

Triangular-exponencial con asimetría cero

Brizzi (2006) $ ^ {[1]} $ se refiere a esta familia de distribuciones como la distribución de «dos caras», y analiza este punto de cruce donde la asimetría del tercer momento es cero. von Hippel (2005) $ ^ {[2]} $ presenta un ejemplo que «está casi en ese punto de cruce aquí

El hilo ¿Distribuciones no normales con asimetría cero y curtosis en exceso cero? tiene algunos ejemplos asimétricos, incluido un pequeño ejemplo discreto y otro unimodal continuo:

Mezcla gaussiana unimodal con asimetría cero

Distribuciones unimodales discretas – o equivalentemente, muestras – con asimetría cero son bastante fáciles de construir, de tamaño grande o pequeño.

Aquí tienes un ejemplo, que puedes tratar como una muestra o (dividiendo las frecuencias crudas por 3000) como un pmf ( los valores «x» son los valores tomados, la «n» es el número de veces que ese valor aparece en la muestra):

x: -2 -1 0 1 2 3 4 5 6 7 8 9 10 n: 496 498 562 1434 2 1 1 1 1 1 1 1 1 

Una gráfica de la función de masa de probabilidad construida a partir de lo anterior

Este ejemplo se construye f Rom distribuciones de 3 puntos:

x: -2 1 c n: c(c-1)(c+1)/6 c(c-1)(c+1)/3 - c 1 

a través de varios valores de $ c $ entre 3 y 10. Esto parametrizado (por $ c $) 3-point «atom «tiene $ \ sum_i n_ix_i = 0 $ y $ \ sum_i n_ix_i ^ 3 = 0 $, lo que a su vez significa que las mezclas en varias opciones de $ c $ tienen un sesgo cero. (No se puede hacer nada más pequeño que una distribución en tres puntos que tenga asimetría y un tercer momento central cero. Una colección de piezas simples en solo unos pocos puntos, como estas, forman bloques de construcción ordenados a partir de los cuales se pueden hacer estructuras más grandes).

Hay todo tipo de otros «átomos» que se pueden construir, pero este ejemplo usa solo este tipo. A alguna combinación de átomos como estos se agregan algunos valores colocados simétricamente para llenar los huecos restantes y garantizar la unimodalidad sin destruir la estructura de media y tercer momento.

$ [1] $ Brizzi, M.(2006),
«Un modelo sesgado que combina características triangulares y exponenciales: la distribución de dos caras y sus propiedades estadísticas»
Austrian Journal of Statistics , 35 : 4, p455–462
http://www.stat.tugraz.at/AJS/ausg064/

$ [2] $ von Hippel, PT (2005),
«Media, mediana y sesgo: corrección de una regla de libro de texto»
Journal of Statistics Education Volumen 13, Número 2,
http://ww2.amstat.org/publications/jse/v13n2/vonhippel.html

Comentarios

  • ¿Quizás podría llamarlo » Shark-fin » quizás?
  • @Glen_b Totalmente aleta de tiburón de hecho.

Respuesta

Para una asimetría cero, necesitamos $$ \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = 0 $$ o, equivalentemente, $$ \ operatorname {E} \ Big [ \ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ leq \ mu \ Big] + \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ gt \ mu \ Big] = 0. $$

Ahora, para la media y la varianza dadas, elija dos distribuciones $ Y $ y $ Z $ con masa cero en el lado derecho de $ \ mu $ y $$ \ operatorname {E} \ Big [\ big (\ tfrac {Y- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = \ operatorname {E} \ Big [ \ big (\ tfrac {Z- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] $$ y defina $ X $ para que coincida con $ Y $ si quedan $ \ mu $ y $ (\ mu – Z) $ de lo contrario. (No conoces la notación exacta para esto, ¿alguien quiere ayudar?)

La distribución resultante será unimodal si los PDF de $ Y $ y $ Z $ aumentan a la izquierda de $ \ mu $ (además de ser cero a la derecha de $ \ mu $).

Comentarios

  • ¿Cómo se garantiza que la distribución sea unimodal?
  • Gracias por señalar esto. Los PDF de $ Y $ y $ Z $ tendrán que aumentar estrictamente hasta $ \ mu $, y luego bajar a cero.
  • Esto es la idea correcta, pero todavía necesita algo de trabajo, porque $ \ sigma $ puede cambiar al combinar $ Y $ y $ Z $.
  • @whuber: Maldita sea. Sabía que había había ser una trampa … 🙂

Respuesta

La siguiente distribución discreta es asimétrica y tiene un valor nulo asimetría: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Lo encontré en el artículo de Doric et al., Qual Quant (2009) 43: 481 -493; DOI 10.1007 / s11135-007-9128-9

Comentarios

  • +1 Verifica y es ‘ es unimodal. Ese ‘ es el ejemplo más simple posible.

Respuesta

Por supuesto. Prueba esto:

skew= function (x, na.rm = FALSE) { if (na.rm) x <- x[!is.na(x)] #remove missing values sum((x - mean(x))^3)/(length(x) * sd(x)^3) #calculate skew } set.seed(12929883) x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1)) skew(x) plot(density(x)) 

(¡Ya hiciste las cosas difíciles!)

Comentarios

  • bonito, me gusta. +1
  • Es ‘ no bimodal … es ‘ horriblemente multi -modal. Intente trazar la densidad; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
  • Los datos generados de esta manera ciertamente no son unimodales. Todo lo que necesita hacer para verlo es cortar y pegar su código, literalmente. De hecho, una mezcla de variables distribuidas normalmente nunca será unimodal (a menos que, por supuesto, una de las proporciones de la mezcla sea 1).
  • @Macro, eso ‘ s incorrecto. Véase, por ejemplo, el resumen de Roeder 1994 (JASA) para el conocido resultado de que » la densidad de dos normales mixtas no es bimodal a menos que las medias estén separadas por al menos 2 desviaciones estándar «. Si están separados por menos de esto, la mezcla es unimodal.
  • Usted ‘ tiene razón @guest. ‘ me había olvidado de esa posibilidad cuando hice mi publicación

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *