Kann jemand ein Beispiel für eine unimodale Verteilung anbieten, die eine Schiefe von Null hat, aber nicht symmetrisch ist?

Question

Im Mai 2010 fügte der Wikipedia-Benutzer Mcorazao dem Skewness-Artikel einen Satz hinzu, der besagt, dass „A. Der Wert Null zeigt an, dass die Werte auf beiden Seiten des Mittelwerts relativ gleichmäßig verteilt sind, was typischerweise, aber nicht notwendigerweise eine symmetrische Verteilung impliziert. “ Die Wiki-Seite enthält jedoch keine tatsächlichen Beispiele für Distributionen, die gegen diese Regel verstoßen. Das Googeln „Beispiel für asymmetrische Verteilungen ohne Schiefe“ liefert zumindest in den ersten 20 Ergebnissen auch keine wirklichen Beispiele.

Verwenden Sie die Definition, dass der Versatz durch $ \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \ berechnet wird , \ Big] $ und die R-Formel

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

Ich kann eine kleine erstellen willkürliche Verteilung, um die Schiefe niedrig zu machen. Beispielsweise ergibt die Verteilung

x = c(1, 3.122, 5, 4, 1.1)

einen Versatz von $ -5.64947 \ cdot10 ^ {- 5} $. Dies ist jedoch eine kleine Stichprobe, und außerdem ist die Abweichung von der Symmetrie nicht groß. Ist es also möglich, eine größere Verteilung mit einem Peak zu konstruieren, der stark asymmetrisch ist, aber dennoch eine Schiefe von nahezu Null aufweist?

Kommentare

Möchten Sie, dass die Verteilung unimodal ist oder nicht? Der Titel sagt es, aber der Text erwähnt diesen Punkt kaum.
@Dilip Ja, ich ‚ würde es interessanter finden, wenn die Verteilung unimodal wäre, da die Schiefe Als zentraler Moment macht ‚ sonst keinen Sinn.

Answer 1

Hier ist eine, die ich unter https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html # finde ich schön und reproduziert in R: eine inverse Burr- oder Dagum-Verteilung mit Formparametern $ k = 0.0629 $ und $ c = 18.1484 $:

$$ g (x) = ckx ^ {- (c + 1)} [1 + x ^ {- c}] ^ {- (k + 1)} $$

Es hat den Mittelwert 0.5387, Standardabweichung 0,2907, Schiefe 0,0000 und Kurtosis 2,0000. Die Quelle nennt es auch „Elefantenverteilung“:

Meine Reproduktion in R wurde mit

 library(actuar) library(knotR) # a nonsymmetric distribution with zero skewness # see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# c <- 18.1484 k <- 0.0629 x <- seq(0,1.5,by=.0001) elephant.density <- dinvburr(x, k, c) plot(x,elephant.density, type="l") polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey") points(0.8,0.8, pch=19, cex=2) # "ears" created via https://www.desmos.com/calculator/cahqdxeshd ear.x <- c(0.686, 0.501, 0.42, 0.68) ear.y <- c(0.698, 0.315, 1.095, 0.983) myseg(bezier(cbind(ear.x, ear.y)), type="l") EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k) EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k) (skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

erstellt. Wie diese Ausgabe zeigt, ist die Schiefe nicht ganz null bis vier Stellen für diese Parameterwerte. Hier ist ein kleiner Optimierer für $ k $ und $ c $:

 # optimize skewness a bit further skewval <- 1 while (skewval > 10^(-10)){ optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c) skewval <- optskew.k$f.root k <- optskew.k$root optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k) skewval <- optskew.c$f.root c <- optskew.c$root }

ergibt

> print(c) [1] 18.89306 > print(k) [1] 0.05975542 > print(skewval) [1] -1.131464e-15

Kommentare

Vielen Dank für die Bearbeitung. Trotzdem konnte ich die Schiefe von 0,0000 bis vier Ziffern nicht reproduzieren und erhielt stattdessen 0,0001245138 (siehe nächste Bearbeitung im R-Code).
Man kann wahrscheinlich einen einfachen Optimierer ausführen, um $ c $ und $ zu finden k $ -Werte so, dass die Schiefe so nahe wie möglich bei Null liegt. Es sollten ein paar zusätzliche Zeilen oder vielleicht sogar eine sein. Sie haben die Verlustfunktion bereits in Ihrer letzten Zeile analytisch berechnet. Gibt es einen geeigneten generischen Optimierer in R?
Tatsächlich 0,0003756196. 0,0001245138 wurde bereits nach einer anfänglichen Optimierung hier versehentlich angegeben. Ich werde einen Blick darauf werfen.
@amoeba, ich habe versucht, ein bisschen zu optimieren, aber ich behaupte nicht, dass ich das auf clevere Weise getan habe. Ich habe wenig Erfahrung mit Optimierung.
Die Schiefe, dass ‚ null bis drei Ziffern (fast vier) hat, war für mich ausreichend; ‚ Wenn kein genauerer Wert vorliegt, sieht es anders aus. Wenn die Schiefe in dieser Umgebung Null überschreitet und ‚ klar ist, in welche Richtungen die Werte angepasst werden müssen, wenn mehr Genauigkeit erforderlich ist, gehe ich davon aus, dass ‚ s ausreichend. Aber ein großes Lob für den zusätzlichen Aufwand. (Es ist übrigens ‚ ein schönes Beispiel.)

Answer 2

Betrachten Sie eine Verteilung auf der positiven Hälfte der realen Linie, die linear von 0 zum Modus ansteigt und dann rechts vom Modus exponentiell ist, im Modus jedoch kontinuierlich ist.

Dies könnte der Fall sein wird als dreieckig-exponentielle Verteilung bezeichnet (obwohl sie oft ein bisschen wie eine Haifischflosse aussieht).

Sei $ \ theta $ der Ort des Modus und $ \ lambda $ der Ratenparameter des exponentiell.

Wenn $ \ lambda \ theta $ zunimmt, wird die Verteilung zunehmend weniger schief. Wenn $ \ lambda \ theta $ über $ \ ca. 6,15 $ hinaus ansteigt, wechselt der dritte Moment von positiv zu negativ:

Brizzi (2006) $ ^ {[1]} $ bezeichnet diese Verteilungsfamilie als „Zwei-Seiten“ -Verteilung und diskutiert Dieser Überkreuzungspunkt, an dem die Schiefe des dritten Moments Null ist. von Hippel (2005) $ ^ {[2]} $ präsentiert ein Beispiel, das sich fast an diesem Kreuzungspunkt befindet hier

Der Thread Nicht normale Verteilungen mit null Schiefe und null überschüssiger Kurtosis? enthält einige asymmetrische Beispiele, darunter ein kleines diskretes Beispiel und ein weiteres kontinuierliches unimodales Beispiel:

Diskrete unimodale Verteilungen – oder gleichwertige Stichproben – ohne Schiefe sind recht einfach zu konstruieren, von großer oder kleiner Größe.

Hier ist ein Beispiel, das Sie als Probe oder (durch Teilen der Rohfrequenzen durch 3000) als pmf ( Die „x“ -Werte sind die genommenen Werte, die „n“ sind die Häufigkeit, mit der dieser Wert in der Stichprobe vorkommt.)

x: -2 -1 0 1 2 3 4 5 6 7 8 9 10 n: 496 498 562 1434 2 1 1 1 1 1 1 1 1

erstellt wurde. Dieses Beispiel ist f aufgebaut von 3-Punkt-Verteilungen:

x: -2 1 c n: c(c-1)(c+1)/6 c(c-1)(c+1)/3 - c 1

über verschiedene Werte von $ c $ zwischen 3 und 10. Dieses parametrisierte (um $ c $) 3-Punkt-Atom „hat $ \ sum_i n_ix_i = 0 $ und $ \ sum_i n_ix_i ^ 3 = 0 $, was wiederum bedeutet, dass Mischungen über verschiedene Auswahlmöglichkeiten von $ c $ keine Schiefe haben. (Sie können nichts kleiner machen als eine Verteilung auf drei Punkte mit Asymmetrie und drittem zentralen Moment Null. Eine Sammlung einfacher Teile über nur wenige Punkte, wie diese, bilden ordentliche Bausteine, aus denen größere Strukturen hergestellt werden können.)

Es gibt alle Arten anderer solcher „Atome“, die man konstruieren kann, aber dieses Beispiel verwendet nur diese eine Art. Zu einer Kombination von Atomen wie diesen werden einige symmetrisch platzierte Werte hinzugefügt, um verbleibende Löcher zu füllen und Unimodalität garantieren, ohne die Struktur des Mittelwerts und des dritten Moments zu zerstören.

$ [1] $ Brizzi, M.(2006),
„Ein verzerrtes Modell, das dreieckige und exponentielle Merkmale kombiniert: Die zweiseitige Verteilung und ihre statistischen Eigenschaften“
Austrian Journal of Statistics , 35 : 4, p455–462
http://www.stat.tugraz.at/AJS/ausg064/

$ [2] $ von Hippel, PT (2005),
„Mittelwert, Median und Versatz: Korrektur einer Lehrbuchregel“
Journal of Statistics Education Volume 13, Nummer 2,
http://ww2.amstat.org/publications/jse/v13n2/vonhippel.html

Kommentare

Könnte man es vielleicht “ Haifischflosse “ nennen?
@Glen_b In der Tat total Haifischflosse.

Answer 3

Für eine Schiefe von Null benötigen wir $$ \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = 0 $$ oder gleichwertig $$ \ operatorname {E} \ Big [ \ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ leq \ mu \ Big] + \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ gt \ mu \ Big] = 0. $$

Wählen Sie nun für den gegebenen Mittelwert und die gegebene Varianz zwei beliebige Verteilungen $ Y $ und $ Z $ mit der Masse Null auf der rechten Seite von $ \ mu aus $ und $$ \ operatorname {E} \ Big [\ big (\ tfrac {Y- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = \ operatorname {E} \ Big [ \ big (\ tfrac {Z- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] $$ und definiere $ X $ so, dass es mit $ Y $ übereinstimmt, wenn $ \ mu $ und $ übrig bleiben (\ mu – Z) $ sonst. (Sie kennen die genaue Notation dafür nicht, jemand möchte helfen?)

Die resultierende Verteilung ist unimodal, wenn die PDF-Dateien von $ Y $ und $ Z $ links von $ \ mu zunehmen $ (zusätzlich zu Null rechts von $ \ mu $).

Kommentare

Wie garantieren Sie, dass die Verteilung unimodal ist?
Vielen Dank, dass Sie darauf hingewiesen haben. Die PDFs von $ Y $ und $ Z $ müssen bis $ \ mu $ streng erhöht und dann auf Null fallen.
Dies ist Die richtige Idee, aber es muss noch etwas gearbeitet werden, da sich $ \ sigma $ ändern kann, wenn $ Y $ und $ Z $ kombiniert werden.
@whuber: Verdammt. Ich wusste, dass dort war um eine Falle zu sein … 🙂

Answer 4

Die folgende diskrete Verteilung ist asymmetrisch und hat null Schiefe: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Ich fand es in der Arbeit von Doric et al., Qual Quant (2009) 43: 481 -493; DOI 10.1007 / s11135-007-9128-9

Kommentare

+1 Es wird ausgecheckt und es ‚ ist unimodal. Dies ist ‚ das einfachste Beispiel.

Answer 5

Sicher. Versuchen Sie Folgendes:

skew= function (x, na.rm = FALSE) { if (na.rm) x <- x[!is.na(x)] #remove missing values sum((x - mean(x))^3)/(length(x) * sd(x)^3) #calculate skew } set.seed(12929883) x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1)) skew(x) plot(density(x))

(Sie haben die harten Sachen bereits gemacht!)

Kommentare

schön, ich mag es. +1
Es ist ‚ nicht bimodal … es ‚ ist schrecklich multi -modal. Versuchen Sie, die Dichte zu zeichnen. curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
Auf diese Weise generierte Daten sind sicherlich nicht unimodal. Alles, was Sie tun müssen, um dies zu sehen, ist, Ihren Code wörtlich auszuschneiden und einzufügen. In der Tat wird eine Mischung normalverteilter Variablen niemals unimodal sein (es sei denn natürlich, eines der Mischungsverhältnisse ist 1).
@Macro, das ‚ s nicht richtig. Siehe zum Beispiel die Zusammenfassung von Roeder 1994 (JASA) für das bekannte Ergebnis, dass “ die Dichte zweier gemischter Normalen nicht bimodal ist, es sei denn, die Mittelwerte sind durch mindestens 2 getrennt Standardabweichungen „. Wenn sie durch weniger getrennt sind, ist die Mischung unimodal.
Sie ‚ haben Recht @guest. Ich ‚ hatte diese Möglichkeit vergessen, als ich meinen Beitrag

Kann jemand ein Beispiel für eine unimodale Verteilung anbieten, die eine Schiefe von Null hat, aber nicht symmetrisch ist?

Kommentare

Antwort

Bearbeiten: Kontinuierliche Verteilungen

Kommentare

Antwort

Kommentare

Antwort

Kommentare

Antwort

Kommentare

Antwort

Kommentare

Antwort

Kommentare

Schreibe einen Kommentar Antworten abbrechen