Im Mai 2010 fügte der Wikipedia-Benutzer Mcorazao dem Skewness-Artikel einen Satz hinzu, der besagt, dass „A. Der Wert Null zeigt an, dass die Werte auf beiden Seiten des Mittelwerts relativ gleichmäßig verteilt sind, was typischerweise, aber nicht notwendigerweise eine symmetrische Verteilung impliziert. “ Die Wiki-Seite enthält jedoch keine tatsächlichen Beispiele für Distributionen, die gegen diese Regel verstoßen. Das Googeln „Beispiel für asymmetrische Verteilungen ohne Schiefe“ liefert zumindest in den ersten 20 Ergebnissen auch keine wirklichen Beispiele.
Verwenden Sie die Definition, dass der Versatz durch $ \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \ berechnet wird , \ Big] $ und die R-Formel
sum((x-mean(x))^3)/(length(x) * sd(x)^3)
Ich kann eine kleine erstellen willkürliche Verteilung, um die Schiefe niedrig zu machen. Beispielsweise ergibt die Verteilung
x = c(1, 3.122, 5, 4, 1.1)
einen Versatz von $ -5.64947 \ cdot10 ^ {- 5} $. Dies ist jedoch eine kleine Stichprobe, und außerdem ist die Abweichung von der Symmetrie nicht groß. Ist es also möglich, eine größere Verteilung mit einem Peak zu konstruieren, der stark asymmetrisch ist, aber dennoch eine Schiefe von nahezu Null aufweist?
Kommentare
- Möchten Sie, dass die Verteilung unimodal ist oder nicht? Der Titel sagt es, aber der Text erwähnt diesen Punkt kaum.
- @Dilip Ja, ich ‚ würde es interessanter finden, wenn die Verteilung unimodal wäre, da die Schiefe Als zentraler Moment macht ‚ sonst keinen Sinn.
Antwort
Berücksichtigen Sie diskrete Verteilungen. Eine, die von $ unterstützt wird k $ -Werte $ x_1, x_2, \ ldots, x_k $ wird durch nicht negative Wahrscheinlichkeiten $ p_1 bestimmt , p_2, \ ldots, p_k $ unter den Bedingungen, dass (a) sie zu 1 summieren und (b) der Skewness-Koeffizient gleich 0 ist (was entspricht, dass das dritte zentrale Moment Null ist). Damit bleiben $ k-2 $ Freiheitsgrade (im Sinne der Gleichungslösung nicht der statistische!). Wir können hoffen, unimodale Lösungen zu finden.
Um die Suche nach Beispielen zu vereinfachen, habe ich nach Lösungen gesucht, die auf einem kleinen symmetrischen Vektor $ \ mathbf {x} unterstützt werden = (- 3, -2, -1,0,1,2,3) $ mit einem eindeutigen Modus bei $ 0 $ , Mittelwert Null und Null Schiefe. Eine solche Lösung ist $ (p_1, \ ldots, p_7) = (1396, 3286, 9586, 47386, 8781, 3930, 1235) / 75600 $ . P. >
Sie können sehen, dass sie asymmetrisch ist.
Hier ist eine offensichtlich asymmetrische Lösung mit $ \ mathbf {x} = (-3, -1,0,1,2) $ (asymmetrisch) und $ p = (1,18, 72, 13, 4) / 108 $ :
Jetzt ist klar, was los ist: , weil der Mittelwert gleich $ 0 $ ist , die negativen Werte tragen $ (- 3) ^ 3 = -27 $ und $ 18 \ times (- bei 1) ^ 3 = -18 $ bis zum dritten Moment, während die positiven Werte $ 4 \ times 2 ^ 3 = 32 $ und $ 13 \ times 1 ^ 3 = 13 $ , wobei das Negativ genau ausgeglichen wird Beiträge. Wir können eine symmetrische Verteilung über $ 0 $ vornehmen, z. B. $ \ mathbf {x} = (- 1,0,1 ) $ mit $ \ mathbf {p} = (1,4,1) / 6 $ und verschiebe eine kleine Masse von $ + 1 $ bis $ + 2 $ , eine kleine Masse aus $ + 1 $ bis $ – 1 $ und eine geringe Menge bis $ – 3 $ , wobei der Mittelwert bei $ 0 $ und die Schiefe bei $ 0 $ beibehalten werden, während gleichzeitig eine Asymmetrie erzeugt wird . Der gleiche Ansatz wird funktionieren, um den Mittelwert Null und die Schiefe Null einer kontinuierlichen Verteilung beizubehalten, während sie asymmetrisch gemacht wird. Wenn wir mit der Massenverschiebung nicht zu aggressiv sind, bleibt sie unimodal.
Bearbeiten: Kontinuierliche Verteilungen
Da das Problem immer wieder auftaucht, geben wir an ein explizites Beispiel mit kontinuierlichen Verteilungen. Peter Flom hatte eine gute Idee: Schauen Sie sich Mischungen von Normalen an. Eine Mischung aus zwei Normalen reicht nicht aus: Wenn ihre Schiefe verschwindet, ist sie symmetrisch. Der nächst einfachere Fall ist eine Mischung aus drei Normalen.
Mischungen von drei Normalen hängen nach einer geeigneten Auswahl von Ort und Maßstab von sechs realen Parametern ab und sollten daher mehr als ausreichend flexibel sein, um eine asymmetrische Lösung ohne Schiefe zu erzeugen . Um einige zu finden, müssen wir wissen, wie man Schiefen von Normalenmischungen berechnet. Unter diesen werden wir nach unimodalen suchen (es ist möglich, dass es keine gibt).
Nun ist im Allgemeinen der $ r ^ \ text {th } $ (nicht zentrales) Moment einer Standardnormalverteilung ist Null, wenn $ r $ ungerade ist und ansonsten gleich $ 2 ^ {r / 2} \ Gamma \ left (\ frac {1-r} {2} \ right) / \ sqrt {\ pi} $ . Wenn wir diese Standardnormalverteilung neu skalieren, um eine Standardabweichung von $ \ sigma $ zu erhalten, wird der $ r ^ \ text {th } $ moment wird mit $ \ sigma ^ r $ multipliziert. Wenn wir eine Verteilung um $ \ mu $ verschieben, wird der neue $ r ^ \ text {th} $ Moment kann in Momenten bis einschließlich $ r $ ausgedrückt werden. Der Moment einer Mischung von Verteilungen (dh ein gewichteter Durchschnitt von ihnen) ist der gleiche gewichtete Durchschnitt der einzelnen Momente. Schließlich ist die Schiefe genau dann Null, wenn das dritte zentrale Moment Null ist, und dies lässt sich leicht anhand der ersten drei Momente berechnen.
Dies gibt uns einen algebraischen Angriff auf das Problem. Eine Lösung, die ich gefunden habe, ist eine gleiche Mischung aus drei Normalen mit den Parametern $ (\ mu, \ sigma) $ gleich $ ( 0,1) $ , $ (1 / 2,1) $ und $ (0, \ sqrt {127/18}) \ approx (0, 2.65623) $ . Sein Mittelwert entspricht $ (0 + 1/2 + 0) / 3 = 1/6 $ . Dieses Bild zeigt das PDF in Blau und das PDF der Verteilung um den Mittelwert in Rot. Dass sie sich unterscheiden, zeigt, dass sie beide asymmetrisch sind. (Der Modus ist ungefähr $ 0.0519216 $ , ungleich dem Mittelwert von $ 1/6 $ .) Beide haben konstruktionsbedingt keine Schiefe .
Die Diagramme zeigen an, dass diese unimodal sind. (Sie können mithilfe von Calculus nach lokalen Maxima suchen.)
Kommentare
- (+1) Sehr raffinierte Antwort. Funktioniert dies jedoch mit kontinuierlichen Verteilungen? Würde die Verschiebung nicht ‚ möglicherweise winzige kleine Modi erzeugen? Ich denke vielleicht nicht klar …
- Sie ‚ denken ganz gut, Makro: Wir sollten alle so skeptisch sein. Der Trick besteht darin, winzige Mengen zu verschieben, die über große Bereiche verteilt sind. Ein Test der ersten Ableitung ermöglicht es Ihnen, nach möglichen Modi zu suchen, und liefert auch die Grundlage für einen Beweis, dass ausreichend winzige Verschiebungen dieser Form keine neuen Modi erzeugen.
- Danke für die Antwort! Dies ähnelt dem, was ich intuitiv gedacht habe, obwohl ich es ‚ nicht gut in Worte fassen konnte – dass Sie “ balancieren müssen “ die Masse auf jeder Seite der Verteilung. Ich frage mich, ob es stereotype Wege gibt, wie man diesen Balanceakt ausführen kann.
- Ein Weg, Andy, besteht darin, mit einer diskreten Lösung zu beginnen und sie dann mit einer Normalverteilung zu falten. In diesem Fall erzwingt die Unimodalitätsanforderung, dass diese Normalverteilung eine große Standardabweichung aufweist. Auch wenn die Faltung die erforderlichen Eigenschaften (wie z. B. die Schiefe Null) nicht nennenswert oder auf vorhersehbare Weise ändert, haben Sie das Problem mathematisch im Griff. In gewissem Sinne kann meine letzte Bearbeitung als ein solcher Angriff angesehen werden, obwohl es sich bei ‚ nicht ausschließlich um eine Faltung handelt (da die drei Normalen unterschiedliche Standardabweichungen aufweisen).
- Ich habe nachgesehen, Andy: Das Falten der diskreten Lösung mit einer Normalverteilung ändert nichts an der Schiefe. Wenn Sie dieser Normalverteilung eine Standardabweichung um 0,57 oder mehr geben, ist das Ergebnis unimodal. Wie die zugrunde liegende diskrete Verteilung hat sie weiterhin einen Mittelwert von Null, eine Schiefe von Null und ist asymmetrisch. Das Mischen mit einer Standardnormalverteilung bedeutet eine kontrollierte Massenbewegung zwischen der Standardnormalverteilung und der diskreten Verteilung: Dies könnte Ihre Anfrage nach einem “ stereotypen Methode.
Antwort
Hier ist eine, die ich unter https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html # finde ich schön und reproduziert in R: eine inverse Burr- oder Dagum-Verteilung mit Formparametern $ k = 0.0629 $ und $ c = 18.1484 $:
$$ g (x) = ckx ^ {- (c + 1)} [1 + x ^ {- c}] ^ {- (k + 1)} $$
Es hat den Mittelwert 0.5387, Standardabweichung 0,2907, Schiefe 0,0000 und Kurtosis 2,0000. Die Quelle nennt es auch „Elefantenverteilung“:
Meine Reproduktion in R wurde mit
library(actuar) library(knotR) # a nonsymmetric distribution with zero skewness # see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# c <- 18.1484 k <- 0.0629 x <- seq(0,1.5,by=.0001) elephant.density <- dinvburr(x, k, c) plot(x,elephant.density, type="l") polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey") points(0.8,0.8, pch=19, cex=2) # "ears" created via https://www.desmos.com/calculator/cahqdxeshd ear.x <- c(0.686, 0.501, 0.42, 0.68) ear.y <- c(0.698, 0.315, 1.095, 0.983) myseg(bezier(cbind(ear.x, ear.y)), type="l") EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k) EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k) (skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196
erstellt. Wie diese Ausgabe zeigt, ist die Schiefe nicht ganz null bis vier Stellen für diese Parameterwerte. Hier ist ein kleiner Optimierer für $ k $ und $ c $:
# optimize skewness a bit further skewval <- 1 while (skewval > 10^(-10)){ optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c) skewval <- optskew.k$f.root k <- optskew.k$root optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k) skewval <- optskew.c$f.root c <- optskew.c$root }
ergibt
> print(c) [1] 18.89306 > print(k) [1] 0.05975542 > print(skewval) [1] -1.131464e-15
Kommentare
- Vielen Dank für die Bearbeitung. Trotzdem konnte ich die Schiefe von 0,0000 bis vier Ziffern nicht reproduzieren und erhielt stattdessen 0,0001245138 (siehe nächste Bearbeitung im R-Code).
- Man kann wahrscheinlich einen einfachen Optimierer ausführen, um $ c $ und $ zu finden k $ -Werte so, dass die Schiefe so nahe wie möglich bei Null liegt. Es sollten ein paar zusätzliche Zeilen oder vielleicht sogar eine sein. Sie haben die Verlustfunktion bereits in Ihrer letzten Zeile analytisch berechnet. Gibt es einen geeigneten generischen Optimierer in R?
- Tatsächlich 0,0003756196. 0,0001245138 wurde bereits nach einer anfänglichen Optimierung hier versehentlich angegeben. Ich werde einen Blick darauf werfen.
- @amoeba, ich habe versucht, ein bisschen zu optimieren, aber ich behaupte nicht, dass ich das auf clevere Weise getan habe. Ich habe wenig Erfahrung mit Optimierung.
- Die Schiefe, dass ‚ null bis drei Ziffern (fast vier) hat, war für mich ausreichend; ‚ Wenn kein genauerer Wert vorliegt, sieht es anders aus. Wenn die Schiefe in dieser Umgebung Null überschreitet und ‚ klar ist, in welche Richtungen die Werte angepasst werden müssen, wenn mehr Genauigkeit erforderlich ist, gehe ich davon aus, dass ‚ s ausreichend. Aber ein großes Lob für den zusätzlichen Aufwand. (Es ist übrigens ‚ ein schönes Beispiel.)
Antwort
Betrachten Sie eine Verteilung auf der positiven Hälfte der realen Linie, die linear von 0 zum Modus ansteigt und dann rechts vom Modus exponentiell ist, im Modus jedoch kontinuierlich ist.
Dies könnte der Fall sein wird als dreieckig-exponentielle Verteilung bezeichnet (obwohl sie oft ein bisschen wie eine Haifischflosse aussieht).
Sei $ \ theta $ der Ort des Modus und $ \ lambda $ der Ratenparameter des exponentiell.
Wenn $ \ lambda \ theta $ zunimmt, wird die Verteilung zunehmend weniger schief. Wenn $ \ lambda \ theta $ über $ \ ca. 6,15 $ hinaus ansteigt, wechselt der dritte Moment von positiv zu negativ:
Brizzi (2006) $ ^ {[1]} $ bezeichnet diese Verteilungsfamilie als „Zwei-Seiten“ -Verteilung und diskutiert Dieser Überkreuzungspunkt, an dem die Schiefe des dritten Moments Null ist. von Hippel (2005) $ ^ {[2]} $ präsentiert ein Beispiel, das sich fast an diesem Kreuzungspunkt befindet hier
Der Thread Nicht normale Verteilungen mit null Schiefe und null überschüssiger Kurtosis? enthält einige asymmetrische Beispiele, darunter ein kleines diskretes Beispiel und ein weiteres kontinuierliches unimodales Beispiel:
Diskrete unimodale Verteilungen – oder gleichwertige Stichproben – ohne Schiefe sind recht einfach zu konstruieren, von großer oder kleiner Größe.
Hier ist ein Beispiel, das Sie als Probe oder (durch Teilen der Rohfrequenzen durch 3000) als pmf ( Die „x“ -Werte sind die genommenen Werte, die „n“ sind die Häufigkeit, mit der dieser Wert in der Stichprobe vorkommt.)
x: -2 -1 0 1 2 3 4 5 6 7 8 9 10 n: 496 498 562 1434 2 1 1 1 1 1 1 1 1
erstellt wurde. Dieses Beispiel ist f aufgebaut von 3-Punkt-Verteilungen:
x: -2 1 c n: c(c-1)(c+1)/6 c(c-1)(c+1)/3 - c 1
über verschiedene Werte von $ c $ zwischen 3 und 10. Dieses parametrisierte (um $ c $) 3-Punkt-Atom „hat $ \ sum_i n_ix_i = 0 $ und $ \ sum_i n_ix_i ^ 3 = 0 $, was wiederum bedeutet, dass Mischungen über verschiedene Auswahlmöglichkeiten von $ c $ keine Schiefe haben. (Sie können nichts kleiner machen als eine Verteilung auf drei Punkte mit Asymmetrie und drittem zentralen Moment Null. Eine Sammlung einfacher Teile über nur wenige Punkte, wie diese, bilden ordentliche Bausteine, aus denen größere Strukturen hergestellt werden können.)
Es gibt alle Arten anderer solcher „Atome“, die man konstruieren kann, aber dieses Beispiel verwendet nur diese eine Art. Zu einer Kombination von Atomen wie diesen werden einige symmetrisch platzierte Werte hinzugefügt, um verbleibende Löcher zu füllen und Unimodalität garantieren, ohne die Struktur des Mittelwerts und des dritten Moments zu zerstören.
$ [1] $ Brizzi, M.(2006),
„Ein verzerrtes Modell, das dreieckige und exponentielle Merkmale kombiniert: Die zweiseitige Verteilung und ihre statistischen Eigenschaften“
Austrian Journal of Statistics , 35 : 4, p455–462
http://www.stat.tugraz.at/AJS/ausg064/
$ [2] $ von Hippel, PT (2005),
„Mittelwert, Median und Versatz: Korrektur einer Lehrbuchregel“
Journal of Statistics Education Volume 13, Nummer 2,
http://ww2.amstat.org/publications/jse/v13n2/vonhippel.html
Kommentare
- Könnte man es vielleicht “ Haifischflosse “ nennen?
- @Glen_b In der Tat total Haifischflosse.
Antwort
Für eine Schiefe von Null benötigen wir $$ \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = 0 $$ oder gleichwertig $$ \ operatorname {E} \ Big [ \ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ leq \ mu \ Big] + \ operatorname {E} \ Big [\ big (\ tfrac {X- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big | X \ gt \ mu \ Big] = 0. $$
Wählen Sie nun für den gegebenen Mittelwert und die gegebene Varianz zwei beliebige Verteilungen $ Y $ und $ Z $ mit der Masse Null auf der rechten Seite von $ \ mu aus $ und $$ \ operatorname {E} \ Big [\ big (\ tfrac {Y- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] = \ operatorname {E} \ Big [ \ big (\ tfrac {Z- \ mu} {\ sigma} \ big) ^ {\! 3} \, \ Big] $$ und definiere $ X $ so, dass es mit $ Y $ übereinstimmt, wenn $ \ mu $ und $ übrig bleiben (\ mu – Z) $ sonst. (Sie kennen die genaue Notation dafür nicht, jemand möchte helfen?)
Die resultierende Verteilung ist unimodal, wenn die PDF-Dateien von $ Y $ und $ Z $ links von $ \ mu zunehmen $ (zusätzlich zu Null rechts von $ \ mu $).
Kommentare
- Wie garantieren Sie, dass die Verteilung unimodal ist?
- Vielen Dank, dass Sie darauf hingewiesen haben. Die PDFs von $ Y $ und $ Z $ müssen bis $ \ mu $ streng erhöht und dann auf Null fallen.
- Dies ist Die richtige Idee, aber es muss noch etwas gearbeitet werden, da sich $ \ sigma $ ändern kann, wenn $ Y $ und $ Z $ kombiniert werden.
- @whuber: Verdammt. Ich wusste, dass dort war um eine Falle zu sein … 🙂
Antwort
Die folgende diskrete Verteilung ist asymmetrisch und hat null Schiefe: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Ich fand es in der Arbeit von Doric et al., Qual Quant (2009) 43: 481 -493; DOI 10.1007 / s11135-007-9128-9
Kommentare
- +1 Es wird ausgecheckt und es ‚ ist unimodal. Dies ist ‚ das einfachste Beispiel.
Antwort
Sicher. Versuchen Sie Folgendes:
skew= function (x, na.rm = FALSE) { if (na.rm) x <- x[!is.na(x)] #remove missing values sum((x - mean(x))^3)/(length(x) * sd(x)^3) #calculate skew } set.seed(12929883) x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1)) skew(x) plot(density(x))
(Sie haben die harten Sachen bereits gemacht!)
Kommentare
- schön, ich mag es. +1
- Es ist ‚ nicht bimodal … es ‚ ist schrecklich multi -modal. Versuchen Sie, die Dichte zu zeichnen.
curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
- Auf diese Weise generierte Daten sind sicherlich nicht unimodal. Alles, was Sie tun müssen, um dies zu sehen, ist, Ihren Code wörtlich auszuschneiden und einzufügen. In der Tat wird eine Mischung normalverteilter Variablen niemals unimodal sein (es sei denn natürlich, eines der Mischungsverhältnisse ist 1).
- @Macro, das ‚ s nicht richtig. Siehe zum Beispiel die Zusammenfassung von Roeder 1994 (JASA) für das bekannte Ergebnis, dass “ die Dichte zweier gemischter Normalen nicht bimodal ist, es sei denn, die Mittelwerte sind durch mindestens 2 getrennt Standardabweichungen „. Wenn sie durch weniger getrennt sind, ist die Mischung unimodal.
- Sie ‚ haben Recht @guest. Ich ‚ hatte diese Möglichkeit vergessen, als ich meinen Beitrag
verfasste