Hvad er definitionen af en symmetrisk fordeling? Nogen fortalte mig, at en tilfældig variabel $ X $ kom fra en symmetrisk fordeling, hvis og kun hvis $ X $ og $ -X $ har samme fordeling. Men jeg tror, at denne definition delvis er sand. Fordi jeg kan præsentere en modeksempel $ X \ sim N (\ mu, \ sigma ^ {2}) $ og $ \ mu \ neq0 $. Det har åbenbart en symmetrisk fordeling, men $ X $ og $ -X $ har forskellig fordeling. Har jeg ret? Tænker I nogensinde på dette spørgsmål? Hvad er den nøjagtige definition af symmetrisk fordeling?
Kommentarer
- Når du siger, er en ” distribution symmetrisk “, du skal specificere med hensyn til hvilket punkt der er symmetrisk. I tilfælde af den normale fordeling, du præsenterer, er symmetrien givet omkring $ \ mu $. I dette tilfælde har $ X- \ mu $ og $ – (X- \ mu) $ den samme fordeling. Med hensyn til densitet kan dette udtrykkes som: $ f $ er symmetrisk omkring $ \ mu $ hvis $ f (\ mu-x) = f (\ mu + x) $. BTW, det er gode manerer at acceptere svar, når du er tilfreds med en af dem.
- Ja, vi fyre har tænkt over dette spørgsmål. Symmetrisk betyder generelt symmetrisk omkring $ 0 $, og for at forhindre yderligere modeksempler er påstanden om, at distributioner er symmetriske ikke noget, der gælder for den kumulative sandsynlighedsfordelingsfunktion . Din ” modeksempel ” har symmetri omkring punktet $ \ mu \ neq 0 $, ikke om punktet $ 0 $.
- @Dilip Når en definition afhænger af en måde at beskrive noget på, men denne definition kan vises som en iboende egenskab ved det noget, giver det ingen mening at anvende definitionen på en anden form for beskrivelse. I dette tilfælde er symmetri en egenskab for en distribution , men det betyder ikke, at alle beskrivelser af denne distribution (inklusive PDF og CDF) skal være ” symmetrisk ” på samme måder. Ved at anvende PDF-symmetrien på CDF forvirrer din kommentar spørgsmålet snarere end at afklare det.
- shijing, @Procrastinator har observeret, at du har stillet mange spørgsmål uden at acceptere nogen svar. Det antyder, at du måske ikke er bekendt med, hvordan dette websted fungerer. Hvis du vil fjerne enhver misforståelse, skal du læse den relevante del af vores ofte stillede spørgsmål hele vejen igennem ? Det tager kun et par minutter, og efter vejledningen vil det øge værdien af vores websted for dig.
- @whuber CDF er en af de få beskrivelser, hvor ordet distribution forekommer faktisk i navnet, og jeg forsøgte at præcisere, at symmetriegenskaben ikke holdt for CDF.
Svar
Kort: $ X $ er symmetrisk, når $ X $ og $ 2aX $ har den samme fordeling for noget reelt tal $ a $. Men at nå frem til dette på en fuldt berettiget måde kræver en vis afvigelse og generaliseringer, fordi det rejser mange implicitte spørgsmål: hvorfor denne definition af” symmetrisk “? Kan der være andre slags symmetrier? Hvad er forholdet mellem en distribution og dens symmetrier, og omvendt, hvad er forholdet mellem en “symmetri” og de fordelinger, der kan have den symmetri?
De pågældende symmetrier er refleksioner af rigtig linje. Alle har form
$$ x \ til 2a-x $$
for nogle konstante $ a $.
Så antag at $ X $ har denne symmetri for mindst en $ a $. Derefter antyder symmetrien
$$ \ Pr [X \ ge a] = \ Pr [2a-X \ ge a] = \ Pr [X \ le a] $$
viser, at $ a $ er en median på $ X $. Tilsvarende, hvis $ X $ har en forventning, følger det straks, at $ a = E [X] $. Således kan vi normalt nemt nedfælde $ $. Selv hvis ikke, er $ a $ (og derfor selve symmetrien) stadig entydigt bestemt (hvis den overhovedet findes).
Lad $ b $ være ethvert symmetricenter for at se dette. Ved anvendelse af begge symmetrier ser vi, at $ X $ er uændret under oversættelsen $ x \ til x + 2 (b-a) $. Hvis $ b-a \ ne 0 $, skal fordelingen af $ X $ have en periode på $ b-a $, hvilket er umuligt, fordi den samlede sandsynlighed for en periodisk fordeling er enten $ 0 $ eller uendelig. $ Ba = 0 $ viser, at $ a $ er unik.
Mere generelt, når $ G $ er en gruppe, der handler trofast på den rigtige linje (og i forlængelse af alle dens Borel-undergrupper), kan vi sige, at en distribution $ X $ er “symmetrisk” (med hensyn til $ G $), når
$$ \ Pr [X \ i E] = \ Pr [X \ i E ^ g] $$
for alle målbare sæt $ E $ og elementer $ g \ i G $, hvor $ E ^ g $ betegner billedet af $ E $ under handlingen af $ g $.
Som eksempel, lad $ G $ stadig være en gruppe på $ 2 $, men nu lad dets handling være at tage det gensidige af et reelt tal (og lad det rette $ 0 $). Standarduddelingen lognormal er symmetrisk med hensyn til denne gruppe. Dette eksempel kan forstås som en forekomst af en refleksionssymmetri, hvor et ikke-lineært re-udtryk for koordinaterne har fundet sted. Dette antyder, at man fokuserer på transformationer, der respekterer den “virkelige linjes” struktur. Strukturen, der er væsentlig for sandsynligheden, skal være relateret til Borel-sæt og Lebesgue-mål, som begge kan defineres som (euklidisk) afstand mellem to punkter.
En afstandsbevarende kort er pr. definition en isometri. Det er velkendt (og let, omend lidt involveret, at demonstrere), at alle isometrier i den virkelige linje genereres af refleksioner. Hvorfra, når det forstås, at “symmetrisk” betyder symmetrisk med hensyn til en gruppe isometrier , skal gruppen genereres ved højst en refleksion, og vi har set, at refleksion bestemmes entydigt af enhver symmetrisk fordeling med hensyn til den. I denne forstand er den foregående analyse udtømmende og retfærdiggør den sædvanlige terminologi af “symmetriske” distributioner.
I øvrigt er en vært for multivariate eksempler af fordelinger, der er uforanderlige under grupper af isometrier, gives ved at overveje “sfæriske” fordelinger. Disse er uforanderlige under alle rotationer (i forhold til et fast center). Disse generaliserer det endimensionelle tilfælde: “rotationerne” af den virkelige linje er kun refleksioner.
Endelig er det værd at påpege, at en standardkonstruktion – gennemsnit over gruppen – giver en måde til at producere masser af symmetriske fordelinger. I tilfælde af den rigtige linje skal $ G $ genereres af refleksionen omkring et punkt $ a $, så den består af identitetselementet $ e $ og denne refleksion, $ g $. Lad $ X $ være enhver distribution. Definer fordelingen $ Y $ ved at indstille
$$ {\ Pr} _Y [E] = \ frac {1} {| G |} \ sum_ {g \ i G} {\ Pr} _X [ E ^ g] = ({\ Pr} _X [E] + {\ Pr} _X [E ^ g]) / 2 $$
for alle Borel-sæt $ E $. Dette er åbenlyst symmetrisk, og det er let at kontrollere, at det forbliver en fordeling (alle sandsynligheder forbliver ikke-negative, og den samlede sandsynlighed er $ 1 $).
For at illustrere gruppens gennemsnitsproces vises PDFen af en symmetriseret gammafordeling (centreret ved $ a = 2 $) i guld. Den originale Gamma er i blå og dens refleksion er rød.
Kommentarer
- (+1) Jeg vil gerne tilføje, at definitionen af symmetri i multivariat indstilling er ikke unik. I denne bog er der 8 mulige definitioner af symmetriske multivariate distributioner.
- @Procrastinator I ‘ er nysgerrig efter, hvad du måske mener med ” ikke unik. ” AFAIK, alt hvad der retfærdiggør navnet ” symmetri ” henviser i sidste ende til en gruppehandling på et mellemrum. Det ville være interessant for at se, hvilke forskellige handlinger statistikere har fundet nyttige. Da den bog er udsolgt og ikke tilgængelig på Internettet, kan du give et hurtigt eksempel på to virkelig forskellige slags symmetri, der overvejes i den bog?
- Din intuition er korrekt, dette er relateret til statistiske træk : Central symmetri $ {\ bf X} – \ mu \ stackrel {d} {=} – ({\ bf X} – \ mu) $; Sfærisk symmetri $ X- \ mu \ stackrel {d} {=} {\ bf O} ({\ bf X} – \ mu) $ for al ortogonal matrix $ {\ bf O} $. Jeg kan ikke huske resten, men jeg vil forsøge at låne bogen i disse dage. I dette link kan du finde nogle af dem.
- @Procrastinator Tak. Bemærk, at de to eksempler, du tilbyder, begge er specielle tilfælde af den generelle definition, jeg har leveret: den centrale symmetri genererer en to-element gruppe af isometrier, og de sfæriske symmetrier er også en undergruppe af alle isometrier. ” elliptisk symmetri ” i linket er en sfærisk symmetri efter en affinetransformation, og eksemplificerer så det fænomen, jeg pegede på med det lognormale eksempel. ” vinkelsymmetrier ” udgør igen en gruppe isometrier. ” halv-plads symmetri ” [sic] er ikke en symmetri, men giver mulighed for diskrete afvigelser derfra: at ‘ er nyt.
Svar
Svaret afhænger af, hvad du mener med symmetri. I fysik er begrebet symmetri grundlæggende og er blevet meget generelt. Symmetri er enhver handling, der efterlader systemet uændret.I tilfælde af en sandsynlighedsfordeling kan dette oversættes til enhver operation $ X \ til X “$, der returnerer den samme sandsynlighed $ P (X) = P (X”) $.
I det enkle tilfælde i det første eksempel henviser du til refleksionssymmetrien om det maksimale. Hvis fordelingen var sinusformet, kunne du have betingelsen $ X \ til X + \ lambda $, hvor $ \ lambda $ er bølgelængden eller perioden. Derefter $ P (X) = P (X + \ lambda) $ og passer stadig til en mere generel definition af symmetri.