Hva er definisjonen av en symmetrisk fordeling? Noen fortalte meg at en tilfeldig variabel $ X $ kom fra en symmetrisk fordeling hvis og bare hvis $ X $ og $ -X $ har samme distribusjon. Men jeg tror denne definisjonen delvis stemmer. Fordi jeg kan presentere et moteksempel $ X \ sim N (\ mu, \ sigma ^ {2}) $ og $ \ mu \ neq0 $. Åpenbart har den en symmetrisk fordeling, men $ X $ og $ -X $ har forskjellig fordeling. Har jeg rett? Tenker dere noen gang på dette spørsmålet? Hva er den eksakte definisjonen av symmetrisk fordeling?
Kommentarer
- Når du sier, er en " distribusjon symmetrisk ", du må spesifisere med hensyn til hvilket punkt som er symmetrisk. I tilfelle normalfordelingen du presenterer, er symmetrien gitt rundt $ \ mu $. I dette tilfellet har $ X- \ mu $ og $ – (X- \ mu) $ den samme fordelingen. Når det gjelder tettheten kan dette uttrykkes som: $ f $ er symmetrisk om $ \ mu $ hvis $ f (\ mu-x) = f (\ mu + x) $. BTW, det er god oppførsel å godta svar når du er fornøyd med en av dem.
- Ja, vi har tenkt på dette spørsmålet. Symmetrisk betyr vanligvis symmetrisk rundt $ 0 $, og for å forhindre ytterligere moteksempler er påstanden om at distribusjoner er symmetriske ikke noe som stemmer med den kumulative sannsynlighetsfordelingsfunksjonen . " moteksempel " har symmetri rundt punktet $ \ mu \ neq 0 $, ikke om poenget $ 0 $.
- @Dilip Når en definisjon avhenger av en måte å beskrive noe på, men den definisjonen kan vises som en egen egenskap for det noe, er det ingen mening å bruke definisjonen til en annerledes form for beskrivelse. I dette tilfellet er symmetri en egenskap for en distribusjon , men det betyr ikke at alle beskrivelser av den distribusjonen (inkludert PDF og CDF) må være " symmetrisk " på samme måter. Ved å bruke symmetrien til PDF på CDF, forvirrer din kommentar spørsmålet i stedet for å avklare det.
- shijing, @Procrastinator har observert at du har stilt mange spørsmål uten å godta noen svar. Det antyder at du kanskje ikke er kjent med hvordan dette nettstedet fungerer. Hvis du vil avklare enhver misforståelse, kan du lese relevant del av våre vanlige spørsmål hele veien gjennom ? Det vil ta bare et par minutter, og å følge veiledningen vil øke verdien av nettstedet vårt for deg.
- @whuber CDF er en av få beskrivelser der ordet distribusjon forekommer faktisk i navnet, og jeg prøvde å avklare at symmetriegenskapen ikke holdt for CDF.
Svar
Kort: $ X $ er symmetrisk når $ X $ og $ 2aX $ har samme fordeling for noe reelt tall $ a $. Men å komme frem til dette på en fullstendig berettiget måte krever en viss avvikelse og generaliseringer, fordi det reiser mange implisitte spørsmål: hvorfor denne definisjonen av» symmetrisk «? Kan det være andre typer symmetrier? Hva er forholdet mellom en fordeling og dens symmetrier, og omvendt, hva er forholdet mellom en «symmetri» og de distribusjonene som kan ha den symmetrien?
De aktuelle symmetriene er refleksjoner av ekte linje. Alle har formen
$$ x \ til 2a-x $$
for noen konstante $ a $.
Så, anta at $ X $ har denne symmetrien for minst en $ a $. Da antyder symmetrien
$$ \ Pr [X \ ge a] = \ Pr [2a-X \ ge a] = \ Pr [X \ le a] $$
viser at $ a $ er en median på $ X $. På samme måte, hvis $ X $ har en forventning, følger det umiddelbart at $ a = E [X] $. Dermed kan vi vanligvis fastsette $ a $ enkelt. Selv om ikke, er $ a $ (og derfor selve symmetrien) fortsatt bestemt (hvis den i det hele tatt eksisterer).
For å se dette, la $ b $ være et hvilket som helst sentrum for symmetri. Ved å bruke begge symmetriene ser vi at $ X $ er uforanderlig under oversettelsen $ x \ til x + 2 (b-a) $. Hvis $ b-a \ ne 0 $, må fordelingen av $ X $ ha en periode på $ b-a $, noe som er umulig fordi den totale sannsynligheten for en periodisk fordeling er enten $ 0 $ eller uendelig. Dermed $ ba = 0 $, viser at $ a $ er unikt.
Mer generelt, når $ G $ er en gruppe som handler trofast på den virkelige linjen (og i forlengelse av alle dens Borel-undergrupper), kan vi si at en distribusjon $ X $ er «symmetrisk» (med hensyn til $ G $) når
$$ \ Pr [X \ i E] = \ Pr [X \ i E ^ g] $$
for alle målbare sett $ E $ og elementene $ g \ i G $, hvor $ E ^ g $ betegner bildet av $ E $ under handlingen av $ g $.
Som eksempel, la $ G $ fremdeles være en bestillingsgruppe $ 2 $, men nå la sin handling være å ta gjensidigheten av et reelt tall (og la det fikse $ 0 $). Standard fordeling av lognormal er symmetrisk med hensyn til denne gruppen. Dette eksemplet kan forstås som en forekomst av en refleksjonssymmetri der et ikke-lineært re-uttrykk for koordinatene har funnet sted. Dette antyder å fokusere på transformasjoner som respekterer «strukturen» til den virkelige linjen. Strukturen som er viktig for sannsynligheten, må være relatert til Borelsett og Lebesgue-mål, som begge kan defineres i form av (euklidisk) avstand mellom to punkter.
En avstandsbevarende kart er per definisjon en isometri. Det er velkjent (og lett, om enn litt involvert, å demonstrere) at alle isometrier i den virkelige linjen genereres av refleksjoner. Når det er forstått at «symmetrisk» betyr symmetrisk med hensyn til en gruppe isometrier , må gruppen genereres av høyst en refleksjon, og vi har sett at refleksjon bestemmes unikt av hvilken som helst symmetrisk fordeling med hensyn til den. I denne forstand er den foregående analysen uttømmende og rettferdiggjør den vanlige terminologien for «symmetriske» distribusjoner.
Forresten, en vert for multivariate eksempler av distribusjoner som er uforanderlige under grupper av isometrier er gitt ved å vurdere «sfæriske» fordelinger. Disse er uforanderlige under alle rotasjoner (i forhold til noe fast senter). Disse generaliserer det endimensjonale tilfellet: «rotasjonene» til den virkelige linjen er bare refleksjonene.
Til slutt er det verdt å påpeke at en standardkonstruksjon – gjennomsnittlig over gruppen – gir en vei for å produsere masse symmetriske fordelinger. Når det gjelder den virkelige linjen, la $ G $ bli generert av refleksjonen rundt et punkt $ a $, slik at den består av identitetselementet $ e $ og denne refleksjonen, $ g $. La $ X $ være en hvilken som helst distribusjon. Definer fordelingen $ Y $ ved å sette
$$ {\ Pr} _Y [E] = \ frac {1} {| G |} \ sum_ {g \ in G} {\ Pr} _X [ E ^ g] = ({\ Pr} _X [E] + {\ Pr} _X [E ^ g]) / 2 $$
for alle Borel-sett $ E $. Dette er tydeligvis symmetrisk, og det er lett å kontrollere at det forblir en fordeling (alle sannsynligheter forblir ikke-negative og den totale sannsynligheten er $ 1 $).
Illustrasjon av gjennomsnittsprosessen for gruppen, PDF av en symmetrisert gammafordeling (sentrert til $ a = 2 $) vises i gull. Den opprinnelige Gamma er i blått og refleksjonen er i rødt.
Kommentarer
- (+1) Jeg vil legge til at definisjonen av symmetri i multivariat-innstillingen er ikke unik. I denne boka er det åtte definisjoner av symmetriske multivariate distribusjoner.
- @Procrastinator I ' er nysgjerrig på hva du kan mene med " ikke unikt. " AFAIK, alt som rettferdiggjør navnet " symmetri " refererer til slutt til en gruppehandling på et mellomrom. Det ville være interessant for å se hva slags handlinger statistikere har funnet nyttige. Fordi den boken er ute av trykk og ikke tilgjengelig på nettet, kan du gi et raskt eksempel på to veldig forskjellige typer symmetri som er vurdert i den boka?
- Din intuisjon er riktig, dette er relatert til statistiske trekk : Sentral symmetri $ {\ bf X} – \ mu \ stackrel {d} {=} – ({\ bf X} – \ mu) $; Sfærisk symmetri $ X- \ mu \ stackrel {d} {=} {\ bf O} ({\ bf X} – \ mu) $ for all ortogonal matrise $ {\ bf O} $. Jeg kan ikke huske resten, men jeg vil prøve å låne boka i disse dager. I denne lenken kan du finne noen av dem.
- @Procrastinator Takk. Merk at de to eksemplene du tilbyr begge er spesielle tilfeller av den generelle definisjonen jeg har gitt: den sentrale symmetrien genererer en to-elementsgruppe av isometrier, og de sfæriske symmetriene er også en undergruppe av alle isometrier. " elliptisk symmetri " i lenken er en sfærisk symmetri etter en affin transformasjon, og eksemplifiserer så fenomenet jeg pekte på med det lognormale eksempel. " vinkelsymmetrier " utgjør igjen en gruppe isometrier. " halvromssymmetri " [sic] er ikke en symmetri, men tillater diskrete avvik derfra: at ' er nytt.
Svar
Svaret vil avhenge av hva du mener med symmetri. I fysikk er begrepet symmetri grunnleggende og har blitt veldig generelt. Symmetri er enhver operasjon som etterlater systemet uendret.I tilfelle av en sannsynlighetsfordeling kan dette oversettes til en hvilken som helst operasjon $ X \ til X «$ som gir samme sannsynlighet $ P (X) = P (X») $.
I det enkle tilfellet i det første eksemplet refererer du til refleksjonssymmetrien om maksimum. Hvis fordelingen var sinusformet, kunne du ha tilstanden $ X \ til X + \ lambda $, hvor $ \ lambda $ er bølgelengden eller perioden. Da vil $ P (X) = P (X + \ lambda) $ og fremdeles passe til en mer generell definisjon av symmetri.