Wat is de definitie van een symmetrische verdeling? Iemand vertelde me dat een willekeurige variabele $ X $ afkomstig was van een symmetrische verdeling als en slechts als $ X $ en $ -X $ heeft dezelfde distributie. Maar ik denk dat deze definitie gedeeltelijk waar is. Omdat ik een tegenvoorbeeld kan geven $ X \ sim N (\ mu, \ sigma ^ {2}) $ en $ \ mu \ neq0 $. Het heeft duidelijk een symmetrische distributie, maar $ X $ en $ -X $ hebben een verschillende distributie! Heb ik gelijk? Denken jullie ooit over deze vraag na? Wat is de exacte definitie van symmetrische distributie?
Opmerkingen
- Als je zegt, een ” distributie is symmetrisch “, je moet specificeren met betrekking tot welk punt symmetrisch is. In het geval van de normale verdeling die u presenteert, wordt de symmetrie gegeven rond $ \ mu $. In dit geval hebben $ X- \ mu $ en $ – (X- \ mu) $ dezelfde distributie. In termen van dichtheid kan dit worden uitgedrukt als: $ f $ is symmetrisch ongeveer $ \ mu $ if $ f (\ mu-x) = f (\ mu + x) $. Trouwens, het is een goede manier om antwoorden te accepteren als je tevreden bent met een ervan.
- Ja, wij hebben over deze vraag nagedacht. Symmetrisch betekent in het algemeen symmetrisch ongeveer $ 0 $, en, om verdere tegenvoorbeelden te voorkomen, is de bewering dat verdelingen symmetrisch zijn niet iets dat waar is voor de cumulatieve kansverdelingsfunctie . Uw ” tegenvoorbeeld ” heeft symmetrie rond het punt $ \ mu \ neq 0 $, niet rond het punt $ 0 $.
- @Dilip Wanneer een definitie afhankelijk is van één manier om iets te beschrijven, maar die definitie kan worden aangetoond als een intrinsieke eigenschap van dat iets, dan heeft het geen zin om de definitie toe te passen op een andere vorm van beschrijving. In dit geval is symmetrie een eigenschap van een distributie , maar dat betekent niet dat alle beschrijvingen van die distributie (inclusief de PDF en CDF) ” symmetrisch ” op dezelfde manieren. Door de symmetrie van de PDF toe te passen op de CDF, verwart je opmerking de vraag in plaats van deze te verduidelijken.
- shijing, @Procrastinator heeft opgemerkt dat je veel vragen hebt gesteld zonder antwoorden te accepteren. Dat suggereert dat u misschien niet bekend bent met hoe deze site werkt. Wilt u het relevante deel van onze FAQ helemaal tot en met lezen om eventuele misverstanden uit de wereld te helpen? Het duurt slechts een paar minuten en het volgen van de richtlijnen zal de waarde van onze site voor u vergroten.
- @whuber De CDF is een van de weinige beschrijvingen waarin het woord distributie komt eigenlijk voor in de naam, en ik probeerde duidelijk te maken dat de symmetrie-eigenschap niet gold voor de CDF.
Answer
In het kort: $ X $ is symmetrisch wanneer $ X $ en $ 2aX $ dezelfde verdeling hebben voor een reëel getal $ a $. Maar hiertoe op een volledig gerechtvaardigde manier komen vereist enige uitweiding en generalisaties, omdat het veel impliciete vragen oproept: waarom deze definitie van” symmetrisch “? Kunnen er andere soorten symmetrieën zijn? Wat is de relatie tussen een distributie en zijn symmetrieën, en omgekeerd, wat is de relatie tussen een “symmetrie” en die distributies die die symmetrie zouden kunnen hebben?
De symmetrieën in kwestie zijn reflecties van de echte lijn. Ze hebben allemaal de vorm
$$ x \ tot 2a-x $$
voor een constante $ a $.
Dus, stel dat $ X $ deze symmetrie voor minstens één $ a $. Dan impliceert de symmetrie
$$ \ Pr [X \ ge a] = \ Pr [2a-X \ ge a] = \ Pr [X \ le a] $$
waaruit blijkt dat $ a $ een mediaan is van $ X $. Evenzo, als $ X $ een verwachting heeft, dan volgt onmiddellijk $ a = E [X] $. Zo kunnen we gewoonlijk $ a $ gemakkelijk vastpinnen. Zelfs als dat niet het geval is, $ a $ (en dus de symmetrie zelf) wordt nog steeds uniek bepaald (als het al bestaat).
Om dit te zien, laat $ b $ een willekeurig symmetriecentrum zijn. Als we beide symmetrieën toepassen, zien we dat $ X $ invariant is onder de vertaling $ x \ naar x + 2 (b-a) $. Als $ b-a \ ne 0 $, moet de verdeling van $ X $ een periode van $ b-a $ hebben, wat onmogelijk is omdat de totale kans op een periodieke verdeling $ 0 $ of oneindig is. Dus $ ba = 0 $, wat aangeeft dat $ a $ uniek is.
Meer in het algemeen wanneer $ G $ is een groep die getrouw handelt op de echte lijn (en bij uitbreiding op al zijn Borel-subsets), we zouden kunnen zeggen dat een distributie $ X $ “symmetrisch” is (met betrekking tot $ G $) wanneer
$$ \ Pr [X \ in E] = \ Pr [X \ in E ^ g] $$
voor alle meetbare sets $ E $ en elementen $ g \ in G $, waarbij $ E ^ g $ geeft het beeld van $ E $ aan onder invloed van $ g $.
Als voorbeeld: laat $ G $ nog steeds een groep zijn van $ 2 $, maar nu laat zijn actie zijn om het omgekeerde van een reëel getal te nemen (en $ 0 $ te laten repareren). De standaard lognormale verdeling is symmetrisch ten opzichte van deze groep. Dit voorbeeld kan worden opgevat als een voorbeeld van een reflectiesymmetrie waarbij een niet-lineaire heruitdrukking van de coördinaten heeft plaatsgevonden. Dit suggereert dat we ons moeten concentreren op transformaties die de “structuur” van de echte lijn respecteren. De structuur die essentieel is voor waarschijnlijkheid, moet gerelateerd zijn aan Borel sets en Lebesgue-maat, die beide kunnen worden gedefinieerd in termen van (Euclidische) afstand tussen twee punten.
Een afstand bewaren map is per definitie een isometrie. Het is algemeen bekend (en gemakkelijk, zij het een beetje ingewikkeld, om aan te tonen) dat alle isometrieën van de echte lijn worden gegenereerd door reflecties. Als men begrijpt dat “symmetrisch” symmetrisch betekent met betrekking tot een groep isometrieën , moet de groep worden gegenereerd door maximaal één reflectie en we hebben gezien dat reflectie uniek wordt bepaald door elke symmetrische verdeling ten opzichte ervan. In die zin is de voorgaande analyse uitputtend en rechtvaardigt ze de gebruikelijke terminologie van “symmetrische” distributies.
Overigens is er een groot aantal voorbeelden van meerdere varianten van verdelingen die invariant zijn onder groepen van isometrieën, wordt mogelijk gemaakt door rekening te houden met “bolvormige” verdelingen. Deze zijn invariant onder alle rotaties (relatief ten opzichte van een vast centrum). Deze generaliseren het eendimensionale geval: de “rotaties” van de echte lijn zijn slechts de reflecties.
Ten slotte is het de moeite waard erop te wijzen dat een standaardconstructie – gemiddeld over de groep – een manier biedt om ladingen symmetrische verdelingen te produceren. In het geval van de echte lijn, laat $ G $ worden gegenereerd door de reflectie rond een punt $ a $, zodat het bestaat uit het identiteitselement $ e $ en deze reflectie $ g $. Laat $ X $ elke distributie zijn. Definieer de verdeling $ Y $ door
$$ {\ Pr} _Y [E] = \ frac {1} {| G |} \ sum_ {g \ in G} {\ Pr} _X [ E ^ g] = ({\ Pr} _X [E] + {\ Pr} _X [E ^ g]) / 2 $$
voor alle Borel-sets $ E $. Dit is duidelijk symmetrisch en het is gemakkelijk om te controleren of het een verdeling blijft (alle kansen blijven niet negatief en de totale kans is $ 1 $).
Ter illustratie van het groepsmiddelingsproces wordt de PDF van een symmetrische gammadistributie (gecentreerd op $ a = 2 $) in goud weergegeven. De oorspronkelijke gammastraling is blauw en de reflectie is rood.
Opmerkingen
- (+1) Ik zou willen toevoegen dat, in de multivariate setting, de definitie van symmetrie is niet uniek. In dit boek zijn er 8 mogelijke definities van symmetrische multivariate distributies.
- @Procrastinator I ‘ ben benieuwd wat u zou kunnen bedoelen met ” niet uniek. ” AFAIK, alles wat de naam rechtvaardigt ” symmetrie ” verwijst uiteindelijk naar een groepsactie op een spatie. Het zou interessant zijn om te zien welke verschillende soorten acties statistici nuttig hebben gevonden. Omdat dat boek uitverkocht is en niet beschikbaar is op het web, zou je dan een snel voorbeeld kunnen geven van twee echt verschillende soorten symmetrie die in dat boek worden overwogen?
- Je intuïtie is correct, dit heeft te maken met statistische kenmerken : Centrale symmetrie $ {\ bf X} – \ mu \ stackrel {d} {=} – ({\ bf X} – \ mu) $; Sferische symmetrie $ X- \ mu \ stackrel {d} {=} {\ bf O} ({\ bf X} – \ mu) $ voor alle orthogonale matrix $ {\ bf O} $. De rest kan ik me niet herinneren, maar ik zal op deze dagen proberen het boek te lenen. In deze link kun je er een aantal vinden.
- @Procrastinator Bedankt. Merk op dat de twee voorbeelden die u aanbiedt beide speciale gevallen zijn van de algemene definitie die ik heb gegeven: de centrale symmetrie genereert een groep van isometrieën met twee elementen en de sferische symmetrieën zijn ook een subgroep van alle isometrieën. De ” elliptische symmetrie ” in de link is een sferische symmetrie na een affiene transformatie, en is dus een voorbeeld van het fenomeen waarnaar ik wees met de lognormale voorbeeld. De ” hoeksymmetrieën ” vormen weer een groep isometrieën. De ” halfspatiesymmetrie ” [sic] is geen symmetrie, maar maakt discrete afwijkingen mogelijk: dat ‘ s nieuw.
Antwoord
Het antwoord hangt af van wat je bedoelt met symmetrie. In de natuurkunde is het begrip symmetrie fundamenteel en zeer algemeen geworden. Symmetrie is elke bewerking die het systeem ongewijzigd laat.In het geval van een kansverdeling zou dit kunnen worden vertaald naar elke bewerking $ X \ naar X “$ die dezelfde kans $ P (X) = P (X”) $ retourneert.
In het eenvoudige geval van het eerste voorbeeld verwijst u naar de reflectiesymmetrie over het maximum. Als de verdeling sinusvormig zou zijn, zou je de voorwaarde $ X \ tot X + \ lambda $ kunnen hebben, waarbij $ \ lambda $ de golflengte of periode is. Dan $ P (X) = P (X + \ lambda) $ en zou nog steeds passen in een meer algemene definitie van symmetrie.