Waarom hebben we sigma-algebras nodig om waarschijnlijkheidsruimten te definiëren?

We hebben een willekeurig experiment met verschillende resultaten die de voorbeeldruimte $ \ Omega, $ waarop we met interesse naar bepaalde patronen kijken, genaamd events $ \ mathscr {F}. $ Sigma-algebras (of sigma-velden) bestaan uit gebeurtenissen waaraan een waarschijnlijkheidsmaat $ \ mathbb {P} $ kan worden toegewezen. Er is aan bepaalde eigenschappen voldaan, waaronder de opname van de nulset $ \ varnothing $ en de volledige voorbeeldruimte, en een algebra die verbanden en snijpunten met Venn-diagrammen beschrijft.

Waarschijnlijkheid wordt gedefinieerd als een functie tussen de $ \ sigma $ -algebra en het interval $ [0, 1] $ . In totaal vormt de drievoudige $ (\ Omega, \ mathscr {F}, \ mathbb {P}) $ een kansruimte .

Kan iemand in gewoon Engels uitleggen waarom het waarschijnlijkheidsgebouw zou instorten als we “geen $ \ sigma $ -algebra? Ze zitten gewoon in het midden ingeklemd met die onmogelijk kalligrafische “F”. Ik vertrouw erop dat ze nodig zijn; ik zie dat een gebeurtenis anders is dan een uitkomst, maar wat zou er misgaan zonder a $ \ sigma $ -algebras?

De vraag is: Bij welk type waarschijnlijkheidsproblemen wordt de definitie van een waarschijnlijkheidsruimte inclusief een $ \ sigma $ -algebra een noodzaak?


Dit online document op de Dartmouth University-website biedt duidelijk Engels toegankelijke uitleg. Het idee is een draaiende wijzer die tegen de klok in draait op een cirkel van unit omtrek:

voer hier een beschrijving van de afbeelding in

We beginnen met het construeren van een spinner, die bestaat uit een cirkel van eenheidsomtrek en een wijzer, zoals weergegeven in [de] figuur. We kiezen een punt op de cirkel en labelen het $ 0 $ , en labelen vervolgens elk ander punt op de cirkel met de afstand, bijvoorbeeld $ x $ , van $ 0 $ tot dat punt, gemeten tegen de klok in. Het experiment bestaat uit het ronddraaien van de aanwijzer en het opnemen van het label van het punt aan de punt van de aanwijzer. We laten de willekeurige variabele $ X $ de waarde van deze uitkomst aangeven. De voorbeeldruimte is duidelijk het interval $ [0,1) $ . We willen een waarschijnlijkheidsmodel construeren waarin elke uitkomst even waarschijnlijk zal voorkomen. Als we doorgaan zoals we deden […] voor experimenten met een eindig aantal mogelijke uitkomsten, dan moeten we de kans $ 0 $ toewijzen aan elke uitkomst, aangezien anders, de som van de waarschijnlijkheden, over alle mogelijke uitkomsten, zou niet gelijk zijn aan 1. (In feite is het optellen van een ontelbaar aantal reële getallen een lastige zaak; in het bijzonder, wil een dergelijke som enige betekenis hebben, aftelbaar veel van de sommaties kunnen verschillen van $ 0 $ .) Als alle toegewezen kansen echter $ 0 $ , dan is de som $ 0 $ , niet $ 1 $ , zoals het hoort.

Dus als we aan elk punt een kans toekennen, en gezien het feit dat er een (ontelbaar) oneindig aantal punten is, zou hun som oplopen tot $ > 1 $ .

Commentaren

  • Het lijkt zelfvernietigend om antwoorden te vragen over $ \ sigma $ -velden die de maattheorie niet noemen!
  • Dat deed ik echter … ik weet niet zeker of ik uw opmerking begrijp.
  • De behoefte aan sigma-velden is beslist niet ‘ t gewoon een kwestie van mening … Ik denk dat dit hier als onderwerp kan worden beschouwd (naar mijn mening).
  • Als je behoefte aan kansrekening beperkt is tot ” heads ” en ” staarten ” dan is er duidelijk geen behoefte aan $ \ sigma $ -velden!
  • Ik denk dat dit een goede vraag is.Zo vaak zie je in studieboeken volkomen overbodige verwijzingen naar kansverdrievoudigingen $ (\ Omega, \ mathcal {F}, P) $ die de auteur daarna volledig negeert.

Antwoord

Op Xi “an” s eerste punt: wanneer je het hebt over $ \ sigma $ -algebras, je vraagt naar meetbare verzamelingen, dus helaas moet elk antwoord gericht zijn op de maattheorie. Ik zal echter proberen om dat voorzichtig op te bouwen.

Een waarschijnlijkheidstheorie die alle subsets van ontelbare verzamelingen toelaat, zal de wiskunde breken.

Beschouw dit voorbeeld. Stel dat je een eenheidskwadraat hebt in $ \ mathbb {R} ^ 2 $ , en je bent geïnteresseerd in de waarschijnlijkheid dat je willekeurig een punt selecteert dat deel uitmaakt van een specifieke set in het eenheidsvierkant . In veel gevallen kan dit gemakkelijk worden beantwoord op basis van een vergelijking van gebieden van de verschillende sets. We kunnen bijvoorbeeld enkele cirkels tekenen, hun oppervlakten meten en dan de waarschijnlijkheid nemen als het deel van het vierkant dat in de cirkel valt. Heel eenvoudig.

Maar wat als het gebied van de verzameling van interesse niet goed gedefinieerd is?

Als het gebied niet goed gedefinieerd is, kunnen we reden tot twee verschillende, maar volledig geldige (in zekere zin) conclusies over wat het gebied is. We zouden dus aan de ene kant $ P (A) = 1 $ kunnen hebben en $ P (A) = 0 $ aan de andere kant, wat $ 0 = 1 $ impliceert. Dit breekt alle wiskunde onherstelbaar. U kunt nu $ 5 < 0 $ en een aantal andere belachelijke dingen bewijzen. Dit is duidelijk niet “al te handig.

$ \ boldsymbol {\ sigma} $ -algebras zijn de patch die wiskunde oplost

Wat is een $ \ sigma $ -algebra precies? Het is eigenlijk niet zo beangstigend. Het is slechts een definitie van welke sets als gebeurtenissen kunnen worden beschouwd. Elementen die niet in $ \ mathscr {F} $ staan, hebben gewoon geen gedefinieerde kansmaat. Kort gezegd, $ \ sigma $ -algebras zijn de ” patch ” waarmee we sommige pathologisch gedrag van de wiskunde, namelijk niet-meetbare sets.

De drie vereisten van een $ \ sigma $ -veld kunnen worden beschouwd als consequenties van wat we zouden graag willen doen met waarschijnlijkheid: Een $ \ sigma $ -veld is een set die drie eigenschappen heeft:

  1. Afsluiting onder telbaar bonden.
  2. Afsluiting onder aftelbare kruispunten.
  3. Afsluiting onder complementen.

De telbare aansluitingen en telbare kruispuntencomponenten zijn directe gevolgen van de niet- meetbare setprobleem. Afsluiten onder complementen is een gevolg van de Kolmogorov-axiomas: if $ P (A) = 2/3 $ , $ P (A ^ c) $ zou $ 1/3 $ . Maar zonder (3) zou het kunnen gebeuren dat $ P (A ^ c) $ niet gedefinieerd is. Dat zou vreemd zijn. Afsluiting onder complementen en de Kolmogorov axiomas laten ons dingen zeggen als $ P (A \ cup A ^ c) = P (A) + 1-P (A) = 1 $ .

Ten slotte overwegen we gebeurtenissen in relatie tot $ \ Omega $ , dus we eisen verder dat $ \ Omega \ in \ mathscr {F} $

Goed nieuws: $ \ boldsymbol {\ sigma} $ -algebras zijn alleen strikt noodzakelijk voor ontelbare sets

Maar! Er is hier ook goed nieuws. Of, in ieder geval, een manier om het probleem te omzeilen. We hebben alleen $ \ sigma $ -algebras nodig als we werken in een set met ontelbare kardinaliteit. Als we ons beperken tot telbare sets, kunnen we $ \ mathscr {F} = 2 ^ \ Omega $ de machtsset van $ \ Omega $ en we zullen” geen van deze problemen hebben, want voor telbare $ \ Omega $ , $ 2 ^ \ Omega $ bestaat alleen uit meetbare sets. (Hierop wordt gezinspeeld in Xi” an “s tweede opmerking.) Je zult merken dat sommige studieboeken hier een subtiele goochelarij zullen plegen. , en neem alleen telbare sets in overweging bij het bespreken van waarschijnlijkheidsruimten.

Bovendien, in geometrische problemen in $ \ mathbb {R} ^ n $ , it ” is volkomen voldoende om alleen $ \ sigma $ -algebras te beschouwen die zijn samengesteld uit sets waarvoor de $ \ mathcal {L} ^ n $ -maatstaf is gedefinieerd. Om dit wat steviger te onderbouwen, $ \ mathcal {L} ^ n $ voor $ n = 1,2 , 3 $ komt overeen met de gebruikelijke noties van lengte, oppervlakte en volume.Dus wat ik in het vorige voorbeeld zeg, is dat de set een goed gedefinieerd gebied moet hebben om er een geometrische waarschijnlijkheid aan toe te wijzen. En de reden is deze: als we niet-meetbare sets toelaten, kunnen we eindigen in situaties waarin we kans 1 kunnen toekennen aan een gebeurtenis op basis van een bepaald bewijs, en kans 0 aan dezelfde gebeurtenis gebeurtenis op basis van een ander bewijs.

Maar niet laat de verbinding met ontelbare sets je in verwarring brengen! Een veel voorkomende misvatting dat $ \ sigma $ -algebras telbare sets zijn. In feite kunnen ze telbaar of ontelbaar zijn. Beschouw deze illustratie eens: zoals eerder hebben we een eenheidsvierkant. Definieer $$ \ mathscr {F} = \ text {Alle subsets van het eenheidsvierkant met gedefinieerde $ \ mathcal {L} ^ 2 $ maat}. $$ U kunt teken een vierkant $ B $ met zijde lengte $ s $ voor alle $ s \ in (0,1) $ , en met een hoek op $ (0,0) $ . Het moge duidelijk zijn dat dit vierkant een deelverzameling is van het eenheidsvierkant. Bovendien hebben al deze vierkanten een gedefinieerde oppervlakte, dus deze vierkanten zijn elementen van $ \ mathscr {F} $ . Maar het moet ook duidelijk zijn dat er ontelbaar veel vierkanten zijn $ B $ : het aantal van dergelijke vierkanten is ontelbaar, en elk vierkant heeft een Lebesgue-maat gedefinieerd.

Praktisch gezien is het maken van die observatie vaak genoeg om de observatie te maken dat je alleen Lebesgue-meetbare sets beschouwt om vooruitgang te boeken tegen het probleem van interesse.

Maar wacht, wat is er? niet-meetbare set?

Ik ben bang dat ik hier zelf maar een klein beetje licht op kan werpen. Maar de Banach-Tarski-paradox (soms de ” zon en erwt ” paradox) kan ons wat helpen:

Gegeven een solide bal in een driedimensionale ruimte, bestaat er een ontbinding van de bal in een eindig aantal onsamenhangende subsets, die vervolgens op een andere manier weer in elkaar kunnen worden gezet om twee identieke kopieën van de originele bal te verkrijgen. In feite omvat het hermontageproces alleen het verplaatsen van de stukken en het draaien ervan, zonder hun vorm te veranderen. De stukjes zelf zijn echter niet ” solids ” in de gebruikelijke zin, maar oneindige verstrooiingen van punten. De reconstructie kan met slechts vijf stukken werken.

Een sterkere vorm van de stelling impliceert dat gegeven twee ” redelijk ” vaste objecten (zoals een kleine bal en een enorme bal), beide kunnen weer in elkaar worden gezet. Dit wordt vaak informeel vermeld als ” een erwt kan worden fijngehakt en weer in elkaar gezet tot de zon ” en de erwt en de zon-paradox “. 1

Dus als je” werkt met kansen in $ \ mathbb {R} ^ 3 $ en je gebruikt de geometrische kans maat (de verhouding van volumes), wil je de waarschijnlijkheid van een gebeurtenis berekenen. Maar je zult moeite hebben om die kans precies te definiëren, omdat je de sets van je ruimte kunt herschikken om de volumes te veranderen! Als de waarschijnlijkheid afhangt van het volume, en je kunt het volume van de set aanpassen aan de grootte van de zon of de grootte van een erwt, dan zal de kans ook veranderen. Er wordt dus aan geen enkele gebeurtenis een enkele kans toegeschreven. Erger nog, je kunt $ S \ in \ Omega $ zodanig herschikken dat het volume van $ S $ $ V (S) > V heeft (\ Omega) $ , wat inhoudt dat de meetkundige kansmeting een waarschijnlijkheid rapporteert $ P (S) > 1 $ , in flagrante schending van de Kolmogorov-axiomas die vereisen dat waarschijnlijkheid maat 1 heeft.

Om deze paradox op te lossen, zou men een van de vier concessies kunnen doen:

  1. De het volume van een set kan veranderen wanneer deze wordt gedraaid.
  2. Het volume van de unie van twee disjunct sets kunnen verschillen van de som van hun volumes.
  3. De axiomas van de verzamelingenleer van Zermelo-Fraenkel met het axioma van keuze (ZFC) moeten mogelijk worden gewijzigd.
  4. Sommige sets kunnen getagd zijn ” niet-meetbaar “, en men zou moeten controleren of een set ” meetbaar ” alvorens over zijn volume te praten.

Optie (1) helpt niet bij het definiëren van waarschijnlijkheden, dus het is uit. Optie (2) schendt het tweede Kolmogorov-axioma, dus het is uit. Optie (3) lijkt een vreselijk idee omdat ZFC zoveel meer problemen oplost dan het creëert.Maar optie (4) lijkt aantrekkelijk: als we een theorie ontwikkelen over wat wel en niet meetbaar is, dan hebben we goed gedefinieerde kansen in dit probleem! Dit brengt ons terug bij het meten van theorie, en onze vriend de $ \ sigma $ -algebra.

Opmerkingen

  • Bedankt voor je antwoord. $ \ mathcal {L} $ staat voor Lebesque meetbaar? Ik ‘ zal je antwoord over geloof een +1 geven, maar ik ‘ zou het erg op prijs stellen als je het wiskundige niveau een aantal punten zou kunnen verlagen. .. 🙂
  • (+1) Goede punten! Ik zou er ook aan willen toevoegen dat zonder maat en $ \ sigma $ algebras, conditionering en het afleiden van voorwaardelijke verdelingen op ontelbare ruimten behoorlijk harig worden, zoals blijkt uit de Borel-Kolmogorov-paradox .
  • @Xi ‘ en Bedankt voor de vriendelijke woorden! Het betekent echt veel, van jou afkomstig. Ik was op het moment van schrijven niet bekend met de Borel-Kolmogorov-paradox, maar ik ‘ zal wat lezen en kijken of ik erin kan slagen een nuttige toevoeging van mijn bevindingen te maken.
  • @ Student001: Ik denk dat we hier haren splijten. U heeft gelijk dat de algemene definitie van ” maat ” (elke maat) wordt gegeven met behulp van het concept van sigma-algebras. Mijn punt is echter dat er geen woord of concept van ” sigma-algebra ” staat in de definitie van de Lebesgue-maat in mijn eerste schakel. Met andere woorden, men kan Lebesgue-maat definiëren volgens mijn eerste link, maar dan moet men aantonen dat het een maat is en dat ‘ s het moeilijkste deel. Ik ben het ermee eens dat we deze discussie moeten stoppen.
  • Ik vond het erg leuk om je antwoord te lezen. Ik weet niet ‘ hoe ik u moet bedanken, maar u ‘ hebt de zaken veel verduidelijkt! Ik ‘ heb nooit echte analyse bestudeerd en heb ook geen goede inleiding in wiskunde gehad. Kwam uit een elektrotechnische achtergrond die veel gericht was op praktische uitvoering. U ‘ hebt dat in zo eenvoudige bewoordingen geschreven dat een kerel als ik het kon begrijpen. Ik waardeer uw antwoord en de eenvoud die u ‘ hebt geboden. Ook dank aan @Xi ‘ an voor zijn volle commentaren!

Answer

Het onderliggende idee (in zeer praktische termen) is eenvoudig. Stel dat u een statisticus bent die met een enquête werkt. Laten we aannemen dat de enquête een aantal vragen over leeftijd bevat, maar de respondent alleen vragen om zijn leeftijd te identificeren in bepaalde intervallen, zoals $ [0,18), [18, 25), [25,34), \ dots $. Laten we de andere vragen vergeten. Deze vragenlijst definieert een “evenementruimte”, uw $ (\ Omega, F) $. De sigma-algebra $ F $ codeert alle informatie die kan worden verkregen uit de vragenlijst, dus voor de leeftijdsvraag (en voorlopig negeren we alle andere vragen), zal deze het interval $ [18,25) $ bevatten, maar geen andere intervallen zoals $ [20,30) $, aangezien we op basis van de informatie verkregen door de vragenlijst geen vragen kunnen beantwoorden als: behoort de leeftijd van de respondenten tot $ [20,30) $ of niet? Meer in het algemeen is een set een gebeurtenis (behoort tot $ F $) als en alleen als we kunnen beslissen of een samplepunt tot die set behoort of niet.

Laten we nu willekeurige variabelen definiëren met waarden in de tweede gebeurtenisruimte, $ (\ Omega “, F”) $. Neem als voorbeeld dat dit de echte lijn is met de gebruikelijke (Borel) sigma-algebra. Een (oninteressante) functie die geen willekeurige variabele is, is $ f: $ “leeftijd van de respondenten is een priemgetal”, en codeert dit als 1 als leeftijd een priemgetal is, anders 0. Nee, $ f ^ {- 1} (1) $ behoren niet tot $ F $, dus $ f $ is geen willekeurige variabele. De reden is simpel, we kunnen op basis van de informatie in de vragenlijst niet beslissen of de leeftijd van de respondent een priemgetal is of niet! Nu kunt u zelf meer interessante voorbeelden maken.

Waarom moeten we $ F $ een sigma-algebra? Laten we zeggen dat we twee vragen willen stellen over de gegevens, “is respondent nummer 3 18 jaar of ouder”, “is respondent 3 een vrouw”. Laat de vragen twee gebeurtenissen definiëren (sets in $ F $) $ A $ en $ B $, de sets met voorbeeldpunten die een “ja” antwoord geven op die vraag. Laten we nu de combinatie van de twee vragen stellen “is respondent 3 een vrouw van 18 jaar of ouder”. Nu wordt die vraag weergegeven door de set intersectie $ A \ cap B $. Op een vergelijkbare manier worden disjuncties weergegeven door set union $ A \ cup B $. Als we nu geslotenheid vereisen voor telbare kruispunten en vakbonden, kunnen we telbare voegwoorden of disjuncties stellen. En, een vraag ontkennen wordt weergegeven door de complementaire set. Dat geeft ons een sigma-algebra.

Ik zag dit soort introductie als eerste in de zeer goede boek door Peter Whittle “Waarschijnlijkheid via verwachting” (Springer).

BEWERK

Ik probeerde de vraag van Whubers te beantwoorden in een opmerking: “Ik was echter een beetje verbaasd aan het einde toen ik deze bewering tegenkwam:” vereist geslotenheid voor telbare kruispunten en vakbonden laten ons telbare voegwoorden of disjuncties vragen. “Dit lijkt de kern van de kwestie te raken: waarom zou iemand zon oneindig ingewikkelde gebeurtenis willen construeren?” Wel, waarom? Beperk ons nu tot een discrete waarschijnlijkheid, laten we voor het gemak zeggen dat munten worden gegooid. Als we de munt een eindig aantal keren gooien, kunnen alle gebeurtenissen die we met de munt kunnen beschrijven, worden uitgedrukt via gebeurtenissen van het type “head on throw $ i $ “,” tails on throw $ i $, en een eindig aantal “en” of “of”. Dus in deze situatie hebben we geen $ \ sigma $ -algebras nodig, algebras van verzamelingen zijn voldoende. Is er dus in deze context een situatie waarin $ \ sigma $ -algebras ontstaan? In de praktijk, zelfs als we de dobbelstenen maar een eindig aantal keren kunnen gooien, ontwikkelen we benaderingen van waarschijnlijkheden via limietstellingen wanneer $ n $, het aantal worpen, onbeperkt groeit. Bekijk daarom het bewijs van de centrale limietstelling voor dit geval, de Laplace-de Moivre-stelling. We kunnen bewijzen door middel van benaderingen met alleen algebras, er zou geen $ \ sigma $ -algebra nodig moeten zijn. De zwakke wet van grote getallen kan worden bewezen via de ongelijkheid van Chebyshev, en daarvoor hoeven we alleen de variantie te berekenen voor eindige $ n $ gevallen. Maar voor de sterke wet van grote getallen , de gebeurtenis die we aantonen heeft waarschijnlijkheid kan alleen worden uitgedrukt via een aftelbaar oneindig aantal “en” en “of” “s, dus voor de sterke wet van grote getallen we hebben $ \ sigma $ -algebras nodig.

Maar hebben we echt de sterke wet van grote getallen nodig? Volgens één antwoord hier , misschien niet.

In zekere zin wijst dit op een heel groot conceptueel verschil tussen de sterke en de zwakke wet van grote getallen: de sterke wet is niet direct empirisch zinvol, aangezien het gaat om daadwerkelijke convergentie, die nooit kan worden empirisch geverifieerd. De zwakke wet daarentegen gaat over de kwaliteit van de benadering die toeneemt met $ n $, met numerieke grenzen voor eindige $ n $, en is dus empirisch zinvoller.

Dus alle praktische toepassingen van discreet waarschijnlijkheid kan zonder $ \ sigma $ -algebras. Voor het continue geval ben ik niet zo zeker.

Opmerkingen

  • Ik denk niet dat ‘ dit antwoord aantoont waarom $ \ sigma $ -velden zijn noodzakelijk. Het gemak van het kunnen beantwoorden van $ P (A) \ in [20,30) $ is niet ‘ t vereist door wiskunde. Enigszins puckish zou je kunnen zeggen dat wiskunde ‘ niets kan schelen wat ‘ handig is voor statistici. Eigenlijk weten we dat $ P (A) \ in [20,30) \ le P (A) \ in [18,34) $, die is goed gedefinieerd, dus ‘ s is niet eens duidelijk dat dit voorbeeld illustreert wat u wilt.
  • We hebben ‘ de ” $ \ sigma $ ” deel van ” $ \ sigma $ -algebra ” voor elk van deze antwoorden, Kjetil. In feite, voor basismodellering en redenering over waarschijnlijkheid, lijkt het erop dat een werkende statisticus het prima zou kunnen redden met set algebras die alleen gesloten zijn onder eindige , niet telbare, vakbonden. Het moeilijke deel van Antoni ‘ s vraag betreft waarom we sluiting nodig hebben onder aftelbare oneindige vakbonden: dit is het punt waarop het onderwerp maattheorie wordt in plaats van elementair combinatoriek. (Ik zie dat Aksakal dat punt ook maakte in een recent verwijderd antwoord.)
  • @whuber: je hebt natuurlijk gelijk, maar in mijn antwoord probeer ik wat te motiveren waarom algebras (of $ \ sigma $ -algebras) kunnen informatie overbrengen. Het is een manier om te begrijpen waarom die alghebraïsche structuur waarschijnlijkheid binnengaat en niet iets anders. Natuurlijk zijn er bovendien de technische redenen die worden uitgelegd in het antwoord van user777. En natuurlijk, als we waarschijnlijkheid op een eenvoudiger manier zouden kunnen doen, zou iedereen gelukkig zijn …
  • Ik denk dat uw argument klopt. Ik was echter een beetje verbaasd aan het einde toen ik deze bewering tegenkwam: ” vereist geslotenheid voor telbare kruispunten en vakbonden laat ons telbare voegwoorden of disjuncties vragen. ” Dit lijkt de kern van het probleem te raken: waarom zou iemand zon oneindig gecompliceerde gebeurtenis willen construeren? Een goed antwoord daarop zou de rest van je bericht overtuigender maken.
  • Praktische toepassingen: de kans- en maattheorie die wordt gebruikt in de financiële wiskunde (inclusief stochastische differentiaalvergelijkingen, Ito-integralen, filtraties van algebras, etc.) ziet eruit alsof het onmogelijk zou zijn zonder sigma-algebras. (Ik kan ‘ niet stemmen voor de bewerkingen omdat ik al op uw antwoord heb gestemd!)

Antwoord

Waarom hebben probabilisten $ \ boldsymbol { \ sigma} $ -algebra?

De axiomas van $ \ sigma $ -algebras worden van nature gemotiveerd door waarschijnlijkheid. U wilt alle Venn-diagramgebieden kunnen meten, bijvoorbeeld $ A \ cup B $ , $ (A \ cup B) \ cap C $ . Om te citeren uit dit gedenkwaardige antwoord :

Het eerste axioma is dat $ \ oslash, X \ in \ sigma $ . U weet ALTIJD hoe waarschijnlijk het is dat er niets gebeurt ( $ 0 $ ) of dat er iets gebeurt ( $ 1 $ ).

Het tweede axioma is gesloten onder complementen. Laat me een stom voorbeeld geven. Overweeg nogmaals een muntstuk om te gooien met $ X = \ {H, T \} $ . Stel je voor dat ik je vertel dat de $ \ sigma $ algebra voor deze omslag $ \ {\ oslash, X, \ {H is \} \} $ . Dat wil zeggen, ik weet de waarschijnlijkheid dat er NIETS gebeurt, dat IETS gebeurt, en dat er een kop, maar ik weet NIET de waarschijnlijkheid van een munt. Je zou me terecht een idioot noemen. Want als je de waarschijnlijkheid van een kop weet, jij weet automatisch de waarschijnlijkheid van een munt! Als u de waarschijnlijkheid kent dat iets gebeurt, weet u de waarschijnlijkheid dat het NIET gebeurt (het complement)!

Het laatste axioma wordt afgesloten onder telbare vakbonden. Ik geef u een ander stom voorbeeld. Overweeg de worp van een dobbelsteen, of $ X = \ {1,2,3,4,5,6 \} $ . Wat als ik om u de $ \ sigma $ algebra te vertellen hiervoor is $ \ {\ oslash, X, \ {1 \}, \ {2 \} \} $ . Dat wil zeggen, ik weet hoe waarschijnlijk het is dat een $ 1 $ of een $ 2 $ , maar ik weet niet hoe waarschijnlijk het is dat een $ 1 $ of een $ 2 $ spanNogmaals, je zou me terecht een idioot noemen (ik hoop dat de reden duidelijk is). Wat er gebeurt als de sets niet onsamenhangend zijn, en wat er gebeurt met ontelbare vakbonden, is een beetje rommeliger, maar ik hoop dat je kunt proberen een paar voorbeelden te bedenken.

Waarom heb je telbaar nodig in plaats van alleen eindige $ \ boldsymbol {\ sigma} $ -additiviteit?

Nou, het is niet helemaal schoon- cut case, maar er zijn enkele solide redenen waarom .

Waarom hebben probabilisten maatregelen nodig?

Op dit punt , je hebt al alle axiomas voor een maat. Van $ \ sigma $ -additiviteit, niet-negativiteit, lege lege set en het domein van $ \ sigma $ -algebra. U kunt net zo goed eisen dat $ P $ een meting is. De maattheorie is al gerechtvaardigd .

Mensen brengen Vitalis set en Banach-Tarski binnen om uit te leggen waarom je maattheorie nodig hebt, maar ik denk dat dat misleidend . De verzameling van Vitali verdwijnt alleen voor (niet-triviale) maatregelen die niet-translatie-invariant zijn, en die waarschijnlijkheidsruimten niet vereisen. En Banach-Tarski vereist rotatie-invariantie. Analyse mensen geven om hen, maar probabilisten doen dat niet .

De reden dêtre van de maattheorie in de kansrekening is om de behandeling van discrete en continue RVs te verenigen, en bovendien om RVs toe te staan die gemengd zijn en RVs die simpelweg geen van beide zijn.

Reacties

  • Ik denk dat dit antwoord een geweldige aanvulling zou kunnen zijn op deze thread als je er een beetje aan werkt. Zoals het er nu uitziet, is het ‘ moeilijk te volgen omdat grote delen ervan afhankelijk zijn van links naar andere commentaarthreads. Ik denk dat als je het zou uitleggen als een verklaring van onder naar boven over hoe maatregelen, eindige $ \ sigma $ -additiviteit en $ \ sigma $ -algebra bij elkaar passen als noodzakelijke kenmerken van waarschijnlijkheidsruimten, het veel sterker zou zijn. Je ‘ komt heel dichtbij, omdat je ‘ het antwoord al in verschillende segmenten hebt opgesplitst, maar ik denk dat de segmenten meer rechtvaardiging en redenering nodig hebben om volledig ondersteund te worden.

Antwoord

Ik “heb het hele verhaal altijd als volgt begrepen:

We beginnen met een spatie, zoals de echte regel $ \ mathbb {R} $ . We willen onze meting toepassen op subsets van deze ruimte , zoals door de Lebesgue-maat toe te passen, die de lengte meet. Een voorbeeld is het meten van de lengte van de subset $ [0, 0.5] \ cup [0.75, 1] $ . Voor dit voorbeeld is het antwoord eenvoudig $ 0,5 + 0,25 = 0.75 $ , die we vrij gemakkelijk kunnen verkrijgen. We beginnen ons af te vragen of we de Lebesgue-maat kunnen toepassen op alle subsets van de echte lijn.

Helaas werkt het niet. Er zijn deze pathologische sets die de wiskunde simpelweg afbreken . Als je de Lebesgue-maat op deze sets toepast, krijg je inconsistente resultaten. Een voorbeeld van een van deze pathologische sets, ook wel niet-meetbare sets genoemd omdat ze letterlijk “niet kunnen worden gemeten, zijn de Vitali-sets.

Om deze gekke sets te vermijden, definiëren we de maat om alleen te werken voor een kleinere groep van subsets, meetbare sets genaamd. Dit zijn de sets die zich consistent gedragen als we er maatregelen op toepassen. Om ons in staat te stellen operaties met deze sets uit te voeren, bijvoorbeeld door ze te combineren met vakbonden of door hun complementen te nemen, hebben we deze meetbare sets nodig om onderling een sigma-algebra te vormen. Door een sigma-algebra te vormen, hebben we een soort veilige haven gevormd waar onze maatregelen in kunnen opereren, terwijl we ook redelijke manipulaties kunnen uitvoeren om te krijgen wat we willen, zoals het aangaan van vakbonden en aanvullingen. Daarom hebben we een sigma-algebra nodig, zodat we een regio kunnen uittekenen waarbinnen de maatregel kan werken, terwijl we niet-meetbare sets kunnen vermijden. Merk op dat als het niet voor deze pathologische subsets was, ik gemakkelijk de maat kan definiëren om binnen de vermogensset van de topologische ruimte te werken. De vermogensset bevat echter allerlei niet-meetbare sets, en daarom hebben we om de meetbare te kiezen en ze onderling een sigma-algebra te laten vormen.

Zoals je kunt zien, aangezien sigma-algebras worden gebruikt om niet-meetbare verzamelingen te vermijden, worden verzamelingen die eindig zijn niet ” Ik heb eigenlijk geen sigma-algebra nodig. Stel dat je te maken hebt met een voorbeeldruimte $ \ Omega = \ {1, 2, 3 \} $ (dit kan het hele mogelijke resultaat zijn van een willekeurig getal gegenereerd door een computer.) Je kunt zien dat het vrijwel onmogelijk is om niet-meetbare sets te bedenken met zon sample-ruimte. De maat (in dit geval een waarschijnlijkheidsmaat) is goed gedefinieerd voor elke subset van $ \ Omega $ die u maar kunt bedenken. Maar we moeten wel sigma-algebras definiëren voor grotere monsterruimten, zoals de echte lijn, zodat we pathologische subsets kunnen vermijden die onze metingen opsplitsen. Om consistentie te bereiken in het theoretische raamwerk van waarschijnlijkheid, eisen we dat eindige steekproefruimten ook sigma-algebras vormen, waarbij alleen de kansmaat is gedefinieerd. Sigma-algebras in eindige monsterruimten is een technisch aspect, terwijl sigma-algebras in grotere monsterruimten zoals de echte lijn een noodzaak is.

Een veel voorkomende sigma-algebra die we gebruiken voor de echte lijn is de Borel sigma-algebra. Het wordt gevormd door alle mogelijke open sets, en vervolgens de complementen en vakbonden nemen totdat aan de drie voorwaarden van een sigma-algebra is voldaan. Stel dat u “de Borel sigma-algebra opnieuw construeert voor $ \ mathbb {R} [0, 1] $ , u dat doet door alle mogelijke open sets op te sommen, zoals als $ (0,5, 0,7), (0,03, 0,05), (0,2, 0,7), … $ enzovoort, en zoals u zich kunt voorstellen zijn er oneindig veel vele mogelijkheden die je kunt noemen, en dan neem je de aanvullingen en verbanden totdat een sigma-algebra is gegenereerd. Zoals je je kunt voorstellen is deze sigma-algebra een BEEST. Het is onvoorstelbaar groot. Maar het mooie ervan is dat het alle gekke pathologische sets die de wiskunde kapotmaken. Die gekke sets zijn niet in de Borel sigma-algebra. Deze set is ook alomvattend genoeg om bijna elke subset te bevatten die we nodig hebben. Het is moeilijk om een subset die niet is opgenomen in de Borel sigma-algebra.

En dat is het verhaal van waarom we sigma-algebras nodig hebben en Borel sigma-algebras zijn een gebruikelijke manier om dit idee te implementeren.

Reacties

  • ‘ +1 ‘ zeer leesbaar. Je lijkt echter het antwoord van @Yatharth Agarwal, die ” zegt, tegen te spreken. Mensen brengen Vitalis set en Banach-Tarski in om uit te leggen waarom je de maattheorie nodig hebt, maar ik denk dat dat misleidend is. De verzameling van Vitali verdwijnt alleen voor (niet-triviale) maatregelen die niet-translatie-invariant zijn, en die waarschijnlijkheidsruimten niet vereisen. En Banach-Tarski vereist rotatie-invariantie. Analyse mensen geven om hen, maar probabilisten eigenlijk niet. “. Misschien heb je daar wat gedachten over?
  • +1 (vooral voor de ” veilige haven ” metafoor!) . @Stop Gezien het feit dat het antwoord waarnaar u verwijst weinig daadwerkelijke inhoud heeft – het geeft slechts enkele meningen weer – is het ‘ niet veel aandacht of discussie waard, IMHO.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *