Dlaczego potrzebujemy sigma-algebr do definiowania przestrzeni prawdopodobieństwa?

Mamy eksperyment losowy z różnymi wyniki tworzące przestrzeń próbki $ \ Omega, $ , na którym z zainteresowaniem przyglądamy się pewnym wzorcom, zwanym wydarzeniami $ \ mathscr {F}. $ Sigma-algebras (lub sigma-fields) składają się ze zdarzeń, do których można przypisać miarę prawdopodobieństwa $ \ mathbb {P} $ . Pewne właściwości są spełnione, w tym uwzględnienie zbioru wartości null $ \ varnothing $ i całej przestrzeni próbkowania oraz algebry opisującej związki i przecięcia z diagramami Venna.

Prawdopodobieństwo jest zdefiniowane jako funkcja między $ \ sigma $ -algebra a przedziałem $ [0, 1] $ . W sumie potrójny $ (\ Omega, \ mathscr {F}, \ mathbb {P}) $ tworzy przestrzeń prawdopodobieństwa .

Czy ktoś mógłby wyjaśnić prostym językiem angielskim, dlaczego gmach prawdopodobieństwa zawaliłby się, gdybyśmy nie mieli $ \ sigma $ -algebra? Są po prostu wciśnięci w środek z tym niemożliwie kaligraficznym „F”. Ufam, że są konieczne; widzę, że zdarzenie różni się od wyniku, ale bez czego byłoby nie tak a $ \ sigma $ -algebras?

Pytanie brzmi: W jakiego rodzaju problemach z prawdopodobieństwem definicja przestrzeni prawdopodobieństwa zawierająca $ \ sigma $ -algebra staje się koniecznością?


Ten dokument online w witrynie Dartmouth University zapewnia prosty angielski dostępne wyjaśnienie. Chodzi o to, aby obracający się wskaźnik obracał się w kierunku przeciwnym do ruchu wskazówek zegara na okręgu jednostki obwodu:

tutaj wprowadź opis obrazu

Zaczynamy od skonstruowanie przędzarki, która składa się z koła o jednostkowym obwodzie i wskaźnika, jak pokazano na [rysunku]. Wybieramy punkt na okręgu i oznaczamy go $ 0 $ , a następnie oznaczamy każdy inny punkt na okręgu odległością, powiedzmy $ x $ , od $ 0 $ do tego punktu, mierzone przeciwnie do ruchu wskazówek zegara. Eksperyment polega na obracaniu wskaźnika i zapisywaniu etykiety punktu znajdującego się na końcu wskaźnika. Pozwoliliśmy, aby zmienna losowa $ X $ oznaczała wartość tego wyniku. Miejsce na próbkę to wyraźnie przedział $ [0,1) $ . Chcielibyśmy skonstruować model prawdopodobieństwa, w którym każdy wynik jest równie prawdopodobny. Jeśli będziemy postępować tak samo, jak […] dla eksperymentów ze skończoną liczbą możliwych wyników, to do każdego wyniku musimy przypisać prawdopodobieństwo 0 $ , ponieważ w przeciwnym razie suma prawdopodobieństw, obejmująca wszystkie możliwe wyniki, nie byłaby równa 1. (W rzeczywistości zsumowanie niezliczonej liczby liczb rzeczywistych jest trudnym zadaniem; w szczególności, aby taka suma miała co najwyżej jakiekolwiek znaczenie policzalnie wiele z nich może być innych niż 0 $ ). Jednakże, jeśli wszystkie przypisane prawdopodobieństwa to 0 $ , to suma to 0 $ , a nie 1 $ , jak powinno być.

Więc gdybyśmy przypisali każdemu punktowi jakiekolwiek prawdopodobieństwo i biorąc pod uwagę, że istnieje (niezliczona) nieskończona liczba punktów, ich suma wyniosłaby $ > 1 $ .

Komentarze

  • Proszenie o odpowiedzi na temat pól $ \ sigma $, które nie wspominają o teorii miary, wydaje się daremne!
  • Tak, chociaż … Nie jestem pewien, czy rozumiem twój komentarz.
  • Z pewnością potrzeba pól sigma nie jest ' t tylko kwestią opinia … Myślę, że można to omówić na temat tutaj (moim zdaniem).
  • Jeśli twoja potrzeba teorii prawdopodobieństwa ogranicza się do ” głów ” i ” ogony ” to oczywiście nie ma potrzeby stosowania pól $ \ sigma $!
  • Myślę, że to dobre pytanie.Tak często można zobaczyć w podręcznikach całkowicie zbędne odniesienia do trójek prawdopodobieństwa $ (\ Omega, \ mathcal {F}, P) $, które autor następnie całkowicie ignoruje.

Odpowiedź

Do Xi „an” pierwsza uwaga: Kiedy „mówisz o $ \ sigma $ -algebry, „pytasz o zbiory mierzalne, więc niestety każda odpowiedź musi skupiać się na teorii miary. Spróbuję jednak delikatnie do tego dojść.

Teoria prawdopodobieństwa, która przyjmuje wszystkie podzbiory niezliczonych zbiorów, zepsuje matematykę

Rozważmy ten przykład. Załóżmy, że masz kwadrat jednostkowy w $ \ mathbb {R} ^ 2 $ i „interesuje Cię prawdopodobieństwo losowego wybrania punktu, który jest członkiem określonego zestawu w kwadracie jednostkowym . W wielu okolicznościach można łatwo odpowiedzieć na to pytanie, opierając się na porównaniu obszarów różnych zestawów. Na przykład możemy narysować kilka okręgów, zmierzyć ich powierzchnie, a następnie przyjąć prawdopodobieństwo jako ułamek kwadratu mieszczącego się w okręgu. Bardzo proste.

Ale co, jeśli obszar zbioru nie jest dobrze zdefiniowany?

Jeśli obszar nie jest dobrze zdefiniowany, możemy uzasadnić dwa różne, ale całkowicie słuszne (w pewnym sensie) wnioski dotyczące tego, czym jest ten obszar. Moglibyśmy więc mieć $ P (A) = 1 $ z jednej strony i $ P (A) = 0 $ z drugiej strony, co implikuje 0 $ = 1 $ . To łamie całą matematykę nie do naprawienia. Możesz teraz udowodnić 5 $ < 0 $ i wiele innych niedorzecznych rzeczy. Najwyraźniej nie jest to zbyt użyteczne.

$ \ boldsymbol {\ sigma} $ -algebry to łatka poprawiająca matematykę

Czym dokładnie jest $ \ sigma $ -algebra, dokładnie? W rzeczywistości nie jest to aż tak przerażające. To tylko definicja tego, które zbiory mogą być traktowane jako zdarzenia. Elementy spoza $ \ mathscr {F} $ po prostu nie mają zdefiniowanej miary prawdopodobieństwa. Zasadniczo $ \ sigma $ -algebras to ” łatka „, która pozwala nam uniknąć niektórych patologiczne zachowania matematyki, czyli zbiory niemierzalne.

Trzy wymagania pola $ \ sigma $ można uznać za konsekwencje tego, co chcielibyśmy zrobić z prawdopodobieństwem: $ \ sigma $ -field to zbiór, który ma trzy właściwości:

  1. Zamknięcie pod policzalne zjednoczenia.
  2. Zamknięcie w policzalnych przecięciach.
  3. Zamknięcie pod policzalnymi skrzyżowaniami.

Policzalne związki i policzalne elementy skrzyżowań są bezpośrednimi konsekwencjami braku wymierny problem ze zbiorami. Zamknięcie pod komplementami jest konsekwencją aksjomatów Kołmogorowa: jeśli $ P (A) = 2/3 $ , $ P (A ^ c) $ powinno wynosić 1/3 $ . Ale bez (3) mogłoby się zdarzyć, że $ P (A ^ c) $ jest niezdefiniowany. To byłoby dziwne. Zamknięcie pod uzupełnieniami i aksjomatami Kołmogorowa pozwalają nam powiedzieć rzeczy takie jak $ P (A \ cup A ^ c) = P (A) + 1-P (A) = 1 $ .

Na koniec rozważamy zdarzenia w odniesieniu do $ \ Omega $ , więc dodatkowo wymagamy, aby $ \ Omega \ in \ mathscr {F} $

Dobra wiadomość: $ \ boldsymbol {\ sigma} $ -algebry są absolutnie niezbędne tylko dla niezliczonych zbiorów

Ale! Jest też dobra wiadomość. Lub przynajmniej sposób na obejście problemu. Potrzebujemy tylko $ \ sigma $ -algebr, jeśli pracujemy w zbiór o niezliczonej liczności. Jeśli ograniczymy się do policzalnych zestawów, możemy wziąć $ \ mathscr {F} = 2 ^ \ Omega $ moc zestawu $ \ Omega $ i nie będziemy mieć żadnego z tych problemów, ponieważ dla policzalnego $ \ Omega $ , $ 2 ^ \ Omega $ składa się tylko z mierzalnych zbiorów. (Jest to nawiązane w drugim komentarzu Xi.)” Zauważysz, że niektóre podręczniki faktycznie popełnią tutaj subtelną sztuczkę i rozważaj tylko policzalne zbiory podczas omawiania przestrzeni prawdopodobieństwa.

Dodatkowo, w problemach geometrycznych w $ \ mathbb {R} ^ n $ , to ” Wystarczy wziąć pod uwagę tylko $ \ sigma $ -algebras złożone z zestawów, dla których $ \ mathcal {L} ^ n Miara $ jest zdefiniowana. Aby nieco bardziej uziemić to, $ \ mathcal {L} ^ n $ dla $ n = 1,2 , 3 $ odpowiada zwykłym pojęciom długości, powierzchni i objętości.Więc to, co mówię w poprzednim przykładzie, to to, że zbiór musi mieć dobrze zdefiniowany obszar, aby mieć przypisane prawdopodobieństwo geometryczne. Powód jest następujący: jeśli dopuszczamy zbiory niemierzalne, możemy kończą się w sytuacjach, w których możemy przypisać prawdopodobieństwo 1 do jakiegoś zdarzenia na podstawie jakiegoś dowodu, a prawdopodobieństwo 0 do tego samego zdarzenia opartego na innym dowodzie.

Ale nie t niech połączenie z niezliczonymi zestawami cię zmyli! Powszechne błędne przekonanie, że $ \ sigma $ -algebras to policzalne zestawy. W rzeczywistości mogą być policzalne lub niepoliczalne. Rozważ tę ilustrację: tak jak poprzednio, mamy kwadrat jednostkowy. Zdefiniuj $$ \ mathscr {F} = \ text {Wszystkie podzbiory jednostki kwadratowej ze zdefiniowaną $ \ mathcal {L} ^ 2 $ measure}. $$ Możesz narysuj kwadrat $ B $ o długości boku $ s $ dla wszystkich $ s \ in (0,1) $ i jeden róg w $ (0,0) $ . Powinno być jasne, że ten kwadrat jest podzbiorem kwadratu jednostkowego. Co więcej, wszystkie te kwadraty mają zdefiniowany obszar, więc te kwadraty są elementami $ \ mathscr {F} $ . Ale powinno być również jasne, że istnieje niezliczona liczba kwadratów $ B $ : liczba takich kwadratów jest niepoliczalna, a każdy kwadrat ma zdefiniowaną miarę Lebesguea.

Z praktycznego punktu widzenia, samo zrobienie tej obserwacji jest często wystarczające, aby stwierdzić, że rozważasz tylko zbiory mierzalne Lebesguea, aby uzyskać postęp w walce z interesującym nas problemem.

Ale czekaj, co? zestaw niewymierny?

Obawiam się, że sam mogę rzucić na to trochę światła. Ale paradoks Banacha-Tarskiego (czasami ” słońce i groszek ” paradox) może nam trochę pomóc:

Biorąc pod uwagę solidną kulę w trójwymiarowej przestrzeni, istnieje rozkład kuli na skończoną liczbę rozłączne podzbiory, które można następnie złożyć w inny sposób, aby uzyskać dwie identyczne kopie oryginalnej piłki. Rzeczywiście, proces ponownego montażu obejmuje tylko przesuwanie elementów i obracanie ich, bez zmiany ich kształtu. Jednak same kawałki nie są ” bryłami ” w zwykłym znaczeniu, ale nieskończonymi rozproszeniami punktów. Rekonstrukcja może działać z zaledwie pięcioma elementami.

Silniejsza forma twierdzenia zakłada, że przy dwóch ” rozsądnych ” obiekty stałe (takie jak mała kula i ogromna kula), jeden z nich można ponownie złożyć w drugi. Często określa się to nieformalnie jako ” groszek można posiekać i ponownie złożyć w Słońcu ” i nazwać ” groszek i paradoks słońca „. 1

Więc jeśli” pracujesz z prawdopodobieństwami w $ \ mathbb {R} ^ 3 $ i „używasz prawdopodobieństwa geometrycznego zmierz (stosunek wolumenów), chcesz obliczyć prawdopodobieństwo wystąpienia jakiegoś zdarzenia. Ale będziesz miał trudności z precyzyjnym zdefiniowaniem tego prawdopodobieństwa, ponieważ możesz zmienić układ zestawów swojej przestrzeni, aby zmienić objętości! Jeśli prawdopodobieństwo zależy od głośności, możesz zmienić objętość zestawu tak, aby była wielkością słońca lub wielkością grochu, to prawdopodobieństwo również się zmieni. Dlatego żadne zdarzenie nie będzie miało przypisanego pojedynczego prawdopodobieństwa. Co gorsza, możesz zmienić kolejność $ S \ in \ Omega $ że objętość $ S $ ma $ V (S) > V (\ Omega) $ , co oznacza, że miara prawdopodobieństwa geometrycznego zgłasza prawdopodobieństwo $ P (S) > 1 $ , w rażącym naruszeniu aksjomatów Kołmogorowa, które wymagają, aby prawdopodobieństwo miało miarę 1.

Aby rozwiązać ten paradoks, można poczynić jedno z czterech ustępstw:

  1. objętość zestawu może się zmienić, gdy jest obracany.
  2. Objętość sumy dwóch rozłącznych zbiory mogą różnić się od sumy ich objętości.
  3. Aksjomaty teorii mnogości Zermelo – Fraenkla z aksjomatem wyboru (ZFC) mogą wymagać zmiany.
  4. Niektóre zbiory mogą wymagać zmiany być oznaczony jako ” niemierzalny ” i należałoby sprawdzić, czy zestaw jest ” mierzalne ” przed omówieniem jego objętości.

Opcja (1) nie pomaga w definiowaniu prawdopodobieństw, więc nie jest to możliwe. Opcja (2) narusza drugi aksjomat Kołmogorowa, więc wychodzi. Opcja (3) wydaje się być okropnym pomysłem, ponieważ ZFC rozwiązuje o wiele więcej problemów niż tworzy.Ale opcja (4) wydaje się atrakcyjna: jeśli rozwiniemy teorię tego, co jest, a co nie jest mierzalne, będziemy mieli dobrze zdefiniowane prawdopodobieństwa w tym problemie! To sprowadza nas z powrotem do teorii miary i naszego przyjaciela $ \ sigma $ -algebra.

Komentarze

  • Dziękuję za odpowiedź. $ \ mathcal {L} $ oznacza Lebesque mierzalne? ' daję +1 Twojej odpowiedzi na wiarę, ale ' naprawdę doceniam, gdybyś mógł obniżyć poziom matematyki o kilka stopni. .. 🙂
  • (+1) Zalety! Dodałbym również, że bez miary i algebr $ \ sigma $ warunkowanie i wyprowadzanie rozkładów warunkowych na niepoliczalnych przestrzeniach staje się dość skomplikowane, jak pokazuje paradoks Borela-Kołmogorowa .
  • @Xi ' dzięki za miłe słowa! To naprawdę wiele znaczy, pochodząc od ciebie. Nie byłem zaznajomiony z paradoksem Borela-Kołmogorowa w chwili pisania tego tekstu, ale ' poczytam trochę i zobaczę, czy uda mi się dodać pożyteczny dodatek do moich ustaleń. li>
  • @ Student001: Myślę, że dzielimy tutaj włosy. Masz rację, że ogólna definicja ” miary ” (dowolnej miary) jest podana przy użyciu pojęcia sigma-algebr. Chodzi mi jednak o to, że nie ma słowa ani pojęcia ” sigma-algebra ” w definicji miary Lebesguea podanej w mój pierwszy link. Innymi słowy, można zdefiniować miarę Lebesguea według mojego pierwszego linku, ale potem trzeba pokazać, że jest to miara i że ' to najtrudniejsza część. Zgadzam się jednak, że powinniśmy przerwać tę dyskusję.
  • Naprawdę podobała mi się twoja odpowiedź. Nie ' nie wiem, jak ci podziękować, ale ' dużo wyjaśniłeś! Nigdy ' nigdy nie studiowałem prawdziwej analizy ani nie miałem odpowiedniego wprowadzenia do matematyki. Pochodził z elektrotechniki, która skupiała się na praktycznym wdrożeniu. ' napisałeś to tak prostymi słowami, że facet taki jak ja mógłby to zrozumieć. Naprawdę doceniam twoją odpowiedź i prostotę, którą ' zapewniłeś. Dziękuję również @Xi ' an za jego spakowane komentarze!

Odpowiedź

Idea leżąca u podstaw (w bardzo praktyczny sposób) jest prosta. Załóżmy, że jesteś statystykiem pracującym nad jakąś ankietą. Załóżmy, że ankieta zawiera pytania dotyczące wieku, ale poproś respondenta tylko o podanie swojego wieku w określonych przedziałach, takich jak $ [0,18), [18, 25), [25,34), \ dots $. Zapomnijmy o innych pytaniach. Ten kwestionariusz definiuje „przestrzeń zdarzeń”, twoje $ (\ Omega, F) $. Algebra sigma $ F $ kodyfikuje wszystkie informacje, które można uzyskać z kwestionariusza, więc dla pytania o wiek (a na razie pomijamy wszystkie inne pytania) będzie zawierała przedział $ [18,25) $ ale nie inne przedziały jak $ [20,30) $, ponieważ z informacji uzyskanych w ankiecie nie możemy odpowiedzieć na pytanie typu: czy wiek respondentów należy do $ [20,30) $ czy nie? Mówiąc bardziej ogólnie, zbiór jest zdarzeniem (należy do $ F $) wtedy i tylko wtedy, gdy możemy zdecydować, czy punkt próbkowania należy do tego zestawu, czy nie.

Teraz zdefiniujmy zmienne losowe z wartościami w drugiej przestrzeni zdarzeń, $ (\ Omega „, F”) $. Jako przykład weźmy to jako prawdziwą linię ze zwykłą (borelowską) sigma-algebrą. Wtedy (nieinteresująca) funkcja, która nie jest zmienną losową, to $ f: $ „wiek respondentów to liczba pierwsza”, kodując ją jako 1, jeśli wiek jest liczbą pierwszą, 0 else. Nie, $ f ^ {- 1} (1) $ nie należą do $ F $, więc $ f $ nie jest zmienną losową. Powód jest prosty, nie możemy zdecydować na podstawie informacji zawartych w kwestionariuszu, czy wiek respondenta jest najlepszy, czy nie! Teraz możesz samemu zrobić ciekawsze przykłady.

Dlaczego wymagamy, aby $ F $ było a sigma algebra? Powiedzmy, że chcemy zadać dwa pytania dotyczące danych: „czy respondent numer 3 ma 18 lat lub więcej”, „czy respondent 3 jest kobietą”. Niech pytania definiują dwa zdarzenia (zestawy w $ F $) $ A $ i $ B $, zestawy punktów próbnych dające odpowiedź „tak” na to pytanie. Teraz zadajmy połączenie tych dwóch pytań „odpowiada 3 – kobieta w wieku 18 lat lub starsza”. Teraz to pytanie jest reprezentowane przez zestaw przecięcia $ A \ cap B $. W podobny sposób, dysjunkcje są reprezentowane przez zbiór zbiorczy $ A \ cup B $. Teraz wymaganie zamknięcia dla policzalnych skrzyżowań i związków pozwala nam zadawać policzalne spójniki lub dysjunkcje. jest reprezentowany przez zbiór komplementarny. To daje nam sigma-algebrę.

Ten rodzaj wprowadzenia zobaczyłem jako pierwszy w bardzo dobrym książka Petera Whittlea „Prawdopodobieństwo przez oczekiwanie” (Springer).

EDYTUJ

Próbując odpowiedzieć na pytanie whubers w komentarzu: „Byłem trochę zaskoczony na końcu, kiedy natknąłem się na stwierdzenie:„ wymaganie zamknięcia policzalnych skrzyżowań i związki pozwalają nam zadawać policzalne koniunkcje lub dysjunkcje. „Wydaje się, że to sedno sprawy: dlaczego ktoś miałby chcieć konstruować tak nieskończenie skomplikowane wydarzenie?” No cóż, dlaczego? Ogranicz się teraz do dyskretnego prawdopodobieństwa, powiedzmy, dla wygody, rzutu monetą. Rzucając monetą skończoną liczbę razy, wszystkie zdarzenia, które możemy opisać za pomocą monety, można wyrazić za pomocą zdarzeń typu „rzut głową w przód $ i $ „,” reszka w rzucie $ i $ oraz skończona liczba „i” lub „lub”. Czyli w tej sytuacji nie potrzebujemy $ \ sigma $ -algebr, wystarczą algebry zbiorów. Czy jest więc w tym kontekście sytuacja, w której pojawiają się $ \ sigma $ -algebry? W praktyce, nawet jeśli możemy rzucić kostką tylko skończoną liczbę razy, rozwijamy przybliżenia prawdopodobieństw za pomocą twierdzeń granicznych, gdy $ n $, liczba rzutów, rośnie bez ograniczeń. Spójrz więc na dowód centralnego twierdzenia granicznego dla tego przypadku, twierdzenie Laplacea-de Moivrea. Możemy udowodnić poprzez przybliżenia, używając tylko algebr, nie powinno być potrzebne $ \ sigma $ -algebra. Słabe prawo dużych liczb można udowodnić za pomocą nierówności Czebyszewa, a do tego potrzebujemy tylko obliczyć wariancję dla skończonych $ n $ przypadków. Ale dla silnego prawa duże liczby , zdarzenie, które udowodnimy, ma prawdopodobieństwo, można je wyrazić tylko przez policzalnie nieskończoną liczbę „i” i „lub” s, więc w przypadku silnego prawa dużych liczb potrzebujemy $ \ sigma $ -algebr.

Ale czy naprawdę potrzebujemy silnego prawa wielkich liczb? Według jednej odpowiedzi tutaj , może nie.

W pewnym sensie wskazuje to na bardzo dużą różnicę pojęciową między silnym i słabym prawem dużych liczb: silne prawo nie ma bezpośrednio empirycznego znaczenia, ponieważ dotyczy rzeczywistej zbieżności, której nigdy nie można zweryfikowane empirycznie. Z drugiej strony, słabe prawo dotyczy jakości aproksymacji rosnącej o $ n $, z numerycznymi granicami dla skończonego $ n $, więc jest bardziej znaczące empirycznie.

Zatem wszystkie praktyczne zastosowania dyskretnych prawdopodobieństwo mogłoby się obejść bez $ \ sigma $ -algebras. W przypadku przypadku ciągłego nie jestem tego taki pewien.

Komentarze

  • Nie ' Nie sądzę, że ta odpowiedź pokazuje, dlaczego pola $ \ sigma $ są niezbędny. Wygoda wynikająca z możliwości udzielenia odpowiedzi $ P (A) \ in [20,30) $ isn ' t wymagana przez matematykę. Nieco figlarnie można powiedzieć, że matematyka nie ' nie przejmuje się tym, co ' jest wygodne dla statystyków. Właściwie wiemy, że $ P (A) \ in [20,30) \ le P (A) \ in [18,34) $, które jest dobrze zdefiniowane, więc nie jest nawet jasne, czy ten przykład ilustruje, czego chcesz.
  • Nie ' nie potrzebujemy ” $ \ sigma $ ” część ” $ \ sigma $ -algebra ” dla dowolnej odpowiedzi, Kjetil. W rzeczywistości, dla podstawowego modelowania i wnioskowania o prawdopodobieństwie, wydaje się, że pracujący statystyka mógłby sobie poradzić z algebrami zbiorów, które są zamknięte tylko w ramach skończonych , niepoliczalnych związków. Najtrudniejsza część pytania Antoniego ' dotyczy tego, dlaczego potrzebujemy domknięcia w policzalnych nieskończonych związkach: jest to punkt, w którym podmiot staje się teorią miary zamiast elementarną kombinatoryka. (Widzę, że Aksakal również wskazał na to w niedawno usuniętej odpowiedzi.)
  • @whuber: masz oczywiście rację, ale w mojej odpowiedzi staram się podać jakąś motywację, dlaczego algebry (lub $ \ sigma $ -algebras) może przekazywać informacje. Jest to sposób na zrozumienie, dlaczego ta struktura alghebraiczna wchodzi w zakres prawdopodobieństwa, a nie coś innego. Oczywiście dodatkowo istnieją przyczyny techniczne wyjaśnione w odpowiedzi użytkownika777. I oczywiście, gdybyśmy mogli obliczyć prawdopodobieństwo w prostszy sposób, wszyscy byliby szczęśliwi …
  • Myślę, że twój argument jest rozsądny. Byłem trochę zaskoczony na końcu, gdy natknąłem się na to stwierdzenie: ” wymaganie zamknięcia policzalnych skrzyżowań i związków pozwala nam zadawać policzalne spójniki lub rozłączenia. ” Wydaje się, że to sedno problemu: dlaczego ktoś miałby chcieć konstruować tak nieskończenie skomplikowane wydarzenie? Dobra odpowiedź na to uczyniłaby resztę twojego postu bardziej przekonującą.
  • Re praktyczne zastosowania: teoria prawdopodobieństwa i miary stosowana w matematyce finansów (w tym stochastyczne równania różniczkowe, całki Ito, filtracje algebr, itp.) wygląda na to, że byłoby to niemożliwe bez algebr sigma. (Mogę ' zagłosować za zmianami, ponieważ już zagłosowałem na Twoją odpowiedź!)

Odpowiedź

Dlaczego probabiliści potrzebują $ \ boldsymbol { \ sigma} $ -algebra?

Aksjomaty $ \ sigma $ -algebry są dość naturalnie motywowane prawdopodobieństwem. Chcesz mieć możliwość pomiaru wszystkich regionów diagramu Venna, np. $ A \ cup B $ , $ (A \ cup B) \ cap C $ . Cytując z tej pamiętnej odpowiedzi :

Pierwszy aksjomat mówi, że $ \ oslash, X \ in \ sigma $ . Cóż, ZAWSZE wiesz, jakie jest prawdopodobieństwo, że nic się nie wydarzy ( 0 $ ) lub coś się wydarzy ( 1 $ ).

Drugi aksjomat jest zamknięty pod dopełnieniami. Podam głupi przykład. Ponownie rozważ rzut monetą z $ X = \ {H, T \} $ . Udawaj, że mówię ci, że $ \ sigma $ algebra dla tego odwrócenia to $ \ {\ oslash, X, \ {H \} \} $ . To znaczy, wiem, prawdopodobieństwo, że NIC się nie wydarzy, COŚ się wydarzy i orzeł, ale NIE WIEM „Nie znam prawdopodobieństwa reszki. Słusznie nazwałbyś mnie kretynem. Bo jeśli znasz prawdopodobieństwo orła, automatycznie poznaj prawdopodobieństwo reszki! Jeśli znasz prawdopodobieństwo, że coś się wydarzy, znasz prawdopodobieństwo, że to się NIE wydarzy (dopełnienie)!

Ostatni aksjomat jest zamknięty pod policzalnymi związkami. Podam ci kolejny głupi przykład. Rozważ rzut kostką lub $ X = \ {1,2,3,4,5,6 \} $ . A jeśli aby powiedzieć, że algebra $ \ sigma $ to $ \ {\ oslash, X, \ {1 \}, \ {2 \} \} $ . Oznacza to, że znam prawdopodobieństwo wyrzucenia 1 $ lub 2 $ , ale nie znam prawdopodobieństwa wyrzucenia 1 $ lub 2 $ . Znowu słusznie nazwałbyś mnie idiotą (mam nadzieję, że powód jest jasny). Co się dzieje, gdy zbiory nie są rozłączne, a to, co dzieje się z niezliczonymi związkami, jest trochę bardziej skomplikowane, ale mam nadzieję, że możesz spróbować pomyśleć o kilku przykładach.

Dlaczego potrzebujesz policzalności zamiast tylko skończonego $ \ boldsymbol {\ sigma} $ -additivity?

Cóż, nie jest to całkowicie czyste- przecięty przypadek, ale istnieją solidne powody, dla których .

Dlaczego probabiliści potrzebują miar?

W tym momencie , masz już wszystkie aksjomaty dla miary. Z $ \ sigma $ -additivity, non-negativity, null empty set, and the domain of $ \ sigma $ -algebra. Równie dobrze możesz wymagać, aby miarą była $ P $ . Teoria miary jest już uzasadniona .

Ludzie przynoszą zestaw Vitali i Banach-Tarski, aby wyjaśnić, dlaczego potrzebujesz teorii miary, ale myślę, że to mylące . Zestaw Vitali odchodzi tylko dla (nietrywialnych) miar, które są niezmienne w translacji, których przestrzenie prawdopodobieństwa nie wymagają. Banach-Tarski domaga się niezmienności rotacji. Ludzi zajmujących się analizą obchodzą ich osoby, ale probabiliści w rzeczywistości nie .

raison dêtre teorii miary w teorii prawdopodobieństwa ma na celu ujednolicenie traktowania dyskretnych i ciągłych kamperów, a ponadto dopuszczenie pojazdów mieszkalnych, które są mieszane i kamperów, które po prostu nie są.

Komentarze

  • Myślę, że ta odpowiedź może być świetnym dodatkiem do tego wątku, jeśli trochę go przerobisz. W obecnym stanie ' jest trudny do zrozumienia, ponieważ duże jego fragmenty zależą od linków do innych wątków komentarzy. Myślę, że gdybyście przedstawili to jako wyjaśnienie od dołu do góry, jak miary, skończona $ \ sigma $ -additivity i $ \ sigma $ -algebra pasują do siebie jako niezbędne cechy przestrzeni prawdopodobieństwa, byłoby znacznie silniejsze. ' jesteś bardzo blisko, ponieważ ' już podzieliłeś odpowiedź na różne segmenty, ale myślę, że segmenty wymagają więcej uzasadnienia i rozumowania aby być w pełni obsługiwanym.

Odpowiedź

Zawsze rozumiałem całą historię w ten sposób:

Zaczynamy od spacji, na przykład rzeczywistej linii $ \ mathbb {R} $ . Chcielibyśmy zastosować naszą miarę do podzbiorów tej przestrzeni , na przykład poprzez zastosowanie miary Lebesguea, która mierzy długość. Przykładem może być pomiar długości podzbioru $ [0, 0.5] \ cup [0,75, 1] $ . W tym przykładzie odpowiedź brzmi po prostu $ 0,5 + 0,25 = 0.75 $ , które możemy dość łatwo zdobyć. Zaczynamy się zastanawiać, czy możemy zastosować miarę Lebesguea do wszystkich podzbiorów prostej rzeczywistej.

Niestety to nie działa. Są takie patologiczne zbiory, które po prostu rozkładają matematykę . Jeśli zastosujesz miarę Lebesguea do tych zbiorów, otrzymasz niespójne wyniki. Przykładem jednego z tych zestawów patologicznych, znanych również jako zbiory niemierzalne, ponieważ dosłownie nie można ich zmierzyć, są zestawy Vitali.

Aby uniknąć tych szalonych zestawów, definiujemy miarę tak, aby działała tylko dla mniejszej grupy podzbiorów, zwanych zestawami mierzalnymi. Są to zestawy, które zachowują się konsekwentnie, gdy stosujemy do nich miary. Aby umożliwić nam wykonywanie operacji na tych zbiorach, takich jak łączenie ich ze związkami lub pobieranie ich dopełnień, wymagamy, aby te mierzalne zbiory utworzyły między sobą sigma-algebrę. Tworząc sigma-algebrę, stworzyliśmy rodzaj bezpiecznej przystani , w której nasze środki mogą działać, a jednocześnie pozwalamy nam na rozsądne manipulacje, aby uzyskać to, czego chcemy, takie jak przyjmowanie związków i komplementów. Dlatego potrzebujemy sigma-algebry, abyśmy mogli narysować region, w którym miara będzie działać, unikając jednocześnie niemierzalnych zbiorów. Zauważ, że gdyby nie było to dla tych patologicznych podzbiorów, mogę łatwo zdefiniować miarę działającą w ramach zbioru potęg w przestrzeni topologicznej. Jednak zbiór potęg zawiera wszelkiego rodzaju zbiory niemierzalne i dlatego mamy aby wybrać te mierzalne i uczynić je między sobą sigma-algebrą.

Jak widać, ponieważ sigma-algebry są używane do unikania zbiorów niemierzalnych, zbiory o skończonej wielkości don ” tak naprawdę potrzebujemy algebry sigma. Powiedzmy, że masz do czynienia z przestrzenią próbkowania $ \ Omega = \ {1, 2, 3 \} $ (może to być możliwym wynikiem losowej liczby wygenerowanej przez komputer.) Widać, że wymyślenie niemierzalnych zbiorów z taką przestrzenią próbkowania jest prawie niemożliwe. Miara (w tym przypadku miara prawdopodobieństwa) jest dobrze zdefiniowana dla dowolnego podzbioru $ \ Omega $ , o którym myślisz. Ale musimy zdefiniować sigma-algebry dla większych przestrzeni próbek, takich jak linia rzeczywista, abyśmy mogli uniknąć podzbiorów patologicznych, które psują nasze miary. Aby osiągnąć spójność w teoretycznych ramach prawdopodobieństwa, wymagamy, aby skończone przestrzenie próbkowe również tworzyły algebry sigma, tylko w których zdefiniowana jest miara prawdopodobieństwa. Sigma-algebry w skończonych przestrzeniach prób to kwestia techniczna, podczas gdy sigma-algebry w większych przestrzeniach próbek, takich jak linia rzeczywista, są koniecznością .

Jedna z powszechnych sigma-algebry, której używamy do prawdziwą linią jest sigma-algebra borela. Tworzą ją wszystkie możliwe zbiory otwarte, a następnie przyjmują komplementy i związki, aż zostaną osiągnięte trzy warunki sigma-algebry. Powiedzmy, że „rekonstruujesz sigma-algebrę borela dla $ \ mathbb {R} [0, 1] $ , robisz to, wypisując wszystkie możliwe zbiory otwarte, takie jako $ (0,5, 0,7), (0,03, 0,05), (0,2, 0,7), … $ i tak dalej, a jak możesz sobie wyobrazić, jest ich nieskończenie wiele możliwości, które możesz wymienić, a następnie bierzesz komplementy i związki, aż zostanie wygenerowana sigma-algebra. Jak możesz sobie wyobrazić, ta algebra sigma jest NAJLEPSZA. Jest niewyobrażalnie ogromna. Ale cudowną rzeczą w tym jest to, że wyklucza wszystkie szalone zestawy patologiczne, które zepsuły matematykę. Tych szalonych zestawów nie ma w borelowskiej sigma-algebrze. Poza tym ten zbiór jest wystarczająco obszerny, aby objąć prawie każdy potrzebny nam podzbiór. Trudno wymyślić podzbiór, który nie jest zawarty w sigma-algebrze borela.

I oto historia tego, dlaczego potrzebujemy sigma-algebry i sigma-algebry borela, które są powszechnym sposobem realizacji tego pomysłu.

Komentarze

  • ' +1 ' bardzo czytelne. Wydaje się jednak, że zaprzeczasz odpowiedzi @Yathartha Agarwalowi, który mówi „. Ludzie przynoszą zestaw Vitali i Banach-Tarski, aby wyjaśnić, dlaczego potrzebujesz teorii miary, ale myślę, że to mylące. Zestaw Vitali odchodzi tylko dla (nietrywialnych) miar, które są niezmienne w translacji, których przestrzenie prawdopodobieństwa nie wymagają. Banach-Tarski domaga się niezmienności rotacji. Analitykom zależy na nich, ale probabilistów tak naprawdę nie. „. Może masz jakieś przemyślenia na ten temat?
  • +1 (szczególnie w przypadku metafory ” bezpiecznej przystani „!) . @Stop Biorąc pod uwagę, że odpowiedź, do której się odnosisz, zawiera niewiele treści – zawiera tylko kilka opinii – nie jest ona warta rozważenia ani debaty ', IMHO.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *