Abbiamo un esperimento casuale con risultati che formano lo spazio campione $ \ Omega, $ su cui guardiamo con interesse a determinati schemi, chiamati eventi $ \ mathscr {F}. $ Sigma-algebras (o sigma-fields) sono costituiti da eventi a cui può essere assegnata una misura di probabilità $ \ mathbb {P} $ . Alcune proprietà sono soddisfatte, inclusa linclusione dellinsieme nullo $ \ varnothing $ e lintero spazio campionario, e unalgebra che descrive unioni e intersezioni con i diagrammi di Venn.
La probabilità è definita come una funzione tra $ \ sigma $ -algebra e lintervallo $ [0, 1] $ . Complessivamente, il triplo $ (\ Omega, \ mathscr {F}, \ mathbb {P}) $ forma un spazio delle probabilità .
Qualcuno potrebbe spiegare in un inglese semplice perché ledificio della probabilità crollerebbe se non avessimo un $ \ sigma $ -algebra? Sono solo incastrati nel mezzo con quella “F” incredibilmente calligrafica. Spero che siano necessari; Vedo che un evento è diverso da un risultato, ma cosa andrebbe storto senza a $ \ sigma $ -algebras?
La domanda è: In quale tipo di problemi di probabilità la definizione di uno spazio di probabilità che includa un $ \ sigma $ -algebra diventa una necessità?
Questo documento online sul sito web della Dartmouth University fornisce un inglese semplice spiegazione accessibile. Lidea è un puntatore rotante che ruota in senso antiorario su un cerchio di unità perimetro:
Iniziamo con costruire uno spinner, che consiste in un cerchio di circonferenza unitaria e un puntatore come mostrato in [la] Figura. Scegliamo un punto sul cerchio e lo etichettiamo $ 0 $ , quindi etichettiamo ogni altro punto del cerchio con la distanza, ad esempio $ x $ , da $ 0 $ a quel punto, misurato in senso antiorario. Lesperimento consiste nel far girare il puntatore e registrare letichetta del punto sulla punta del puntatore. Lasciamo che la variabile casuale $ X $ denoti il valore di questo risultato. Lo spazio campione è chiaramente lintervallo $ [0,1) $ . Vorremmo costruire un modello di probabilità in cui ogni risultato abbia la stessa probabilità di verificarsi. Se procediamo come abbiamo fatto […] per gli esperimenti con un numero finito di risultati possibili, allora dobbiamo assegnare la probabilità $ 0 $ a ciascun risultato, altrimenti, la somma delle probabilità, su tutti i possibili risultati, non sarebbe uguale a 1. (In effetti, sommare un numero incalcolabile di numeri reali è una faccenda complicata; in particolare, affinché tale somma abbia un significato, al massimo numerabilmente molti degli addendi possono essere diversi da $ 0 $ .) Tuttavia, se tutte le probabilità assegnate sono $ 0 $ , la somma sarà $ 0 $ , non $ 1 $ , come dovrebbe essere.
Quindi se assegnassimo a ciascun punto una probabilità e dato che esiste un numero infinito di punti (non numerabile), la loro somma si sommerebbe a $ > 1 $ .
Commenti
- Sembra controproducente chiedere risposte sui campi $ \ sigma $ che non menzionano la teoria della misura!
- Lho fatto, però … non sono sicuro di aver capito il tuo commento.
- Sicuramente la necessità di campi sigma non è ‘ è solo questione di opinione … penso che questo possa essere considerato sullargomento qui (secondo me).
- Se il tuo bisogno di teoria della probabilità è limitato a ” teste ” e ” tails ” quindi chiaramente non cè bisogno di $ \ sigma $ -fields!
- Penso che questa sia una buona domanda.Così spesso nei libri di testo si vedono riferimenti completamente superflui alle probabilità triple $ (\ Omega, \ mathcal {F}, P) $ che lautore poi ignora completamente.
risposta
Al primo punto di Xi “an”: quando stai parlando di $ \ sigma $ -algebre, stai chiedendo degli insiemi misurabili, quindi sfortunatamente qualsiasi risposta deve concentrarsi sulla teoria della misura. Cercherò di svilupparlo con delicatezza, però.
Una teoria della probabilità che ammetta tutti i sottoinsiemi di insiemi non numerabili romperà la matematica
Considera questo esempio. Supponi di avere ununità quadrata in $ \ mathbb {R} ^ 2 $ e sei interessato alla probabilità di selezionare casualmente un punto che è un membro di un insieme specifico nel quadrato delle unità . In molte circostanze, è possibile rispondere prontamente sulla base di un confronto di aree dei diversi set. Ad esempio, possiamo disegnare alcuni cerchi, misurare le loro aree e quindi prendere la probabilità come la frazione del quadrato che cade nel cerchio. Molto semplice.
Ma cosa succede se larea dellinsieme di interesse non è ben definita?
Se larea non è ben definita, allora possiamo ragionare su due differenti ma conclusioni completamente valide (in un certo senso) su cosa sia larea. Quindi potremmo avere $ P (A) = 1 $ da un lato e $ P (A) = 0 $ daltra parte, il che implica $ 0 = 1 $ . Questo rompe tutta la matematica in modo irreparabile. Ora puoi provare $ 5 < 0 $ e una serie di altre cose assurde. Chiaramente questo non è troppo utile.
$ \ boldsymbol {\ sigma} $ -algebre sono la patch che risolve la matematica
Che cosè un $ \ sigma $ -algebra, precisamente? In realtà non è così spaventoso. È solo una definizione di quali insiemi possono essere considerati eventi. Gli elementi non in $ \ mathscr {F} $ semplicemente non hanno una misura di probabilità definita. Fondamentalmente, $ \ sigma $ -algebra sono la ” patch ” che ci consente di evitare alcuni comportamenti patologici della matematica, vale a dire insiemi non misurabili.
I tre requisiti di un campo $ \ sigma $ possono essere considerati come conseguenze di ciò vorremmo fare con probabilità: Un campo $ \ sigma $ è un insieme che ha tre proprietà:
- Chiusura sotto numerabile unioni.
- Chiusura sotto intersezioni numerabili.
- Chiusura sotto complementi.
Le unioni numerabili e le componenti delle intersezioni numerabili sono conseguenze dirette del non- problema misurabile dellinsieme. La chiusura sotto i complementi è una conseguenza degli assiomi di Kolmogorov: if $ P (A) = 2/3 $ , $ P (A ^ c) $ dovrebbe essere $ 1/3 $ . Ma senza (3), potrebbe accadere che $ P (A ^ c) $ non sia definito. Sarebbe strano. La chiusura sotto i complementi e gli assiomi di Kolmogorov ci permette di dire cose come $ P (A \ cup A ^ c) = P (A) + 1-P (A) = 1 $ .
Infine, stiamo considerando gli eventi in relazione a $ \ Omega $ , quindi richiediamo ulteriormente che $ \ Omega \ in \ mathscr {F} $
Buone notizie: $ \ boldsymbol {\ sigma} $ -algebre sono strettamente necessarie solo per insiemi non numerabili
Ma! Ci sono anche buone notizie qui. O almeno, un modo per aggirare il problema. Abbiamo solo bisogno di $ \ sigma $ -algebras se “stiamo lavorando un insieme con innumerevoli cardinalità. Se ci limitiamo agli insiemi numerabili, possiamo prendere $ \ mathscr {F} = 2 ^ \ Omega $ linsieme di potenza di $ \ Omega $ e non avremo nessuno di questi problemi perché per $ \ Omega $ numerabile, $ 2 ^ \ Omega $ consiste solo di insiemi misurabili. (Questo è accennato nel secondo commento di Xi). Noterai che alcuni libri di testo eseguiranno effettivamente un sottile gioco di prestigio qui e considera solo gli insiemi numerabili quando si discute di spazi di probabilità.
Inoltre, nei problemi geometrici in $ \ mathbb {R} ^ n $ , it ” è perfettamente sufficiente per considerare solo $ \ sigma $ -algebre composto da insiemi per i quali il $ \ mathcal {L} ^ n La misura $ è definita. Per fondarla in modo un po più saldo, $ \ mathcal {L} ^ n $ per $ n = 1,2 , 3 $ corrisponde alle solite nozioni di lunghezza, area e volume.Quindi quello che sto dicendo nellesempio precedente è che linsieme deve avere unarea ben definita affinché gli sia assegnata una probabilità geometrica. E il motivo è questo: se ammettiamo insiemi non misurabili, allora possiamo finiamo in situazioni in cui possiamo assegnare la probabilità 1 a qualche evento in base a una prova e la probabilità 0 a lo stesso evento evento in base a qualche altra prova.
Ma non lascia che la connessione a innumerevoli set ti confonda! Un malinteso comune secondo cui $ \ sigma $ -algebre sono insiemi numerabili. In effetti, possono essere numerabili o non numerabili. Considera questa illustrazione: come prima, abbiamo un quadrato unitario. Definisci $$ \ mathscr {F} = \ text {Tutti i sottoinsiemi dellunità quadrata con $ \ mathcal {L} ^ 2 $ measure} definiti. $$ Puoi disegna un $ B $ quadrato con lunghezza laterale $ s $ per tutti i $ s \ in (0,1) $ e con un angolo in $ (0,0) $ . Dovrebbe essere chiaro che questo quadrato è un sottoinsieme del quadrato unitario. Inoltre, tutti questi quadrati hanno unarea definita, quindi questi quadrati sono elementi di $ \ mathscr {F} $ . Ma dovrebbe anche essere chiaro che ci sono innumerevoli quadrati $ B $ : il numero di tali quadrati è innumerevole e ogni quadrato ha una misura di Lebesgue.
Quindi, in pratica, fare semplicemente questa osservazione è spesso sufficiente per fare losservazione che si considerano solo insiemi misurabili con Lebesgue per ottenere progressi contro il problema di interesse.
Ma aspetta, cosa “sa set non misurabile?
Temo di poter fare solo un po di luce su questo da solo. Ma il paradosso Banach-Tarski (a volte il ” sole e pisello ” paradosso) può aiutarci:
Data una palla solida nello spazio tridimensionale, esiste una decomposizione della palla in un numero finito di sottoinsiemi disgiunti, che possono quindi essere rimessi insieme in un modo diverso per produrre due copie identiche della palla originale. In effetti, il processo di rimontaggio prevede solo lo spostamento dei pezzi e la loro rotazione, senza modificarne la forma. Tuttavia, i pezzi stessi non sono ” solidi ” nel solito senso, ma infinite dispersioni di punti. La ricostruzione può funzionare con un minimo di cinque parti.
Una forma più forte del teorema implica che, dati due qualsiasi ” ragionevole ” oggetti solidi (come una pallina piccola e una palla enorme), uno può essere riassemblato nellaltro. Questo è spesso dichiarato in modo informale come ” un pisello può essere sminuzzato e riassemblato nel Sole ” e chiamato ” pisello e il paradosso del sole “. 1
Quindi, se” stai lavorando con le probabilità in $ \ mathbb {R} ^ 3 $ e stai “utilizzando la probabilità geometrica misura (il rapporto dei volumi), vuoi calcolare la probabilità di qualche evento. Ma farai fatica a definire quella probabilità con precisione, perché puoi riorganizzare gli insiemi del tuo spazio per cambiare i volumi! Se la probabilità dipende dal volume, e puoi cambiare il volume dellinsieme in modo che sia la dimensione del sole o la dimensione del un pisello, allora anche la probabilità cambierà. Quindi a nessun evento sarà attribuita una sola probabilità. Ancora peggio, puoi riorganizzare $ S \ in \ Omega $ come che il volume di $ S $ ha $ V (S) > V (\ Omega) $ , il che implica che la misura di probabilità geometrica riporta una probabilità $ P (S) > 1 $ , in flagrante violazione degli assiomi di Kolmogorov che richiedono che la probabilità abbia misura 1.
Per risolvere questo paradosso, si potrebbe fare una delle quattro concessioni:
- Il il volume di un insieme potrebbe cambiare quando viene ruotato.
- Il volume dellunione di due disgiunti gli insiemi potrebbero essere diversi dalla somma dei loro volumi.
- Gli assiomi della teoria degli insiemi di Zermelo – Fraenkel con lassioma della scelta (ZFC) potrebbero dover essere modificati.
- Alcuni insiemi potrebbero essere taggato ” non misurabile ” e si dovrebbe verificare se un insieme è ” misurabile ” prima di parlare del suo volume.
Lopzione (1) non aiuta a definire le probabilità, quindi è fuori. Lopzione (2) viola il secondo assioma di Kolmogorov, quindi è fuori. Lopzione (3) sembra unidea pessima perché ZFC risolve molti più problemi di quanti ne crea.Ma lopzione (4) sembra attraente: se sviluppiamo una teoria di ciò che è e non è misurabile, avremo probabilità ben definite in questo problema! Questo ci riporta alla teoria della misura e al nostro amico $ \ sigma $ -algebra.
Commenti
- Grazie per la tua risposta. $ \ mathcal {L} $ sta per Lebesque misurabile? ‘ farò +1 sulla tua risposta per fede, ma ‘ apprezzerei davvero se potessi abbassare il livello di matematica di parecchie tacche. .. 🙂
- (+1) Buoni punti! Aggiungerei anche che senza misure e $ \ sigma $ algebre, condizionare e derivare distribuzioni condizionali su spazi non numerabili diventa piuttosto complicato, come mostrato dal paradosso di Borel-Kolmogorov .
- @Xi ‘ an Grazie per le parole gentili! Significa davvero molto, detto da te. Non conoscevo il paradosso di Borel-Kolmogorov al momento della stesura di questo articolo, ma ‘ leggerò un po e vedrò se riesco a fare unutile aggiunta alle mie scoperte. li>
- @ Student001: Penso che stiamo spaccando i capelli qui. Hai ragione nel dire che la definizione generale di ” measure ” (qualsiasi misura) è data usando il concetto di sigma-algebre. Il punto, tuttavia, è che non esiste una parola o un concetto di ” sigma-algebra ” nella definizione della misura di Lebesgue fornita in il mio primo collegamento. In altre parole, si può definire la misura di Lebesgue secondo il mio primo collegamento, ma poi bisogna dimostrare che si tratta di una misura e che ‘ è la parte difficile. Tuttavia, sono daccordo sul fatto che dovremmo interrompere questa discussione.
- Mi è piaciuto molto leggere la tua risposta. Non ‘ non so come ringraziarti, ma ‘ hai chiarito molto! ‘ non ho mai studiato analisi reale né ho avuto unadeguata introduzione alla matematica. Proviene da un background di ingegneria elettrica che si è concentrato molto sullimplementazione pratica. Lo ‘ lhai scritto in termini così semplici che un tipo come me potrebbe capirlo. Apprezzo molto la tua risposta e la semplicità che ‘ hai fornito. Grazie anche a @Xi ‘ an per i suoi numerosi commenti!
Answer
Lidea alla base (in termini molto pratici) è semplice. Supponi di essere uno statistico che lavora con qualche sondaggio. Supponiamo che il sondaggio contenga alcune domande sulletà, ma chiediamo allintervistato di identificare la sua età solo in determinati intervalli, come $ [0,18), [18, 25), [25,34), \ dots $. Dimentichiamo le altre domande. Questo questionario definisce uno “spazio eventi”, il tuo $ (\ Omega, F) $. Lalgebra sigma $ F $ codifica tutte le informazioni che possono essere ottenute dal questionario, quindi, per la domanda sulletà (e per ora ignoriamo tutte le altre domande), conterrà lintervallo $ [18,25) $ ma non altri intervalli come $ [20,30) $, poiché dalle informazioni ottenute dal questionario non possiamo rispondere a domande come: letà degli intervistati appartiene a $ [20,30) $ o no? Più in generale, un insieme è un evento (appartiene a $ F $) se e solo se possiamo decidere se un punto campione appartiene a quellinsieme o meno.
Ora, definiamo variabili casuali con valori nel secondo spazio eventi, $ (\ Omega “, F”) $. Ad esempio, prendi questa come la linea reale con la solita sigma-algebra (Borel). Quindi, una funzione (non interessante) che non è una variabile casuale è $ f: $ “letà degli intervistati è un numero primo”, codificando questo come 1 se letà è primo, 0 altrimenti. No, $ f ^ {- 1} (1) $ non appartiene a $ F $, quindi $ f $ non è una variabile casuale. Il motivo è semplice, non possiamo decidere dalle informazioni nel questionario se l età del rispondente è primaria o meno! Ora puoi fare tu stesso esempi più interessanti.
Perché abbiamo bisogno di $ F $ per essere un algebra sigma? Supponiamo di voler porre due domande sui dati, “è il rispondente numero 3 di 18 anni o più”, “è il rispondente 3 una donna”. Lascia che le domande definiscano due eventi (serie in $ F $) $ A $ e $ B $, gli insiemi di punti campione che danno una risposta “sì” a quella domanda. Ora chiediamo la congiunzione delle due domande “risponde 3 una femmina di 18 anni o più”. Ora quella domanda è rappresentata da lintersezione dellinsieme $ A \ cap B $. In modo simile, le disgiunzioni sono rappresentate dallunione dellinsieme $ A \ cup B $. Ora, la richiesta di chiusura per le intersezioni e le unioni numerabili ci permette di porre congiunzioni o disgiunzioni numerabili. è rappresentato dallinsieme complementare. Questo ci fornisce una sigma-algebra.
Ho visto questo tipo di introduzione per la prima volta nellottimo libro di Peter Whittle “Probabilità tramite aspettativa” (Springer).
MODIFICA
Cercando di rispondere alla domanda di whuber in un commento: “Sono rimasto un po sorpreso alla fine, però, quando ho riscontrato questa affermazione:” che richiede chiusura per intersezioni numerabili e i sindacati ci permettono di chiedere congiunzioni o disgiunzioni numerabili. “Questo sembra arrivare al cuore della questione: perché qualcuno dovrebbe voler costruire un evento così infinitamente complicato?” ebbene, perché? Ora limitiamoci alla probabilità discreta, diciamo, per comodità, il lancio della moneta. Lanciare la moneta un numero finito di volte, tutti gli eventi che possiamo descrivere usando la moneta possono essere espressi tramite eventi del tipo “lancio frontale $ i $ “,” code al lancio $ i $ e un numero finito di “e” o “o”. Quindi, in questa situazione, non abbiamo bisogno di $ \ sigma $ -algebre, le algebre di insiemi sono sufficienti. Quindi, cè qualche situazione, in questo contesto, in cui sorgono $ \ sigma $ -algebre? In pratica, anche se possiamo lanciare i dadi un numero finito di volte, sviluppiamo approssimazioni alle probabilità tramite teoremi limite quando $ n $, il numero di lanci, cresce senza limiti. Quindi dai unocchiata alla dimostrazione del teorema del limite centrale per questo caso, il teorema di Laplace-de Moivre. Possiamo dimostrare tramite approssimazioni usando solo algebre, non dovrebbe essere necessaria alcuna $ \ sigma $ -algebra. La legge debole dei grandi numeri può essere dimostrata tramite la disuguaglianza di Chebyshev, e per questo abbiamo solo bisogno di calcolare la varianza per i casi $ n $ finiti. Ma, per la legge forte di grandi numeri , levento che dimostriamo ha probabilità che uno possa essere espresso solo tramite un numero infinitamente numerabile di “e” e “o” “, quindi per la legge forte dei grandi numeri abbiamo bisogno di $ \ sigma $ -algebre.
Ma abbiamo davvero bisogno della legge forte dei grandi numeri? Secondo una risposta qui , forse no.
In un certo senso, questo indica una differenza concettuale molto grande tra la legge forte e quella debole dei grandi numeri: la legge forte non è direttamente empiricamente significativa, poiché riguarda la convergenza effettiva, che non può mai essere verificato empiricamente. La legge debole, daltra parte, riguarda la qualità dellapprossimazione che aumenta con $ n $, con limiti numerici per $ n $ finiti, quindi è più empiricamente significativa.
Quindi, tutto luso pratico di discreto la probabilità potrebbe fare a meno di $ \ sigma $ -algebre. Per il caso continuo, non sono così sicuro.
Commenti
- Non ‘ penso che questa risposta dimostri perché i campi $ \ sigma $ sono necessario. La comodità di poter rispondere $ P (A) \ in [20,30) $ non è ‘ richiesta dalla matematica. Un po maliziosamente, si potrebbe dire che alla matematica ‘ non interessa ciò che ‘ è conveniente per gli statistici. In realtà, sappiamo che $ P (A) \ in [20,30) \ le P (A) \ in [18,34) $, che è ben definito, quindi ‘ non è nemmeno chiaro che questo esempio illustri quello che vuoi che faccia.
- Non ‘ abbiamo bisogno del ” $ \ sigma $ ” parte di ” $ \ sigma $ -algebra ” per qualsiasi di questa risposta, Kjetil. Infatti, per la modellazione di base e il ragionamento sulla probabilità, sembra che uno statistico funzionante possa cavarsela bene con le algebre di insiemi che sono chiuse solo sotto unioni finite , non numerabili. La parte difficile della domanda di Antoni ‘ riguarda il motivo per cui abbiamo bisogno di una chiusura sotto unioni numerabili infinite : questo è il punto in cui il soggetto diventa teoria della misura invece che elementare combinatoria. (Vedo che anche Aksakal ha sottolineato questo punto in una risposta eliminata di recente.)
- @whuber: ovviamente hai ragione, ma nella mia risposta cerco di dare qualche motivazione sul motivo per cui le algebre (o $ \ sigma $ -algebras) può trasmettere informazioni. È un modo per capire perché quella struttura alghebrica entra nella probabilità e non in qualcosaltro. Naturalmente, in aggiunta ci sono le ragioni tecniche spiegate nella risposta di user777. E, naturalmente, se potessimo fare probabilità in un modo più semplice, tutti sarebbero felici …
- Penso che la tua argomentazione sia valida. Tuttavia, alla fine sono rimasto un po sorpreso quando ho riscontrato questa affermazione: ” richiedere la chiusura per intersezioni numerabili e unioni ci consente di chiedere congiunzioni o disgiunzioni numerabili. ” Questo sembra arrivare al cuore del problema: perché qualcuno dovrebbe voler costruire un evento così infinitamente complicato? Una buona risposta a ciò renderebbe il resto del tuo post più persuasivo.
- Re usi pratici: la teoria della probabilità e della misura usata nella matematica della finanza (comprese equazioni differenziali stocastiche, integrali Ito, filtrazioni di algebre, ecc.) sembra che sarebbe impossibile senza le algebre sigma. (Non posso ‘ votare a favore delle modifiche perché ho già votato la tua risposta!)
Risposta
Perché i probabilisti hanno bisogno di $ \ boldsymbol { \ sigma} $ -algebra?
Gli assiomi delle $ \ sigma $ -algebra sono motivati in modo abbastanza naturale dalla probabilità. Vuoi essere in grado di misurare tutte le regioni del diagramma di Venn, ad esempio, $ A \ cup B $ , $ (A \ cup B) \ cap C $ . Per citare da questa risposta memorabile :
Il primo assioma è che $ \ oslash, X \ in \ sigma $ . Beh, sai SEMPRE la probabilità che non accada nulla ( $ 0 $ ) o che accada qualcosa ( $ 1 $ ).
Il secondo assioma è chiuso tra i complementi. Lasciatemi offrire uno stupido esempio. Di nuovo, considera un lancio di moneta, con $ X = \ {H, T \} $ . Fingi che ti dica che lalgebra $ \ sigma $ per questo capovolgimento è $ \ {\ oslash, X, \ {H \} \} $ . Cioè, conosco la probabilità che NULLA accada, che QUALCOSA accada e che esca testa ma NON conosco la probabilità di croce. Giustamente mi chiameresti un idiota. Perché se conosci la probabilità di testa, tu conosci automaticamente la probabilità di una croce! Se conosci la probabilità che qualcosa accada, conosci la probabilità che NON accada (il complemento)!
Lultimo assioma è chiuso in unioni numerabili. Lascia che ti dia un altro stupido esempio. Considera il lancio di un dado o $ X = \ {1,2,3,4,5,6 \} $ . E se fossi per dirti $ \ sigma $ algebra per questo è $ \ {\ oslash, X, \ {1 \}, \ {2 \} \} $ . Cioè, conosco la probabilità di far rotolare un $ 1 $ o rotolare un $ 2 $ , ma non conosco la probabilità di ottenere un $ 1 $ o un $ 2 $ . Di nuovo, mi chiameresti giustamente un idiota (spero che il motivo sia chiaro). Cosa succede quando gli insiemi non sono disgiunti e quello che succede con unioni innumerevoli è un po più complicato, ma spero che tu possa provare a pensare ad alcuni esempi.
Perché hai bisogno di numerabili invece di limitati $ \ boldsymbol {\ sigma} $ -additività però?
Beh, non è del tutto pulito- taglia il caso, ma ci sono alcuni motivi per cui .
Perché i probabilisti hanno bisogno di misure?
A questo punto , hai già tutti gli assiomi per una misura. Da $ \ sigma $ -additivity, non-negativity, null empty set e il dominio di $ \ sigma $ -algebra. Potresti anche richiedere che $ P $ sia una misura. La teoria della misura è già giustificata .
Le persone portano linsieme di Vitali e Banach-Tarski per spiegare perché hai bisogno della teoria della misura, ma penso che sia fuorviante . Linsieme di Vitali scompare solo per misure (non banali) invarianti alla traduzione, che non richiedono spazi di probabilità. E Banach-Tarski richiede invarianza di rotazione. Le persone di analisi si preoccupano di loro, ma i probabilisti in realtà no .
La ragionamento dêtre della teoria della misura nella teoria della probabilità consiste nellunificare il trattamento di RV discreti e continui e, inoltre, consentire RV che sono misti e RV che semplicemente non lo sono.
Commenti
- Penso che questa risposta potrebbe essere unottima aggiunta a questo thread se lo rielaborassi un po . Allo stato attuale, è ‘ difficile da seguire perché gran parte di esso dipende dai collegamenti ad altri thread di commenti. Penso che se lo mettessi come una spiegazione dal basso verso lalto di come misure, $ \ sigma $ -additività finita e $ \ sigma $ -algebra si adattano come caratteristiche necessarie degli spazi di probabilità, sarebbe molto più forte. ‘ sei molto vicino, perché ‘ hai già suddiviso la risposta in diversi segmenti, ma penso che i segmenti abbiano bisogno di più giustificazioni e ragionamenti per essere pienamente supportato.
Risposta
Ho sempre capito lintera storia in questo modo:
Iniziamo con uno spazio, come la riga reale $ \ mathbb {R} $ . Vorremmo applicare la nostra misura a sottoinsiemi di questo spazio , ad esempio applicando la misura di Lebesgue, che misura la lunghezza. Un esempio potrebbe essere misurare la lunghezza del sottoinsieme $ [0, 0.5] \ cup [0.75, 1] $ . Per questo esempio la risposta è semplicemente $ 0,5 + 0,25 = 0.75 $ , che possiamo ottenere abbastanza facilmente. Cominciamo a chiederci se possiamo applicare la misura di Lebesgue a tutti i sottoinsiemi della linea reale.
Sfortunatamente non funziona. Ci sono questi insiemi patologici che semplicemente scompongono la matematica . Se applichi la misura di Lebesgue a questi insiemi, otterrai risultati incoerenti. Un esempio di uno di questi insiemi patologici, noti anche come insiemi non misurabili perché letteralmente non possono essere misurati, sono i Vitali Sets.
Per evitare questi insiemi folli, definiamo la misura in modo che funzioni solo per un gruppo più piccolo di sottoinsiemi, chiamati insiemi misurabili. Questi sono gli insiemi che si comportano in modo coerente quando applichiamo loro misure. Per permetterci di eseguire operazioni con questi insiemi, ad esempio combinandoli con unioni o prendendo i loro complementi, richiediamo che questi insiemi misurabili formino una sigma-algebra tra di loro. Formando una sigma-algebra, abbiamo formato una sorta di rifugio sicuro in cui operare le nostre misure, permettendoci anche di fare manipolazioni ragionevoli per ottenere ciò che vogliamo, come prendere sindacati e complementi. Questo è il motivo per cui abbiamo bisogno di una sigma-algebra, in modo da poter disegnare una regione allinterno della quale la misura possa funzionare, evitando insiemi non misurabili. Si noti che se non fosse per questi sottoinsiemi patologici, posso facilmente definire la misura per operare allinterno dellinsieme di potenze dello spazio topologico. Tuttavia, linsieme di potenze contiene tutti i tipi di insiemi non misurabili, ed è per questo che abbiamo per scegliere quelli misurabili e farli formare una sigma-algebra tra di loro.
Come puoi vedere, poiché le sigma-algebre sono usate per evitare insiemi non misurabili, gli insiemi di dimensione finita don ” In realtà non serve unalgebra sigma. Supponiamo che tu abbia a che fare con uno spazio campione $ \ Omega = \ {1, 2, 3 \} $ (questo potrebbe essere tutto il possibile risultato di un numero casuale generato da un computer) Potete vedere che è praticamente impossibile trovare insiemi non misurabili con un tale spazio campionario. La misura (in questo caso una misura di probabilità) è ben definita per qualsiasi sottoinsieme di $ \ Omega $ ti venga in mente. Ma dobbiamo definire sigma-algebre per spazi campionari più ampi, come la linea reale, in modo da evitare sottoinsiemi patologici che scompongono le nostre misure. Per ottenere consistenza nel quadro teorico della probabilità, richiediamo che gli spazi campionari finiti anche formino algebre sigma, dove solo in cui è definita la misura di probabilità. Sigma-algebre in spazi campionari finiti è un tecnicismo, mentre sigma-algebre in spazi campionari più grandi come la linea reale è una necessità .
Unalgebra sigma comune che usiamo per la vera linea è la sigma-algebra di Borel. È formato da tutti i possibili insiemi aperti, quindi prende i complementi e le unioni finché non si ottengono le tre condizioni di una sigma-algebra. Supponiamo che se “ricostruisci lalgebra sigma Borel per $ \ mathbb {R} [0, 1] $ , lo fai elencando tutti i possibili insiemi aperti, come come $ (0.5, 0.7), (0.03, 0.05), (0.2, 0.7), … $ e così via, e come puoi immaginare ci sono infiniti molte possibilità che puoi elencare, e poi prendi i complementi e le unioni finché non viene generata unalgebra sigma. Come puoi immaginare, questa algebra sigma è una BESTIA. È inimmaginabilmente enorme. Ma la cosa bella è che esclude tutte le insiemi patologici folli che hanno rotto la matematica. Questi insiemi folli non sono nellalgebra sigma di Borel. Inoltre, questo insieme è abbastanza completo da includere quasi tutti i sottoinsiemi di cui abbiamo bisogno. È difficile pensare a un sottoinsieme che non è contenuto nellalgebra sigma di Borel.
Questa è la storia del motivo per cui abbiamo bisogno delle algebre sigma e le algebre sigma di Borel sono un modo comune per implementare questa idea.
Commenti
- ‘ +1 ‘ molto leggibile. Tuttavia sembri contraddire la risposta di @Yatharth Agarwal che dice ” Le persone portano linsieme di Vitali e Banach-Tarski per spiegare perché hai bisogno della teoria della misura, ma penso che sia fuorviante. Linsieme di Vitali scompare solo per misure (non banali) invarianti alla traduzione, che non richiedono spazi di probabilità. E Banach-Tarski richiede invarianza di rotazione. Le persone dellanalisi si preoccupano di loro, ma i probabilisti in realtà no. “. Forse hai qualche idea in merito?
- +1 (soprattutto per la metafora ” rifugio sicuro “!) . @Stop Dato che la risposta a cui fai riferimento ha poco contenuto reale – esprime solo poche opinioni – ‘ non merita molta considerazione o dibattito, IMHO.