Nous avons une expérience aléatoire avec différents résultats formant l espace échantillon $ \ Omega, $ sur lequel nous regardons avec intérêt certains modèles, appelés événements $ \ mathscr {F}. $ Sigma-algebras (ou sigma-fields) sont constitués dévénements auxquels une mesure de probabilité $ \ mathbb {P} $ peut être affectée. Certaines propriétés sont remplies, y compris linclusion de lensemble nul $ \ varnothing $ et de tout lespace déchantillonnage, ainsi quune algèbre qui décrit les unions et intersections avec les diagrammes de Venn. p>
La probabilité est définie comme une fonction entre lalgèbre $ \ sigma $ et lintervalle $ [0, 1] $ . Au total, le triple $ (\ Omega, \ mathscr {F}, \ mathbb {P}) $ forme un espace de probabilité .
Quelquun pourrait-il expliquer en anglais simple pourquoi lédifice de probabilité seffondrerait si nous navions pas de $ \ sigma $ -algebra? Ils sont juste coincés au milieu avec ce « F » incroyablement calligraphique. Jespère quils sont nécessaires; je vois quun événement est différent dun résultat, mais que se passerait-il sans a $ \ sigma $ -algebras?
La question est: Dans quel type de problèmes de probabilité la définition dun espace de probabilité comprenant une $ \ sigma $ -algèbre devient une nécessité?
Ce document en ligne sur le site Web de lUniversité de Dartmouth fournit un anglais simple explication accessible. Lidée est un pointeur tournant tournant dans le sens antihoraire sur un cercle de unit périmètre:
Nous commençons par construction dun spinner, qui se compose dun cercle de circonférence unitaire et dun pointeur comme indiqué dans [la] figure. Nous choisissons un point sur le cercle et létiquetons $ 0 $ , puis chaque autre point du cercle avec la distance, disons $ x $ , de $ 0 $ à ce point, mesuré dans le sens antihoraire. Lexpérience consiste à faire tourner le pointeur et à enregistrer létiquette du point à lextrémité du pointeur. Nous laissons la variable aléatoire $ X $ désigner la valeur de ce résultat. Lespace échantillon est clairement lintervalle $ [0,1) $ . Nous aimerions construire un modèle de probabilité dans lequel chaque résultat est également susceptible de se produire. Si nous procédons comme nous lavons fait pour […] des expériences avec un nombre fini de résultats possibles, alors nous devons attribuer la probabilité $ 0 $ à chaque résultat, sinon, la somme des probabilités, sur tous les résultats possibles, ne serait pas égale à 1. (En fait, la somme dun nombre incalculable de nombres réels est une affaire délicate; en particulier, pour quune telle somme ait un sens, au plus nombre de sommets peuvent être différents de $ 0 $ .) Cependant, si toutes les probabilités assignées sont $ 0 $ , alors la somme est $ 0 $ , et non $ 1 $ , comme il se doit.
Donc, si nous attribuions à chaque point une probabilité quelconque, et étant donné quil existe un nombre infini (indénombrable) de points, leur somme sélèverait à $ > 1 $ .
Commentaires
- Il semble voué à léchec de demander des réponses sur les $ \ sigma $ -fields qui ne mentionnent pas la théorie des mesures!
- Oui, cependant … Je ne suis pas sûr de comprendre votre commentaire.
- Le besoin de champs sigma n’est certainement ‘ qu’une question de opinion … Je pense que cela peut être envisagé ici (à mon avis).
- Si votre besoin de théorie des probabilités est limité à » têtes » et » tails » alors clairement il ny a pas besoin de $ \ sigma $ -fields!
- Je pense que cest une bonne question.Si souvent, vous voyez dans les manuels des références complètement superflues à des triplets de probabilité $ (\ Omega, \ mathcal {F}, P) $ que lauteur continue ensuite dignorer complètement par la suite.
Réponse
Au premier point de Xi « an »: Quand vous parlez de $ \ sigma $ -algèbres, vous posez des questions sur des ensembles mesurables, donc malheureusement toute réponse doit se concentrer sur la théorie des mesures. Jessaierai de construire doucement, cependant.
Une théorie de probabilité admettant tous les sous-ensembles densembles indénombrables brisera les mathématiques
Prenons cet exemple. Supposons que vous ayez un carré unitaire dans $ \ mathbb {R} ^ 2 $ , et vous « êtes intéressé par la probabilité de sélectionner au hasard un point qui est membre dun ensemble spécifique dans le carré unitaire . Dans de nombreuses circonstances, on peut facilement répondre à cette question sur la base dune comparaison des zones des différents ensembles. Par exemple, nous pouvons dessiner des cercles, mesurer leurs aires, puis prendre la probabilité comme la fraction du carré tombant dans le cercle. Très simple.
Mais que se passe-t-il si la zone de lensemble dintérêt nest pas bien définie?
Si la zone nest pas bien définie, alors nous pouvons raisonner à deux mais des conclusions tout à fait valides (dans un certain sens) sur ce quest la zone. On pourrait donc avoir $ P (A) = 1 $ dune part et $ P (A) = 0 $ dautre part, ce qui implique $ 0 = 1 $ . Cela brise tous les maths irréparables. Vous pouvez maintenant prouver 5 $ < 0 $ et un certain nombre dautres choses absurdes. De toute évidence, ce nest pas trop utile.
$ \ boldsymbol {\ sigma} $ -algebras sont le correctif qui corrige les mathématiques
Quest-ce quune $ \ sigma $ -algèbre, précisément? Ce nest en fait pas si effrayant. Cest juste une définition des ensembles qui peuvent être considérés comme des événements. Les éléments qui ne sont pas dans $ \ mathscr {F} $ nont simplement aucune mesure de probabilité définie. Fondamentalement, $ \ sigma $ -algebras sont le » patch » qui nous permet déviter certains comportements pathologiques des mathématiques, à savoir des ensembles non mesurables.
Les trois exigences dun champ $ \ sigma $ peuvent être considérées comme des conséquences de ce nous aimerions faire avec la probabilité: Un $ \ sigma $ -field est un ensemble qui a trois propriétés:
- Fermeture sous dénombrable unions.
- Fermeture sous intersections dénombrables.
- Fermeture sous compléments.
Les unions dénombrables et les composants intersections dénombrables sont des conséquences directes des non- problème densemble mesurable. La fermeture sous compléments est une conséquence des axiomes de Kolmogorov: if $ P (A) = 2/3 $ , $ P (A ^ c) $ doit être $ 1/3 $ . Mais sans (3), il pourrait arriver que $ P (A ^ c) $ ne soit pas défini. Ce serait étrange. Clôture sous compléments et axiomes de Kolmogorov disons des choses comme $ P (A \ cup A ^ c) = P (A) + 1-P (A) = 1 $ .
Enfin, nous considérons les événements en relation avec $ \ Omega $ , nous avons donc en outre besoin que $ \ Omega \ in \ mathscr {F} $
Bonne nouvelle: $ \ boldsymbol {\ sigma} $ -les algèbres ne sont strictement nécessaires que pour des ensembles indénombrables
Mais! Il y a de bonnes nouvelles ici aussi. Ou, du moins, un moyen de contourner le problème. Nous navons besoin que de $ \ sigma $ -algèbres si nous « travaillons dans un ensemble à la cardinalité indénombrable. Si nous nous limitons aux ensembles dénombrables, alors nous pouvons prendre $ \ mathscr {F} = 2 ^ \ Omega $ lensemble de puissance de $ \ Omega $ et nous naurons aucun de ces problèmes car pour les $ \ Omega $ , $ 2 ^ \ Omega $ se compose uniquement densembles mesurables. (Ceci est évoqué dans le deuxième commentaire de Xi » an « .) Vous remarquerez que certains manuels commettront un tour de passe-passe subtil ici , et ne considérez que les ensembles dénombrables lors de la discussion des espaces de probabilité.
De plus, dans les problèmes géométriques de $ \ mathbb {R} ^ n $ , il » est parfaitement suffisant pour ne considérer que les $ \ sigma $ -algèbres composées densembles pour lesquels le $ \ mathcal {L} ^ n La mesure $ est définie. Pour ancrer cela un peu plus fermement, $ \ mathcal {L} ^ n $ pour $ n = 1,2 , 3 $ correspond aux notions usuelles de longueur, surface et volume.Donc, ce que je dis dans lexemple précédent, cest que lensemble doit avoir une aire bien définie pour quune probabilité géométrique lui soit assignée. Et la raison est la suivante: si nous admettons des ensembles non mesurables, alors nous pouvons se retrouvent dans des situations où nous pouvons attribuer la probabilité 1 à un événement basé sur une preuve, et la probabilité 0 à le même événement événement basé sur une autre preuve.
Mais ne « t laissez la connexion à des ensembles innombrables vous confondre! Une idée fausse courante selon laquelle les $ \ sigma $ -algebras sont des ensembles dénombrables. En fait, ils peuvent être dénombrables ou indénombrables. Considérez cette illustration: comme précédemment, nous avons un carré unitaire. Définissez $$ \ mathscr {F} = \ text {Tous les sous-ensembles du carré unitaire avec $ \ mathcal {L} ^ 2 $ mesure}. $$ Vous pouvez dessine un carré $ B $ avec une longueur de côté $ s $ pour tout $ s \ in (0,1) $ , et avec un coin à $ (0,0) $ . Il doit être clair que ce carré est un sous-ensemble du carré unitaire. De plus, tous ces carrés ont une aire définie, donc ces carrés sont des éléments de $ \ mathscr {F} $ . Mais il devrait également être clair quil existe un nombre incalculable de carrés $ B $ : le nombre de ces carrés est indénombrable, et chaque carré a défini la mesure de Lebesgue.
Donc, en pratique, il suffit souvent de faire cette observation pour faire l’observation que vous ne considérez que les ensembles mesurables de Lebesgue pour gagner du terrain par rapport au problème d’intérêt.
Mais attendez, quest-ce que « sa ensemble non mesurable?
Je crains de ne pouvoir éclairer un peu ce sujet moi-même. Mais le paradoxe Banach-Tarski (parfois le » soleil et pois » paradox) peut nous aider un peu:
Étant donné une boule solide dans un espace tridimensionnel, il existe une décomposition de la boule en un nombre fini de sous-ensembles disjoints, qui peuvent ensuite être reconstitués dune manière différente pour produire deux copies identiques de la balle dorigine. En effet, le processus de remontage consiste uniquement à déplacer les pièces et à les faire tourner, sans changer leur forme. Cependant, les morceaux eux-mêmes ne sont pas des » solides » au sens habituel, mais des diffusions infinies de points. La reconstruction peut fonctionner avec aussi peu que cinq pièces.
Une forme plus forte du théorème implique que, étant donné deux » raisonnable » objets solides (comme une petite boule et une énorme boule), lun ou lautre peut être réassemblé dans lautre. Ceci est souvent indiqué de manière informelle comme » un pois peut être haché et réassemblé dans le Soleil » et appelé » le pois et le paradoxe du soleil « . 1
Donc, si vous » travaillez avec des probabilités dans $ \ mathbb {R} ^ 3 $ et que vous « utilisez la probabilité géométrique mesure (le rapport des volumes), vous voulez calculer la probabilité dun événement. Mais vous aurez du mal à définir cette probabilité avec précision, car vous pouvez réorganiser les ensembles de votre espace pour modifier les volumes! Si la probabilité dépend du volume, et vous pouvez modifier le volume de lensemble pour quil soit la taille du soleil ou la taille de un pois, alors la probabilité changera également. Ainsi, aucun événement ne sera associé à une seule probabilité. Pire encore, vous pouvez réorganiser $ S \ in \ Omega $ tel que le volume de $ S $ a $ V (S) > V (\ Omega) $ , ce qui implique que la mesure de probabilité géométrique rapporte une probabilité $ P (S) > 1 $ , en violation flagrante des axiomes de Kolmogorov qui exigent que la probabilité ait la mesure 1.
Pour résoudre ce paradoxe, on pourrait faire lune des quatre concessions:
- Le le volume dun ensemble peut changer lors de sa rotation.
- Le volume de lunion de deux disjoints les ensembles peuvent être différents de la somme de leurs volumes.
- Les axiomes de la théorie des ensembles de Zermelo – Fraenkel avec laxiome du choix (ZFC) pourraient devoir être modifiés.
- Certains ensembles pourraient devoir être modifiés. être étiqueté » non mesurable « , et il faudrait vérifier si un ensemble est » mesurable » avant de parler de son volume.
L’option (1) n’aide pas à définir les probabilités, elle est donc terminée. Loption (2) viole le deuxième axiome de Kolmogorov, donc cest terminé. Loption (3) semble être une idée terrible parce que ZFC résout tellement plus de problèmes quil nen crée.Mais loption (4) semble intéressante: si nous développons une théorie de ce qui est et nest pas mesurable, alors nous aurons des probabilités bien définies dans ce problème! Cela nous ramène à la théorie des mesures, et à notre ami le $ \ sigma $ -algebra.
Commentaires
- Merci pour votre réponse. $ \ mathcal {L} $ signifie Lebesque mesurable? Je ‘ ll +1 votre réponse sur la foi, mais je ‘ apprécierait vraiment si vous pouviez faire baisser le niveau de mathématiques de plusieurs crans. .. 🙂
- (+1) Bons points! Jajouterais également que sans mesure et $ \ sigma $ algèbres, le conditionnement et la dérivation de distributions conditionnelles sur des espaces indénombrables deviennent assez velus, comme le montre le paradoxe de Borel-Kolmogorov .
- @Xi ‘ an Merci pour vos aimables paroles! Cela signifie vraiment beaucoup, venant de vous. Je nétais pas familier avec le paradoxe Borel-Kolmogorov au moment décrire ces lignes, mais je ‘ vais faire un peu de lecture et voir si je peux réussir à faire un ajout utile de mes découvertes.
- @ Student001: Je pense que nous nous fendons les cheveux ici. Vous avez raison de dire que la définition générale de » mesure » (toute mesure) est donnée en utilisant le concept de sigma-algèbres. Ce que je veux dire, cependant, cest quil ny a aucun mot ou concept de » sigma-algebra » dans la définition de la mesure de Lebesgue fournie dans mon premier lien. En dautres termes, on peut définir la mesure de Lebesgue selon mon premier lien mais ensuite il faut montrer que cest une mesure et que ‘ est la partie la plus difficile. Je suis d’accord pour dire que nous devrions arrêter cette discussion.
- J’ai vraiment apprécié la lecture de votre réponse. Je ‘ ne sais pas comment vous remercier, mais vous ‘ avez beaucoup clarifié les choses! Je ‘ n’ai jamais étudié l’analyse réelle et je n’ai jamais eu une bonne introduction aux mathématiques. Issu dune formation en génie électrique qui sest beaucoup concentrée sur la mise en œuvre pratique. Vous ‘ avez écrit cela en des termes si simples qu’un type comme moi pourrait le comprendre. Japprécie vraiment votre réponse et la simplicité que vous ‘ avez fournie. Merci également à @Xi ‘ an pour ses commentaires emballés!
Réponse
Lidée sous-jacente (en termes très pratiques) est simple. Supposons que vous soyez un statisticien travaillant avec une enquête. Supposons que lenquête contienne des questions sur lâge, mais demandons seulement au répondant didentifier son âge à des intervalles donnés, comme $ [0,18), [18, 25), [25,34), \ dots $. Oublions les autres questions. Ce questionnaire définit un « espace événementiel », votre $ (\ Omega, F) $. Lalgèbre sigma $ F $ codifie toutes les informations qui peuvent être obtenues à partir du questionnaire, donc, pour la question dâge (et pour linstant nous ignorons toutes les autres questions), elle contiendra lintervalle $ [18,25) $ mais pas les autres intervalles comme $ [20,30) $, puisque daprès les informations obtenues par le questionnaire, nous ne pouvons pas répondre à une question du type: lâge des répondants appartient-il à [20,30) $ ou non? Plus généralement, un ensemble est un événement (appartient à $ F $) si et seulement si on peut décider si un point déchantillonnage appartient ou non à cet ensemble.
Maintenant, définissons des variables aléatoires avec des valeurs dans le deuxième espace dévénement, $ (\ Omega « , F ») $. À titre dexemple, prenez ceci pour être la vraie ligne avec lhabituelle sigma-algèbre (Borel). Ensuite, une fonction (peu intéressante) qui nest pas une variable aléatoire est $ f: $ « lâge des répondants est un nombre premier », codant ceci comme 1 si lâge est premier, 0 sinon. Non, $ f ^ {- 1} (1) $ nappartient pas à $ F $, donc $ f $ nest pas une variable aléatoire. La raison est simple, nous ne pouvons pas décider à partir des informations contenues dans le questionnaire si l’âge du répondant est premier ou non! Vous pouvez maintenant faire vous-même des exemples plus intéressants.
Pourquoi avons-nous besoin de $ F $ pour être une algèbre sigma? Disons que nous voulons poser deux questions sur les données, « le répondant numéro 3 est-il âgé de 18 ans ou plus », « le répondant 3 est-il une femme ». Laissez les questions définir deux événements (ensembles en $ F $) $ A $ et $ B $, les ensembles de points déchantillonnage donnant une réponse «oui» à cette question. Maintenant, posons la conjonction des deux questions «répond 3 une femme de 18 ans ou plus». Maintenant, cette question est représentée par lintersection densemble $ A \ cap B $. De la même manière, les disjonctions sont représentées par lensemble union $ A \ cup B $. Désormais, exiger la fermeture pour les intersections et unions dénombrables nous permet de poser des conjonctions ou disjonctions dénombrables. Et, la négation dune question est représenté par lensemble complémentaire. Cela nous donne une sigma-algèbre.
Jai vu ce genre dintroduction dabord dans le très bon livre de Peter Whittle « Probability via expectation » (Springer).
EDIT
En essayant de répondre à la question whubers dans un commentaire: « Jai été un peu surpris à la fin, cependant, quand jai rencontré cette asssertion: » exigeant la fermeture pour les intersections dénombrables et les syndicats permettent de poser des conjonctions ou des disjonctions dénombrables. «Cela semble entrer au cœur du problème: pourquoi voudrait-on construire un événement aussi infiniment compliqué? Restreindre maintenant à la probabilité discrète, disons, pour plus de commodité, le tirage au sort. En lançant la pièce un nombre fini de fois, tous les événements que nous pouvons décrire en utilisant la pièce peuvent être exprimés via des événements du type « head on throw $ i $ « , » queues sur throw $ i $, et un nombre fini de « et » ou « ou ». Donc, dans cette situation, nous navons pas besoin de $ \ sigma $ -algèbres, les algèbres densembles suffisent. Alors, y a-t-il une situation, dans ce contexte, où des algèbres $ \ sigma $ surviennent? En pratique, même si nous ne pouvons lancer les dés quun nombre fini de fois, nous développons des approximations de probabilités via des théorèmes limites lorsque $ n $, le nombre de lancers, croît sans limite. Jetez donc un œil à la preuve du théorème central limite pour ce cas, le théorème de Laplace-de Moivre. Nous pouvons prouver via des approximations en utilisant uniquement des algèbres, aucune $ \ sigma $ -algebra ne devrait être nécessaire. La loi faible des grands nombres peut être prouvée via linégalité de Chebyshev, et pour cela nous navons besoin de calculer la variance que pour des cas $ n $ finis. Mais, pour la loi forte de grands nombres , lévénement que nous prouvons a une probabilité de ne peut être exprimé que via un nombre infini dénombrable de « et » et « ou » « s, donc pour la loi forte des grands nombres nous avons besoin de $ \ sigma $ -algebras.
Mais avons-nous vraiment besoin de la loi forte des grands nombres? Selon une réponse ici , peut-être pas.
Dune certaine manière, cela indique une très grande différence conceptuelle entre la loi forte et la loi faible des grands nombres: la loi forte nest pas directement empiriquement significative, car il sagit dune convergence réelle, qui ne peut jamais être vérifié empiriquement. La loi faible, par contre, concerne la qualité de lapproximation augmentant avec $ n $, avec des bornes numériques pour $ n $ fini, donc elle est plus significative empiriquement.
Donc, toute utilisation pratique de discret la probabilité pourrait se passer de $ \ sigma $ -algèbres. Pour le cas continu, je ne suis pas si sûr.
Commentaires
- Je ne ‘ Je ne pense pas que cette réponse montre pourquoi les $ \ sigma $ -fields sont nécessaire. La commodité de pouvoir répondre à $ P (A) \ in [20,30) $ isn ‘ t mandaté par les mathématiques. On pourrait dire de manière quelque peu maladroite que les mathématiques ne se soucient ‘ de ce que ‘ est pratique pour les statisticiens. En fait, on sait que $ P (A) \ in [20,30) \ le P (A) \ in [18,34) $, qui est bien défini, donc ‘ nest même pas clair que cet exemple illustre ce que vous voulez quil fasse.
- Nous navons ‘ pas besoin de » $ \ sigma $ » partie de » $ \ sigma $ -algebra » pour nimporte laquelle de ces réponses, Kjetil. En fait, pour la modélisation de base et le raisonnement sur les probabilités, il semble quun statisticien de travail puisse sen sortir très bien avec des algèbres densemble qui ne sont fermées que sous des unions finies , non dénombrables. La partie difficile de la question dAntoni ‘ concerne la raison pour laquelle nous avons besoin dune clôture sous des unions dénombrables infinies : cest à ce moment que le sujet devient théorie de la mesure au lieu délémentaire combinatoire. (Je vois quAksakal a également fait valoir ce point dans une réponse récemment supprimée.)
- @whuber: vous avez bien sûr raison, mais dans ma réponse, jessaie de vous expliquer pourquoi les algèbres (ou $ \ sigma $ -algebras) peut transmettre des informations. Cest une manière de comprendre pourquoi cette structure algébrique entre dans la probabilité et non dans autre chose. Bien sûr, il y a en plus les raisons techniques expliquées dans la réponse de user777. Et, bien sûr, si nous pouvions faire des probabilités de manière plus simple, tout le monde serait heureux …
- Je pense que votre argument est valable. Jai été un peu décontenancé à la fin, cependant, quand jai rencontré cette affirmation: » exiger la fermeture pour les intersections et les unions dénombrables nous permet de demander des conjonctions ou des disjonctions dénombrables. » Cela semble entrer au cœur du problème: pourquoi quelquun voudrait-il construire un événement aussi infiniment compliqué? Une bonne réponse à cela rendrait le reste de votre article plus convaincant.
- Utilisations pratiques: la théorie des probabilités et des mesures utilisée dans les mathématiques de la finance (y compris les équations différentielles stochastiques, les intégrales Ito, les filtrations dalgèbres, etc.) semble impossible sans les algèbres sigma. (Je peux ‘ voter pour les modifications car jai déjà voté sur votre réponse!)
Réponse
Pourquoi les probabilistes ont-ils besoin de $ \ boldsymbol { \ sigma} $ -algebra?
Les axiomes des $ \ sigma $ -algèbres sont assez naturellement motivés par la probabilité. Vous voulez pouvoir mesurer toutes les régions du diagramme de Venn, par exemple, $ A \ cup B $ , $ (A \ cup B) \ cap C $ . Pour citer cette réponse mémorable :
Le premier axiome est que $ \ oslash, X \ in \ sigma $ . Eh bien, vous connaissez TOUJOURS la probabilité que rien ne se passe ( $ 0 $ ) ou que quelque chose se passe ( $ 1 $ ).
Le deuxième axiome est fermé sous les compléments. Permettez-moi de donner un exemple stupide. Encore une fois, considérons un tirage au sort, avec $ X = \ {H, T \} $ . Imaginez que je vous dis que lalgèbre $ \ sigma $ pour ce flip est $ \ {\ oslash, X, \ {H \} \} $ . Cest-à-dire que je connais la probabilité que RIEN ne se produise, que QUELQUE CHOSE se produise et que quelque chose se passe, mais je ne connais pas la probabilité dune queue. Vous mappelleriez à juste titre un crétin. Parce que si vous connaissez la probabilité dune tête, vous connaître automatiquement la probabilité dune queue! Si vous connaissez la probabilité que quelque chose se produise, vous connaissez la probabilité que cela ne se produise PAS (le complément)!
Le dernier axiome est fermé sous des unions dénombrables. Laissez-moi vous donner un autre exemple stupide. Prenons le jet dun dé, ou $ X = \ {1,2,3,4,5,6 \} $ . Et si jétais pour vous dire que lalgèbre $ \ sigma $ est $ \ {\ oslash, X, \ {1 \}, \ {2 \} \} $ . Autrement dit, je connais la probabilité de lancer un $ 1 $ ou de lancer un $ 2 $ , mais je ne connais pas la probabilité dobtenir un $ 1 $ ou un $ 2 $ . Encore une fois, vous mappelleriez à juste titre un idiot (jespère que la raison est claire). Ce qui se passe lorsque les ensembles ne sont pas disjoints, et ce qui se passe avec des unions innombrables est un peu plus compliqué, mais jespère que vous pouvez essayer de penser à quelques exemples.
Pourquoi avez-vous besoin dune additivité dénombrable au lieu dune simple $ \ boldsymbol {\ sigma} $ -additivité?
Eh bien, ce nest pas entièrement propre- couper la casse, mais il y a quelques raisons solides pour .
Pourquoi les probabilistes ont-ils besoin de mesures?
À ce stade , vous avez déjà tous les axiomes pour une mesure. Depuis $ \ sigma $ -additivité, non-négativité, ensemble vide nul et le domaine de $ \ sigma $ -algèbre. Vous pouvez également exiger que $ P $ soit une mesure. La théorie de la mesure est déjà justifiée .
Les gens apportent lensemble de Vitali et Banach-Tarski pour expliquer pourquoi vous avez besoin de la théorie de la mesure, mais je pense que cest trompeur . Lensemble de Vitali ne disparaît que pour les mesures (non triviales) qui sont invariantes par translation, ce que les espaces de probabilité ne nécessitent pas. Et Banach-Tarski nécessite une invariance de rotation. Les spécialistes de lanalyse se soucient deux, mais les probabilistes ne le font pas .
La raison de être de la théorie des mesures en théorie des probabilités consiste à unifier le traitement des RV discrets et continus, et de plus, permettre des RV mixtes et des RV qui ne sont simplement ni lun ni lautre. p>
Commentaires
- Je pense que cette réponse pourrait faire un excellent ajout à ce fil si vous le retravaillez un peu. Dans létat actuel des choses, il est ‘ difficile à suivre car une grande partie de celui-ci dépend des liens vers dautres fils de commentaires. Je pense que si vous le présentiez comme une explication de bas en haut de la façon dont les mesures, ladditivité $ \ sigma $ finie et lalgèbre $ \ sigma $ semboîtent en tant que caractéristiques nécessaires des espaces de probabilités, ce serait beaucoup plus fort. Vous ‘ êtes très proche, car vous ‘ avez déjà divisé la réponse en différents segments, mais je pense que les segments ont besoin de plus de justification et de raisonnement pour être entièrement pris en charge.
Réponse
Jai toujours compris toute lhistoire comme ceci:
Nous commençons par un espace, comme la ligne réelle $ \ mathbb {R} $ . Nous aimerions appliquer notre mesure à des sous-ensembles de cet espace , par exemple en appliquant la mesure Lebesgue, qui mesure la longueur. Un exemple serait de mesurer la longueur du sous-ensemble $ [0, 0,5] \ cup [0,75, 1] $ . Pour cet exemple, la réponse est simplement 0,5 $ + 0,25 = 0.75 $ , que nous pouvons obtenir assez facilement. Nous commençons à nous demander si nous pouvons appliquer la mesure de Lebesgue à tous les sous-ensembles de la ligne réelle.
Malheureusement, cela ne fonctionne pas. Il y a ces ensembles pathologiques qui décomposent simplement les mathématiques Si vous appliquez la mesure de Lebesgue à ces ensembles, vous obtiendrez des résultats incohérents. Un exemple de lun de ces ensembles pathologiques, également appelés ensembles non mesurables car ils ne peuvent littéralement pas être mesurés, sont les ensembles Vitali.
Afin déviter ces ensembles fous, nous définissons la mesure pour quelle ne fonctionne que pour un plus petit groupe de sous-ensembles, appelés ensembles mesurables. Ce sont les ensembles qui se comportent de manière cohérente lorsque nous leur appliquons des mesures. Afin de nous permettre deffectuer des opérations avec ces ensembles, par exemple en les combinant avec des unions ou en prenant leurs compléments, nous avons besoin de ces ensembles mesurables pour former une sigma-algèbre entre eux. En formant une sigma-algèbre, nous avons formé une sorte de refuge pour nos mesures à lintérieur, tout en nous permettant également de faire des manipulations raisonnables pour obtenir ce que nous voulons, comme prendre des syndicats et des compléments. Cest pourquoi nous avons besoin dune sigma-algèbre, afin de pouvoir dessiner une région dans laquelle la mesure fonctionne, tout en évitant les ensembles non mesurables. Notez que si ce nétait pas pour ces sous-ensembles pathologiques, je peux facilement définir la mesure à opérer dans lensemble de puissance de lespace topologique. Cependant, lensemble de puissance contient toutes sortes densembles non mesurables, et cest pourquoi nous avons pour choisir les mesurables et les faire former une sigma-algèbre entre elles.
Comme vous pouvez le voir, puisque les sigma-algèbres sont utilisées pour éviter les ensembles non mesurables, les ensembles qui sont de taille finie don » t besoin en fait dune algèbre sigma. Disons que vous avez affaire à un espace échantillon $ \ Omega = \ {1, 2, 3 \} $ (cela pourrait être tout le résultat possible dun nombre aléatoire généré par un ordinateur). Vous pouvez voir quil est pratiquement impossible de trouver des ensembles non mesurables avec un tel espace déchantillonnage. La mesure (dans ce cas, une mesure de probabilité) est bien définie pour tout sous-ensemble de $ \ Omega $ auquel vous pouvez penser. Mais nous avons besoin de définir des sigma-algèbres pour des espaces déchantillons plus grands, comme la ligne réelle, afin déviter les sous-ensembles pathologiques qui décomposent nos mesures. Afin datteindre la cohérence dans le cadre théorique de la probabilité, nous avons besoin que les espaces déchantillons finis forment également des algèbres sigma, où seulement dans lesquelles la mesure de probabilité est définie. Les sigma-algèbres dans des espaces déchantillons finis sont une technique, tandis que les sigma-algèbres dans des espaces déchantillons plus grands tels que la ligne réelle est une nécessité .
Une sigma-algèbre courante que nous utilisons pour la vraie ligne est la sigma-algèbre de Borel. Il est formé par tous les ensembles ouverts possibles, puis en prenant les compléments et les unions jusquà ce que les trois conditions dune sigma-algèbre soient atteintes. Dites si vous « construisez la sigma-algebra de Borel pour $ \ mathbb {R} [0, 1] $ , vous faites cela en listant tous les ensembles ouverts possibles, tels comme $ (0,5, 0,7), (0,03, 0,05), (0,2, 0,7), … $ et ainsi de suite, et comme vous pouvez limaginer, il y en a une infinité de nombreuses possibilités que vous pouvez énumérer, puis vous prenez les compléments et les unions jusquà ce quune sigma-algèbre soit générée. Comme vous pouvez limaginer, cette algèbre sigma est une BÊTE. Elle est incroyablement énorme. Mais ce qui est beau, cest quelle exclut tous les ensembles pathologiques fous qui ont brisé les mathématiques. Ces ensembles fous ne sont pas dans la sigma-algèbre de Borel. De plus, cet ensemble est suffisamment complet pour inclure presque tous les sous-ensembles dont nous avons besoin. Il est difficile de penser à un sous-ensemble qui nest pas contenu dans la sigma-algèbre de Borel.
Voilà pourquoi nous avons besoin de sigma-algebras et Borel sigma-algebras est un moyen courant de mettre en œuvre cette idée.
Commentaires
- ‘ +1 ‘ très lisible. Cependant, vous semblez contredire la réponse de @Yatharth Agarwal qui dit que » Les gens apportent lensemble de Vitali et Banach-Tarski pour expliquer pourquoi vous avez besoin de la théorie des mesures, mais je pense que cest trompeur. Lensemble de Vitali ne disparaît que pour les mesures (non triviales) qui sont invariantes par translation, ce que les espaces de probabilité ne nécessitent pas. Et Banach-Tarski nécessite une invariance de rotation. Les spécialistes de lanalyse se soucient deux, mais pas les probabilistes. « . Peut-être avez-vous des idées à ce sujet?
- +1 (en particulier pour la métaphore » refuge « !) . @Stop Étant donné que la réponse à laquelle vous faites référence a peu de contenu réel – elle exprime seulement quelques opinions – elle ‘ ne mérite pas beaucoup de considération ou de débat, à mon humble avis.