Dans les techniques de réduction de dimensionnalité telles que lanalyse en composantes principales, lADL, etc., le terme variété est souvent utilisé. Quest-ce quune variété en terme non technique? Si un point $ x $ appartient à une sphère dont je veux réduire la dimension, et sil y a un bruit $ y $ et $ x $ et $ y $ ne sont pas corrélés, alors les points réels $ x $ seraient très séparés de chacun autre en raison du bruit. Par conséquent, un filtrage du bruit serait nécessaire. Ainsi, la réduction de dimension serait effectuée sur $ z = x + y $. Par conséquent, ici, $ x $ et $ y $ appartiennent-ils à des variétés différentes?
Je travaille sur des données de nuages de points qui sont souvent utilisées dans la vision robotique; les nuages de points sont bruyants à cause du bruit lors de lacquisition et je dois réduire le bruit avant la réduction de dimension. Sinon, jobtiendrai une réduction de dimension incorrecte. Alors, quelle est la variété ici et le bruit fait-il partie de la même variété à laquelle appartient $ x $?
Commentaires
- It ‘ nest pas vraiment possible dutiliser le terme correctement sans être mathématiquement précis
Answer
En termes non techniques, une variété est une structure géométrique continue de dimension finie: une ligne, une courbe, un plan, une surface, une sphère, une boule, un cylindre, un tore, une « tache » … quelque chose comme ceci:
Cest un terme générique utilisé par mathématiciens de dire « une courbe » (dimension 1) ou « surface » (dimension 2), ou un objet 3D (dimension 3) … pour toute dimension finie possible $ n $. Une variété unidimensionnelle est simplement une courbe (ligne, cercle …). Une variété bidimensionnelle est simplement une surface (plan, sphère, tore, cylindre …). Une variété tridimensionnelle est un « objet plein » (boule, cube plein, lespace 3D qui nous entoure …).
Une variété est souvent décrite par une équation: lensemble des points $ (x, y) $ tel que $ x ^ 2 + y ^ 2 = 1 $ est une variété unidimensionnelle (un cercle).
Une variété a la même dimension partout. Par exemple, si vous ajoutez une ligne (dimension 1) à une sphère (dimension 2), la structure géométrique résultante nest pas une variété.
Contrairement aux notions plus générales despace métrique ou despace topologique destinées également à décrire notre intuition naturelle dun ensemble continu de points, une variété est destinée à être quelque chose de localement simple: comme un espace vectoriel de dimension finie: $ \ mathbb {R} ^ n $. Cela exclut les espaces abstraits (comme les espaces de dimension infinie) qui souvent nont pas de signification géométrique concrète.
Contrairement à un espace vectoriel, les variétés peuvent avoir différentes formes. Certaines variétés peuvent être facilement visualisées (sphère, boule …), certaines sont difficiles à visualiser, comme la bouteille de Klein ou la plan projectif réel .
Dans les statistiques, lapprentissage automatique ou les mathématiques appliquées en général, le mot « variété » est souvent utilisé pour dire « comme un sous-espace linéaire » mais peut-être courbe . Chaque fois que vous écrivez une équation linéaire comme: $ 3x + 2y-4z = 1 $, vous obtenez un sous-espace linéaire (affine) (ici un plan). Habituellement, lorsque léquation est non linéaire comme $ x ^ 2 + 2y ^ 2 + 3z ^ 2 = 7 $, il sagit dune variété (ici une sphère étirée).
Par exemple, le « hypothèse de variété « de ML dit que » les données de haute dimension sont des points dans une variété de faible dimension avec un bruit de grande dimension ajouté « . Vous pouvez imaginer des points dun cercle 1D avec du bruit 2D ajouté. Bien que les points ne soient pas exactement sur le cercle, ils satisfont statistiquement léquation $ x ^ 2 + y ^ 2 = 1 $. Le cercle est la variété sous-jacente:
Commentaires
- @RiaGeorge Dans limage, cest la surface qui est une variété. Il ‘ est continu parce que vous pouvez vous déplacer librement sans interruption et ne jamais avoir à sauter hors de la surface pour vous déplacer entre deux endroits. Les trous auxquels vous faites allusion sont importants pour décrire comment vous pouvez vous déplacer à la surface entre deux points de la manière la plus simple, et les compter est une technique importante pour étudier les variétés.
- Expliquer ce quest la topologie serait une question beaucoup trop large pour ce site, et un peu hors sujet. Je chercherais dans léchange de pile de mathématiques des informations à ce sujet. Les variétés et la topologie ne sont pas des synonymes: les variétés sont des objets mathématiques étudiés avec les techniques de topologie, la topologie est un sous-sujet des mathématiques.
- Cela semble être une très bonne explication à quelquun qui apprend le concept pour la première fois temps, avec des exemples concrets bien choisis. (Je ne sais ‘ que je ne sais pas avec certitude puisque jai déjà rencontré le concept.) En tant que petit problème, je recommanderais de reformuler la dernière phrase pour quelle soit moins absolue ( » Chaque fois que léquation est non linéaire comme … »): tel quil est écrit en ce moment, ce nest pas vraiment vrai. Hormis ce petit problème, je trouve cela très bien écrit.
- La réponse passe à côté de tous les points fondamentaux qui font une telle variété, je ne ‘ t obtenir comment il a tant de votes positifs. La topologie, les graphiques et la fluidité ne sont même pas mentionnés et la réponse donne essentiellement l’impression qu’une variété est une surface, ce qu’elle est pas .
- Point technique, l’ensemble de solutions d’un Le système déquations na pas besoin dêtre une variété. Elle ‘ est une variété, donc elle ‘ est principalement une variété, mais elle peut avoir des points d’auto-intersection où la propriété de variété échoue.
Réponse
Une variété (topologique) est un espace $ M $ qui est:
(1) « localement » « équivalent » à $ \ mathbb {R} ^ n $ pour quelque $ n $.
« Localement », l « équivalence » peut être exprimée via les fonctions de coordonnées $ n $, $ c_i: M \ to \ mathbb {R} $, qui forment ensemble une fonction de « préservation de la structure », $ c: M \ to \ mathbb {R} ^ n $, appelé graphique .
(2) peut être réalisé de manière « préservant la structure » en tant que sous-ensemble de $ \ mathbb {R} ^ N $ pour quelques $ N \ ge n $. (1) (2)
Notez que pour rendre « structure » précise ici, il faut comprendre les notions de base de topologie ( def. ), qui permet de faire des notions précises sur le comportement « local » , et donc « localement » ci-dessus. Quand je dis « équivalent », je veux dire structure topologique équivalente ( homéomorphe ), et quand je dis « préservation de la structure », je veux dire la même chose (crée un équivalent structure topologique).
Notez également que pour faire du calcul sur les variétés , il faut une condition supplémentaire qui ne découle pas du au-dessus de deux conditions, qui dit essentiellement quelque chose comme « les graphiques sont suffisamment bien comportés pour nous permettre de faire du calcul ». Ce sont les variétés les plus souvent utilisées dans la pratique. Contrairement à la topologie générale variétés , en plus du calcul, ils permettent également des triangulations , ce qui est très important dans des applications comme la vôtre impliquant des données de nuages de points .
Notez que tout le monde nutilise pas la même définition pour une variété (topologique). Plusieurs auteurs la définiront comme satisfaisant seulement la condition (1) abo ve, pas nécessairement aussi (2). Cependant, la définition qui satisfait à la fois (1) et (2) se comporte beaucoup mieux, donc plus utile pour les praticiens. On pourrait sattendre intuitivement à ce que (1) implique (2), mais cela ne « t » en fait pas.
EDIT: Si vous souhaitez en savoir plus sur ce quest précisément une « topologie », lexemple le plus important de topologie à comprendre est la topologie euclidienne de $ \ mathbb {R} ^ n $. Cela sera traité en détail dans tout (bon) livre dintroduction sur « analyse réelle » .
Commentaires
- Merci pour votre réponse: Pouvez-vous sil vous plaît expliquer ce quest une topologie en terme non technique également? Le terme topologie et variété sont-ils utilisés de manière interchangeable? la dimension doit être un nombre entier? Quest-ce que cest un nombre réel, alors je pense que la structure est connue sous le nom de fractales si la structure entière est composée de chaque sous-partie se répète delle-même.
- @RiaGeorge $ n $ représente un nombre naturel (entier $ \ ge 1 $), tout comme $ N $. Il pourrait y avoir une théorie plus avancée pour les fractionnaires / r dimensions réelles, mais elles napparaissent ‘ pas aussi souvent. » Topologie » et » manifold » signifient deux choses très distinctes, donc ce ne sont pas des termes interchangeables. Un » manifold » a une » topologie « . Le domaine Topology étudie les espaces qui ont des » topologies « , qui sont des ensembles densembles satisfaisant trois règles / conditions. L’un des objectifs de l’étude des » topologies » est de décrire de manière cohérente et reproductible les notions de » comportement » local.
- @RiaGeorge Les axiomes dune topologie » » se trouve sur la page Wikipédia: en.wikipedia.org / wiki / General_topology # A_topology_on_a_set – notez également que le lien que je vous ai donné pour la définition (équivalente) de la » topologie » en termes de voisinage indiquait quelque chose de lié mais pas le même, jai modifié ma réponse pour refléter ceci: en.wikipedia.org/wiki/… Notez cependant que la définition en termes de quartiers est plus difficile à comprendre (jimagine que je pourrais bien la comprendre, mais je ne ‘ t dérange aussi, parce que je ‘ je suis paresseux
- donc de toute façon ‘ est mon opinion personnelle biaisée que vous ne ‘ t besoin de connaître la définition de voisinage de la topologie – sachez simplement que la définition plus simple vous donne tous la même puissance de la définition de voisinage en termes de description rigoureuse du comportement local, car ils sont équivalent). Quoi quil en soit, si vous êtes intéressé par les fractales, vous trouverez peut-être ces pages Wikipédia intéressantes – je ne peux ‘ vous aider avec cela, car je ne connais pas très bien le théorie et ne ‘ Je ne connais pas ou ne comprends pas la plupart des définitions – je nai entendu parler que de quelques-unes des
- Cest la seule réponse à ce jour qui prête attention à lidée mathématique moderne dassembler un objet global à partir de données locales. Malheureusement, cela n’atteint pas ‘ tout à fait le niveau de simplicité et de clarté requis pour un » non technique » account.
Answer
Dans ce contexte, le terme manifold est exact, mais est inutilement highfalutin. Techniquement, une variété est tout espace (ensemble de points avec une topologie) qui est suffisamment lisse et continu (dune manière qui peut, avec un peu deffort, être mathématiquement bien définie).
Imaginez lespace de toutes les valeurs possibles de vos facteurs dorigine. Après une technique de réduction dimensionnelle, tous les points de cet espace ne sont pas atteignables. Au lieu de cela, seuls des points sur un sous-espace intégré à lintérieur de cet espace seront réalisables. Ce sous-espace incorporé remplit la définition mathématique dune variété. Pour une technique de réduction dimensionnelle linéaire comme lACP, ce sous-espace est juste un sous-espace linéaire (par exemple un hyper-plan), qui est une variété relativement triviale. Mais pour la technique de réduction dimensionnelle non linéaire, ce sous-espace pourrait être plus compliqué (par exemple, une hyper-surface courbe). À des fins danalyse des données, comprendre quil sagit de sous-espaces est bien plus important que toute inférence que vous tireriez en sachant quils répondent à la définition de variété.
Commentaires
- » Highfalutin » … a appris un nouveau mot aujourdhui!
- Mathématiquement , une variété est nimporte quel espace topologique localement continu. Jaime lidée dessayer dexpliquer les choses en langage clair, mais cette caractérisation ne fonctionne pas vraiment ‘. Tout dabord, la continuité est toujours une propriété locale, donc je ‘ ne sais pas ce que vous entendez par localement continu. De plus, votre définition nécarte pas beaucoup de choses qui ne sont pas ‘ t variétés, telles que la droite numérique rationnelle ou lunion de deux droites qui se croisent dans le plan euclidien.
- Je suis daccord avec Ben, techniquement il ‘ s » localement euclidien « . Je ‘ ne suis pas sûr quil existe un bon moyen de résumer cela en anglais simple.
- Je dois aussi être tout à fait daccord avec les deux commentaires ci-dessus. En fait, la réponse que jai écrite ci-dessous était à lorigine censée être un commentaire clarifiant à cette réponse qui est devenue trop longue. Il ny a pas de notion précise despace topologique » continu » (voir ici: math.stackexchange.com/questions/1822769/… ). Définir des variétés en termes de concepts inexistants est, à mon avis, à long terme plus susceptible de prêter à confusion que de clarifier. À tout le moins, je suggérerais de remplacer le mot » mathématiquement » dans la première phrase par autre chose.
- Je ‘ Je vais utiliser ce commentaire pour poser une petite question … Je (pense) que jai eu lidée des variétés, mais pourquoi » localement » nécessaire? ‘ t un espace » localement » continu … continu dans son ensemble?
Réponse
Comme Bronstein et dautres lont mis dans Geometric deep learning: aller au-delà des données euclidiennes ( Lisez larticle ici )
En gros, un manifold est un espace localement euclidien. Lun des exemples les plus simples est une surface sphérique modélisant notre planète: autour dun point, elle semble planaire, ce qui a conduit des générations de personnes à croire en la planéité de la Terre. Formellement parlant, une variété X (différentiable) à d dimensions est un espace topologique où chaque point x a un voisinage qui est topologiquement équivalent (homéomorphe) à un espace euclidien à d dimensions, appelé espace tangent.
Commentaires
- La citation est contradictoire. Il décrit au départ une variété riemannienne ( » localement euclidienne « ) mais à la fin il décrit une variété topologique (les homéomorphismes ne le font pas, par définition, doivent respecter la structure différentielle et donc le concept despace tangent ne sapplique pas).