Na técnica de redução de dimensionalidade, como Análise de Componentes Principais, LDA, etc., frequentemente o termo variedade é usado. O que é um múltiplo em termos não técnicos? Se um ponto $ x $ pertencer a uma esfera cuja dimensão eu desejo reduzir, e se houver um ruído $ y $ e $ x $ e $ y $ não estiverem correlacionados, então os pontos reais $ x $ estariam muito separados de cada um outro devido ao ruído. Portanto, a filtragem de ruído seria necessária. Portanto, a redução da dimensão seria realizada em $ z = x + y $. Portanto, aqui $ x $ e $ y $ pertencem a variedades diferentes?
Estou trabalhando em dados de nuvem de pontos que costumam ser usados na visão de robôs; as nuvens de pontos são barulhentas devido ao ruído na aquisição e preciso reduzir o ruído antes da redução da dimensão. Caso contrário, obterei redução de dimensão incorreta. Então, o que é a variedade aqui e o ruído é parte da mesma variedade à qual $ x $ pertence?
Comentários
- It ‘ não é realmente possível usar o termo corretamente sem ser matematicamente preciso
Resposta
Em termos não técnicos, uma variedade é uma estrutura geométrica contínua de dimensão finita: uma linha, uma curva, um plano, uma superfície, uma esfera, uma bola, um cilindro, um toro, uma “bolha” … algo como isto:
É um termo genérico usado por matemáticos dizer “uma curva” (dimensão 1) ou “superfície” (dimensão 2), ou um objeto 3D (dimensão 3) … para qualquer dimensão finita possível $ n $. Uma variedade unidimensional é simplesmente uma curva (linha, círculo …). Uma variedade bidimensional é simplesmente uma superfície (plano, esfera, toro, cilindro …). Uma variedade tridimensional é um “objeto completo” (bola, cubo completo, o espaço 3D ao nosso redor …).
Uma variedade é freqüentemente descrita por uma equação: o conjunto de pontos $ (x, y) $, como $ x ^ 2 + y ^ 2 = 1 $, é uma variedade unidimensional (um círculo).
Um manifold tem a mesma dimensão em todos os lugares. Por exemplo, se você anexar uma linha (dimensão 1) a uma esfera (dimensão 2), a estrutura geométrica resultante não é uma variedade.
Ao contrário das noções mais gerais de espaço métrico ou espaço topológico também pretendem descrever nossa intuição natural de um conjunto contínuo de pontos, uma variedade pretende ser algo localmente simples: como um espaço vetorial de dimensão finita: $ \ mathbb {R} ^ n $. Isso exclui espaços abstratos (como espaços de dimensão infinita) que muitas vezes falham em ter um significado concreto geométrico.
Ao contrário de um espaço vetorial, variedades podem ter várias formas. Alguns manifolds podem ser facilmente visualizados (esfera, bola …), alguns são difíceis de visualizar, como a garrafa de Klein ou a plano projetivo real .
Em estatística, aprendizado de máquina ou matemática aplicada em geral, a palavra “variedade” costuma ser usada para dizer “como um subespaço linear”, mas possivelmente curvo . Sempre que você escreve uma equação linear como: $ 3x + 2y-4z = 1 $, você obtém um subespaço linear (afim) (aqui um plano). Normalmente, quando a equação é não linear como $ x ^ 2 + 2y ^ 2 + 3z ^ 2 = 7 $, isso é uma variedade (aqui uma esfera esticada).
Por exemplo, o “ hipótese de variedade “de ML diz que” dados de alta dimensão são pontos em uma variedade de baixa dimensão com ruído de alta dimensão adicionado “. Você pode imaginar pontos de um círculo 1D com algum ruído 2D adicionado. Embora os pontos não estejam exatamente no círculo, eles satisfazem estatisticamente a equação $ x ^ 2 + y ^ 2 = 1 $. O círculo é a variedade subjacente:
Comentários
- @RiaGeorge Na imagem, é a superfície que é uma variedade. É ‘ contínuo porque você pode se mover livremente sem interrupção e nunca ter que pular para fora da superfície para ficar entre dois lugares. Os buracos aos quais você alude são importantes para descrever como você pode contornar a superfície entre quaisquer dois pontos da maneira mais simples, e contá-los é uma técnica importante no estudo de variedades.
- Explicar o que é topologia seria uma questão muito ampla para este site e um pouco fora do tópico. Gostaria de pesquisar a troca de pilha de matemática para obter informações sobre isso. Manifolds e topologia não são sinônimos: manifolds são objetos matemáticos estudados com as técnicas de topologia, topologia é um sub-assunto da matemática.
- Esta parece ser uma explicação muito boa para alguém que está aprendendo sobre o conceito pela primeira vez tempo, com exemplos concretos bem escolhidos. (Eu não ‘ não sei ao certo, pois já encontrei o conceito antes.) Como um pequeno problema, eu recomendaria reformular a última frase para ser menos absoluta (” Sempre que a equação for não linear como …”): como está escrito agora, não é realmente verdade. Além desse pequeno problema, acho isso muito bem escrito.
- A resposta perde todos os pontos fundamentais que compõem uma variedade, eu não ‘ não entendo como tem tantos votos positivos. Topologia, gráficos e suavidade nem sequer são mencionados e a resposta basicamente dá a impressão de que um manifold é uma superfície, o que não é .
- Ponto técnico, o conjunto de solução de um sistema de equações não precisa ser uma variedade. É ‘ uma variedade, então ‘ é principalmente um manifold, mas pode ter pontos de autointerseção onde a propriedade manifold falha.
Resposta
Uma variedade (topológica) é um espaço $ M $ que é:
(1) “localmente” “equivalente” a $ \ mathbb {R} ^ n $ por algum $ n $.
“Localmente”, a “equivalência” pode ser expressa via $ n $ funções de coordenadas, $ c_i: M \ to \ mathbb {R} $, que juntas formam uma função de “preservação de estrutura”, $ c: M \ to \ mathbb {R} ^ n $, chamado de gráfico .
(2) pode ser realizado de uma forma “preservadora da estrutura” como um subconjunto de $ \ mathbb {R} ^ N $ para algum $ N \ ge n $. (1) (2)
Observe que, para tornar a “estrutura” precisa aqui, é preciso entender noções básicas de topologia ( def. ), o que permite fazer noções precisas do comportamento “local” e, portanto, “localmente” acima. Quando digo “equivalente”, quero dizer estrutura topológica equivalente ( homeomórfica ), e quando digo “preservação de estrutura” quero dizer a mesma coisa (cria um equivalente estrutura topológica).
Observe também que, para fazer cálculos em variedades , é necessária uma condição adicional que não decorre da acima de duas condições, que basicamente diz algo como “os gráficos são bem comportados o suficiente para nos permitir fazer cálculos”. Essas são as variedades mais usadas na prática. Diferentemente da topologia geral variedades , além do cálculo, também permitem triangulações , que é muito importante em aplicações como o seu envolvendo dados de nuvem de pontos .
Observe que nem todas as pessoas usam a mesma definição para uma variedade (topológica). Vários autores irão defini-la como satisfatória apenas a condição (1) acima ve, não necessariamente também (2). No entanto, a definição que satisfaz tanto (1) quanto (2) é muito melhor comportada, portanto, mais útil para os profissionais. Pode-se esperar intuitivamente que (1) implique (2), mas na verdade não “t.
EDITAR: Se você estiver interessado em aprender sobre o que é exatamente uma “topologia”, o exemplo mais importante de uma topologia para entender é a topologia euclidiana de $ \ mathbb {R} ^ n $. Isso será abordado em profundidade em qualquer (bom) livro introdutório sobre “análise real” .
Comentários
- Obrigado por sua resposta: Você pode explicar o que é uma topologia em um termo não técnico também? O termo topologia e variedade são usados alternadamente? dimensão tem que ser um número inteiro? O que é um número real, então eu acho que a estrutura é conhecida como fractais se toda a estrutura é composta de cada subparte é auto-repetida.
- @RiaGeorge $ n $ representa um número natural (inteiro $ \ ge 1 $), assim como $ N $. Pode haver uma teoria mais avançada para / r fracionário dimensões com valor real, mas não ‘ não aparece com tanta frequência. ” Topologia ” e ” manifold ” significam duas coisas muito distintas, portanto, não são termos intercambiáveis. Um ” manifold ” tem uma ” topologia “. O campo de Topologia estuda espaços que possuem ” topologias “, que são coleções de conjuntos que satisfazem três regras / condições. Um objetivo de estudar ” topologias ” é descrever de forma consistente e reproduzível noções de ” comportamento ” local.
- @RiaGeorge Os axiomas para uma ” topologia ” pode ser encontrado na página da Wikipedia: en.wikipedia.org / wiki / General_topology # A_topology_on_a_set – observe também que o link que forneci para a definição (equivalente) de ” topologia ” em termos de vizinhança apontou para algo relacionado, mas não igual, editei minha resposta para refletir isso: en.wikipedia.org/wiki/… Observe, entretanto, que a definição em termos de vizinhança é mais difícil de entender (imagino que poderia entender bem, mas não ‘ t incomoda também, porque eu ‘ sou preguiçoso
- então, de qualquer forma, ‘ é minha opinião tendenciosa pessoal de que você ‘ t preciso saber a definição de vizinhança da topologia – apenas saiba que a definição mais simples oferece a você o mesmo poder da definição de vizinhança em termos de descrição rigorosa do comportamento local, uma vez que eles são equivalente). De qualquer forma, se você está interessado em fractais, talvez você ache estas páginas da Wikipedia interessantes – eu não posso ‘ ajudá-lo mais com isso, porque não estou profundamente familiarizado com o teoria e não ‘ não conheço ou entendo a maioria das definições – só ouvi falar de algumas
- Esta é a única resposta até agora que presta atenção à ideia matemática moderna de montar um objeto global a partir de dados locais. Infelizmente, não ‘ não chega ao nível de simplicidade e clareza exigidos de um ” não técnico ” conta.
Resposta
Neste contexto, o termo manifold é correto, mas é desnecessariamente pretensioso. Tecnicamente, uma variedade é qualquer espaço (conjunto de pontos com uma topologia) que seja suficientemente liso e contínuo (de uma forma que possa, com algum esforço, ser matematicamente bem definido).
Imagine o espaço de todos os valores possíveis de seus fatores originais. Depois de uma técnica de redução dimensional, nem todos os pontos naquele espaço são atingíveis. Em vez disso, apenas pontos em algum subespaço embutido naquele espaço serão atingíveis. Esse subespaço embutido cumpre a definição matemática de uma variedade. Para uma técnica de redução dimensional linear como PCA, esse subespaço é apenas um subespaço linear (por exemplo, um hiperplano), que é uma variedade relativamente trivial. Mas, para a técnica de redução dimensional não linear, esse subespaço pode ser mais complicado (por exemplo, uma hiper-superfície curva). Para fins de análise de dados, entender que esses são subespaços é muito mais importante do que qualquer inferência que você tiraria sabendo que eles preenchem a definição de variedade.
Comentários
- ” Highfalutin ” … aprendi uma palavra nova hoje!
- Matematicamente , uma variedade é qualquer espaço topológico localmente contínuo. Gosto da ideia de tentar explicar as coisas em linguagem simples, mas essa caracterização realmente não ‘ funciona. Em primeiro lugar, a continuidade é sempre uma propriedade local, então ‘ m não tenho certeza do que você quer dizer com contínua localmente. Além disso, sua definição falha ao descartar muitas coisas que não são variedades ‘ t, como a reta numérica racional ou a união de duas linhas que se cruzam no plano euclidiano.
- Eu concordo com Ben, tecnicamente, ‘ s ” localmente euclidiano “. Eu ‘ Não tenho certeza se há uma boa maneira de resumir isso ao inglês simples.
- Também tenho que concordar totalmente com os dois comentários acima. Na verdade, a resposta que escrevi abaixo pretendia originalmente ser um comentário esclarecedor a essa resposta, que se tornou muito longa. Não há uma noção precisa de um espaço topológico ” contínuo ” (veja aqui: math.stackexchange.com/questions/1822769/… ). Definir variedades em termos de conceitos inexistentes é, em minha opinião, a longo prazo mais provável de ser confuso do que esclarecedor. No mínimo, sugiro substituir a palavra ” matematicamente ” na primeira frase por outra coisa.
- Eu ‘ usarei este comentário como uma oportunidade para fazer uma pequena pergunta … (acho) que tive a ideia dos manifolds, mas por que ” localmente ” necessário? É ‘ t um espaço ” localmente ” contínuo … contínuo como um todo?
Resposta
Como Bronstein e outros colocaram em Aprendizado geométrico profundo: indo além dos dados euclidianos ( Leia o artigo aqui )
Aproximadamente, um manifold é um espaço localmente euclidiano. Um dos exemplos mais simples é uma superfície esférica modelando nosso planeta: em torno de um ponto, parece ser plano, o que tem levado gerações de pessoas a acreditar na planura da Terra. Falando formalmente, uma variedade d-dimensional (diferenciável) X é um espaço topológico em que cada ponto x tem uma vizinhança que é topologicamente equivalente (homeomórfica) a um espaço euclidiano d-dimensional, chamado espaço tangente.
Comentários
- A citação é contraditória. No início, descreve uma variedade riemanniana (” localmente euclidiana “), mas no final descreve uma variedade topológica (os homeomorfismos não, por definição, tem que respeitar a estrutura diferencial e, portanto, o conceito de espaço tangente não se aplica).