¿Qué es un colector?

En la técnica de reducción de dimensionalidad, como el análisis de componentes principales, LDA, etc., a menudo se utiliza el término múltiple. ¿Qué es una variedad en un término no técnico? Si un punto $ x $ pertenece a una esfera cuya dimensión quiero reducir, y si hay un ruido $ y $ y $ x $ y $ y $ no están correlacionados, entonces los puntos reales $ x $ estarían muy separados de cada uno. otros por el ruido. Por lo tanto, se requeriría filtrado de ruido. Entonces, la reducción de dimensión se realizaría en $ z = x + y $. Por lo tanto, ¿aquí $ x $ y $ y $ pertenecen a diferentes variedades?

Estoy trabajando en datos de nubes de puntos que se utilizan a menudo en la visión de robots; las nubes de puntos son ruidosas debido al ruido en la adquisición y necesito reducir el ruido antes de la reducción de dimensión. De lo contrario, obtendré una reducción de dimensión incorrecta. Entonces, ¿cuál es la variedad aquí y es el ruido una parte de la misma variedad a la que pertenece $ x $?

Comentarios

  • It ‘ No es realmente posible usar el término correctamente sin ser matemáticamente preciso

Responder

En términos no técnicos, una variedad es una estructura geométrica continua que tiene una dimensión finita: una línea, una curva, un plano, una superficie, una esfera, una bola, un cilindro, un toro, una «mancha» … algo como esto: ingrese la descripción de la imagen aquí

Es un término genérico usado por matemáticos para decir «una curva» (dimensión 1) o «superficie» (dimensión 2), o un objeto 3D (dimensión 3) … para cualquier posible dimensión finita $ n $. Una variedad unidimensional es simplemente una curva (línea, círculo …). Una variedad bidimensional es simplemente una superficie (plano, esfera, toro, cilindro …). Una variedad tridimensional es un «objeto completo» (bola, cubo completo, el espacio 3D que nos rodea …).

Una variedad se describe a menudo mediante una ecuación: el conjunto de puntos $ (x, y) $ como $ x ^ 2 + y ^ 2 = 1 $ es una variedad unidimensional (un círculo).

Una variedad tiene la misma dimensión en todas partes. Por ejemplo, si agrega una línea (dimensión 1) a una esfera (dimensión 2), la estructura geométrica resultante no es una variedad.

A diferencia de las nociones más generales de espacio métrico o espacio topológico que también pretenden describir nuestra intuición natural de un conjunto continuo de puntos, una variedad pretende ser algo localmente simple: como un espacio vectorial de dimensión finita: $ \ mathbb {R} ^ n $. Esto excluye los espacios abstractos (como los espacios de dimensión infinita) que a menudo no tienen un significado geométrico concreto.

A diferencia de un espacio vectorial, las variedades pueden tener varias formas. Algunas variedades se pueden visualizar fácilmente (esfera, bola …), otras son difíciles de visualizar, como la botella de Klein o la plano proyectivo real .

En estadística, aprendizaje automático o matemáticas aplicadas en general, la palabra «múltiple» se usa a menudo para decir «como un subespacio lineal» pero posiblemente curvo . Cada vez que escribe una ecuación lineal como: $ 3x + 2y-4z = 1 $ obtiene un subespacio lineal (afín) (aquí un plano). Por lo general, cuando la ecuación no es lineal como $ x ^ 2 + 2y ^ 2 + 3z ^ 2 = 7 $, esta es una variedad (aquí una esfera estirada).

Por ejemplo, el « hipótesis múltiple «de ML dice que» los datos de alta dimensión son puntos en una variedad de baja dimensión con ruido de alta dimensión añadido «. Puede imaginar puntos de un círculo 1D con algo de ruido 2D agregado. Si bien los puntos no están exactamente en el círculo, satisfacen estadísticamente la ecuación $ x ^ 2 + y ^ 2 = 1 $. El círculo es la variedad subyacente: https://i.stack.imgur.com/iEm2m.png

Comentarios

  • @RiaGeorge En la imagen, la superficie es una variedad. Es ‘ continuo porque puedes moverte libremente sin interrupciones y nunca tienes que saltar fuera de la superficie para entrar entre dos lugares. Los agujeros a los que alude son importantes para describir cómo puede moverse en la superficie entre dos puntos cualesquiera de la manera más sencilla, y contarlos es una técnica importante en el estudio de variedades.
  • Explicar qué es la topología sería una pregunta demasiado amplia para este sitio y un poco fuera de tema. Buscaría información sobre eso en el intercambio de pila de matemáticas. Las variedades y la topología no son sinónimos: las variedades son objetos matemáticos estudiados con las técnicas de la topología, la topología es un subtema de las matemáticas.
  • Esto parece una muy buena explicación para alguien que está aprendiendo sobre el concepto por primera vez. tiempo, con ejemplos concretos bien elegidos. (No ‘ no lo sé con certeza, ya que me he encontrado con el concepto antes). Como pequeña objeción, recomendaría reformular la última oración para que sea menos absoluta (» Siempre que la ecuación sea no lineal como …»): como está escrito ahora, no es realmente cierto. Aparte de esa pequeña objeción, encuentro que esto está muy bien escrito.
  • La respuesta pasa por alto todos los puntos fundamentales que hacen que una variedad tal, no ‘ entiendo cómo tiene tantos votos a favor. La topología, los gráficos y la suavidad ni siquiera se mencionan y la respuesta básicamente da la impresión de que una variedad es una superficie, que no .
  • Punto técnico, el conjunto de solución de una El sistema de ecuaciones no tiene por qué ser múltiple. Es ‘ una variedad, por lo que ‘ es principalmente una variedad, pero puede tener puntos de intersección propia donde falla la propiedad de la variedad.

Respuesta

Una variedad (topológica) es un espacio $ M $ que es:

(1) «localmente» «equivalente» a $ \ mathbb {R} ^ n $ por unos $ n $.

«Localmente», la «equivalencia» se puede expresar mediante $ n $ funciones de coordenadas, $ c_i: M \ to \ mathbb {R} $, que juntas forman una función de «preservación de la estructura», $ c: M \ to \ mathbb {R} ^ n $, llamado gráfico .

(2) se puede realizar de una manera «preservadora de la estructura» como un subconjunto de $ \ mathbb {R} ^ N $ por unos $ N \ ge n $. (1) (2)

Tenga en cuenta que para Para que la «estructura» sea precisa aquí, es necesario comprender las nociones básicas de topología ( def. ), lo que permite hacer nociones precisas del comportamiento «local» y, por lo tanto, «localmente» arriba. Cuando digo «equivalente», me refiero a una estructura topológica equivalente ( homeomorfo ), y cuando digo «preserva la estructura» me refiero a lo mismo (crea un equivalente estructura topológica).

Note también que para hacer cálculo en variedades , se necesita una condición adicional que no se sigue de por encima de dos condiciones, que básicamente dice algo así como «los gráficos se comportan lo suficientemente bien como para permitirnos hacer cálculo». Estas son las variedades más utilizadas en la práctica. A diferencia de la topológica general colectores , además del cálculo, también permiten triangulaciones , que es muy importante en aplicaciones como el suyo que involucra datos de nube de puntos .

Tenga en cuenta que no todas las personas usan la misma definición para una variedad (topológica). Varios autores la definirán como satisfactorio solamente condición (1) abo ve, no necesariamente también (2). Sin embargo, la definición que satisface tanto (1) como (2) se comporta mucho mejor y, por lo tanto, es más útil para los profesionales. Uno podría esperar intuitivamente que (1) implica (2), pero en realidad no «t.

EDIT: Si está interesado en aprender qué es exactamente una «topología», el ejemplo más importante de una topología que debe comprender es la topología euclidiana de $ \ mathbb {R} ^ n $. Esto se tratará en profundidad en cualquier (buen) libro introductorio sobre «análisis real» .

Comentarios

  • Gracias por su respuesta: ¿Puede explicar qué es una topología en un término no técnico también? ¿Se usan indistintamente los términos topología y variedad? ¿La dimensión tiene que ser un número entero? ¿Qué es un número real? Entonces creo que la estructura se conoce como fractales si la estructura completa se compone de cada subparte se repite a sí misma.
  • @RiaGeorge $ n $ representa un número natural (entero $ \ ge 1 $), al igual que $ N $. Podría haber una teoría más avanzada para fraccional / r dimensiones valiosas, pero no ‘ aparece con tanta frecuencia. » Topología » y » colector » significan dos cosas muy distintas, por lo que no son términos intercambiables. Una » múltiple » tiene una » topología «. El campo de la topología estudia espacios que tienen » topologías «, que son colecciones de conjuntos que satisfacen tres reglas / condiciones. Uno de los objetivos de estudiar » topologías » es describir de manera coherente y reproducible las nociones de » comportamiento » local.
  • @RiaGeorge Los axiomas para una » topología » se puede encontrar en la página de Wikipedia: en.wikipedia.org / wiki / General_topology # A_topology_on_a_set : tenga en cuenta también que el enlace que le di para la definición (equivalente) de » topología » en términos de vecindario apuntó a algo relacionado pero no igual, he editado mi respuesta para reflejar esto: en.wikipedia.org/wiki/… Sin embargo, tenga en cuenta que la definición en términos de barrios es más difícil de entender (imagino que podría entenderla bien, pero no ‘ t me molesto también, porque yo ‘ soy vago
  • así que de todos modos es ‘ mi opinión personal sesgada de que no ‘ No es necesario conocer la definición de vecindario de topología; solo sepa que la definición más simple le brinda el mismo poder de la definición de vecindario en términos de describir rigurosamente el comportamiento local, ya que son equivalente). De todos modos, si estás interesado en los fractales, tal vez encuentres interesantes estas páginas de Wikipedia. No puedo ‘ ayudarte más con eso, porque no estoy muy familiarizado con el teoría y no ‘ no conozco o entiendo la mayoría de las definiciones. Solo he oído hablar de algunas de las
  • Esta es la única respuesta hasta ahora que presta atención a la idea matemática moderna de ensamblar un objeto global a partir de datos locales. Lamentablemente, no ‘ no llega al nivel de simplicidad y claridad que se requiere de un » no técnico » cuenta.

Responder

En este contexto, el término múltiple es exacto, pero es innecesariamente exagerado. Técnicamente, una variedad es cualquier espacio (conjunto de puntos con una topología) que es lo suficientemente suave y continuo (de una manera que, con algo de esfuerzo, puede hacerse matemáticamente bien definido).

Imagine el espacio de todos los valores posibles de sus factores originales. Después de una técnica de reducción dimensional, no todos los puntos en ese espacio son alcanzables. En cambio, solo serán alcanzables los puntos en algún subespacio incrustado dentro de ese espacio. Ese subespacio incrustado cumple la definición matemática de una variedad. Para una técnica de reducción dimensional lineal como PCA, ese subespacio es solo un subespacio lineal (por ejemplo, un hiperplano), que es una variedad relativamente trivial. Pero para la técnica de reducción dimensional no lineal, ese subespacio podría ser más complicado (por ejemplo, una hiper-superficie curva). Para fines de análisis de datos, comprender que estos son subespacios es mucho más importante que cualquier inferencia que extraiga al saber que cumplen con la definición de variedad.

Comentarios

  • » Highfalutin » … aprendí una nueva palabra hoy!
  • Matemáticamente , una variedad es cualquier espacio topológico localmente continuo. Me gusta la idea de tratar de explicar las cosas en lenguaje sencillo, pero esta caracterización realmente no ‘ no funciona. En primer lugar, la continuidad es siempre una propiedad local, por lo que ‘ no estoy seguro de lo que quiere decir con localmente continuo. Además, su definición no descarta muchas cosas que no son ‘ t variedades, como la recta numérica racional o la unión de dos rectas que se cruzan en el plano euclidiano.
  • Estoy de acuerdo con Ben, técnicamente ‘ es » localmente euclidiano «. Yo ‘ no estoy seguro de que haya una buena manera de resumir eso en un inglés simple.
  • También estoy totalmente de acuerdo con los dos comentarios anteriores. De hecho, la respuesta que escribí a continuación originalmente tenía la intención de ser un comentario aclaratorio a esta respuesta que se volvió demasiado larga. No existe una noción precisa de un espacio topológico » continuo » (ver aquí: math.stackexchange.com/questions/1822769/… ). Definir múltiples en términos de conceptos inexistentes es, en mi opinión, a largo plazo más confuso que esclarecedor. Como mínimo, sugeriría reemplazar la palabra » matemáticamente » en la primera oración con otra cosa.
  • Yo ‘ usaré este comentario como una oportunidad para hacer una pequeña pregunta … Creo que tengo la idea de múltiples, pero ¿por qué es » localmente » ¿se necesita? ¿Es ‘ t un espacio » localmente » continuo … continuo como un todo?

Respuesta

Como Bronstein y otros lo han expresado en Aprendizaje profundo geométrico: más allá de los datos euclidianos ( Lea el artículo aquí )

Aproximadamente, un manifold es un espacio que es localmente euclidiano. Uno de los ejemplos más simples es una superficie esférica que modela nuestro planeta: alrededor de un punto, parece ser plano, lo que ha llevado a generaciones de personas a creer en la planitud de la Tierra. Hablando formalmente, una variedad X (diferenciable) d-dimensional es un espacio topológico donde cada punto x tiene un vecindario que es topológicamente equivalente (homeomórfico) a un espacio euclidiano d-dimensional, llamado espacio tangente.

Comentarios

  • La cita es contradictoria. Al principio describe una variedad riemanniana (» localmente euclidiana «), pero al final describe una variedad topológica (los homeomorfismos no lo hacen, por definición, deben respetar la estructura diferencial y por lo tanto no se aplica el concepto de espacio tangente).

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *