Cosè un collettore?

Nelle tecniche di riduzione della dimensionalità come lanalisi dei componenti principali, LDA, ecc. spesso viene utilizzato il termine varietà. Cosè un collettore in termini non tecnici? Se un punto $ x $ appartiene a una sfera di cui desidero ridurre la dimensione e se cè un disturbo $ y $ e $ x $ e $ y $ non sono correlati, i punti effettivi $ x $ sarebbero molto separati da ciascuno altro a causa del rumore. Pertanto, sarebbe necessario filtrare il rumore. Quindi, la riduzione della dimensione verrebbe eseguita su $ z = x + y $. Quindi, qui $ x $ e $ y $ appartengono a varietà differenti?

Sto lavorando su dati di nuvole di punti che sono spesso usati nella visione robotica; le nuvole di punti sono rumorose a causa del rumore in acquisizione e devo ridurre il rumore prima di ridurre le dimensioni. In caso contrario, otterrò una riduzione delle dimensioni errata. Allora, qual è il collettore qui e il rumore è una parte dello stesso collettore a cui appartiene $ x $?

Commenti

  • It ‘ non è realmente possibile utilizzare il termine correttamente senza essere matematicamente precisi

Risposta

In termini non tecnici, una varietà è una struttura geometrica continua di dimensione finita: una linea, una curva, un piano, una superficie, una sfera, una palla, un cilindro, un toro, un “blob” … qualcosa del genere: inserisci qui la descrizione dellimmagine

È un termine generico usato da matematici per dire “una curva” (dimensione 1) o “superficie” (dimensione 2), o un oggetto 3D (dimensione 3) … per ogni possibile dimensione finita $ n $. Una varietà unidimensionale è semplicemente una curva (linea, cerchio …). Una varietà bidimensionale è semplicemente una superficie (piano, sfera, toro, cilindro …). Una varietà tridimensionale è un “oggetto pieno” (palla, cubo pieno, lo spazio 3D intorno a noi …).

Una varietà è spesso descritta da unequazione: linsieme di punti $ (x, y) $ come $ x ^ 2 + y ^ 2 = 1 $ è una varietà unidimensionale (un cerchio).

Un collettore ha la stessa dimensione ovunque. Ad esempio, se si aggiunge una linea (dimensione 1) a una sfera (dimensione 2), la struttura geometrica risultante non è una varietà.

A differenza delle nozioni più generali di spazio metrico o spazio topologico intese anche a descrivere la nostra intuizione naturale di un insieme continuo di punti, una varietà è intesa come qualcosa di semplice localmente: come uno spazio vettoriale di dimensione finita: $ \ mathbb {R} ^ n $. Questo esclude gli spazi astratti (come gli spazi di dimensioni infinite) che spesso non riescono ad avere un significato concreto geometrico.

A differenza di uno spazio vettoriale, le varietà possono avere varie forme. Alcune varietà possono essere facilmente visualizzate (sfera, palla …), altre sono difficili da visualizzare, come la bottiglia di Klein o la piano proiettivo reale .

Nelle statistiche, nellapprendimento automatico o nella matematica applicata in generale, la parola “collettore” viene spesso usata per dire “come un sottospazio lineare” ma probabilmente curva . Ogni volta che scrivi unequazione lineare come: $ 3x + 2y-4z = 1 $ ottieni un sottospazio lineare (affine) (qui un piano). Di solito, quando lequazione non è lineare come $ x ^ 2 + 2y ^ 2 + 3z ^ 2 = 7 $, questa è una varietà (qui una sfera allungata).

Ad esempio il “ ipotesi del collettore “di ML dice” i dati ad alta dimensione sono punti in un collettore a bassa dimensione con laggiunta di rumore ad alta dimensione “. Puoi immaginare i punti di un cerchio 1D con un po di rumore 2D aggiunto. Sebbene i punti non siano esattamente sul cerchio, soddisfano statisticamente lequazione $ x ^ 2 + y ^ 2 = 1 $. Il cerchio è la varietà sottostante: https://i.stack.imgur.com/iEm2m.png

Commenti

  • @RiaGeorge Nella foto è la superficie che è un collettore. È ‘ continuo perché puoi muoverti liberamente senza interruzioni e non devi mai saltare giù dalla superficie per spostarti tra due punti qualsiasi. I buchi a cui alludi sono importanti per descrivere come puoi muoverti sulla superficie tra due punti qualsiasi nel modo più semplice, e contarli è una tecnica importante nello studio delle varietà.
  • Spiegare cosè la topologia sarebbe una domanda troppo ampia per questo sito e un po fuori tema. Cercherei nello scambio di stack matematici per informazioni su questo. I collettori e la topologia non sono sinonimi: i collettori sono oggetti matematici studiati con le tecniche della topologia, la topologia è un sotto-oggetto della matematica.
  • Questa sembra unottima spiegazione per chi impara per la prima volta il concetto tempo, con esempi concreti ben scelti. (Non ‘ non lo so per certo dato che ho incontrato il concetto in precedenza.) Come piccolo cavillo, consiglierei di riformulare lultima frase in modo che sia meno assoluta (” Ogni volta che lequazione è non lineare come …”): come è scritto in questo momento, in realtà non è vero. A parte quel piccolo cavillo, lo trovo scritto molto bene.
  • La risposta non ha tutti i punti fondamentali che rendono tale varietà, non ‘ come ha così tanti voti positivi. Topologia, grafici e levigatezza non vengono nemmeno menzionati e la risposta fondamentalmente dà limpressione che un collettore sia una superficie, che non .
  • Punto tecnico, linsieme di soluzioni di un il sistema di equazioni non deve essere necessariamente una varietà. È ‘ una varietà, quindi ‘ è principalmente una varietà, ma può avere punti di auto intersezione in cui la proprietà collettore fallisce.

Risposta

Una varietà (topologica) è uno spazio $ M $ che è:

(1) “localmente” “equivalente” a $ \ mathbb {R} ^ n $ per qualche $ n $.

“Localmente”, l “equivalenza” può essere espressa tramite le funzioni di coordinate $ n $, $ c_i: M \ to \ mathbb {R} $, che insieme formano una funzione di “conservazione della struttura”, $ c: M \ to \ mathbb {R} ^ n $, chiamato grafico .

(2) può essere realizzato in modo “preservante la struttura” come sottoinsieme di $ \ mathbb {R} ^ N $ per qualche $ N \ ge n $. (1) (2)

Tieni presente che per rendere la “struttura” precisa qui, è necessario comprendere le nozioni di base di topologia ( def. ), che consente di formulare concetti precisi di comportamento “local” , e quindi “localmente” sopra. Quando dico “equivalente”, intendo una struttura topologica equivalente ( omeomorfico ), e quando dico “preservante la struttura” intendo la stessa cosa (crea un equivalente struttura topologica).

Si noti inoltre che per eseguire calcoli sulle varietà , è necessaria una condizione aggiuntiva che non segue dal sopra due condizioni, che fondamentalmente dice qualcosa come “i grafici sono abbastanza ben educati da permetterci di fare calcoli”. Queste sono le varietà più spesso utilizzate nella pratica. A differenza della topologica generale varietà , oltre al calcolo, consentono anche triangolazioni , che è molto importante in applicazioni come i tuoi che riguardano i dati della nuvola di punti .

Tieni presente che non tutte le persone usano la stessa definizione per una varietà (topologica). Diversi autori la definiranno come soddisfacente solo condizione (1) abo ve, non necessariamente anche (2). Tuttavia, la definizione che soddisfa sia (1) che (2) è molto meglio comportata, quindi più utile per i professionisti. Ci si potrebbe aspettare intuitivamente che (1) implichi (2), ma in realtà non “t.

EDIT: Se sei interessato a conoscere cosè esattamente una “topologia”, lesempio più importante di una topologia da comprendere è la topologia euclidea di $ \ mathbb {R} ^ n $. Questo argomento sarà trattato in modo approfondito in qualsiasi (buono) libro introduttivo sull “analisi reale” .

Commenti

  • Grazie per la tua risposta: Puoi spiegare cosè una topologia anche in termini non tecnici? Il termine topologia e varietà è usato in modo intercambiabile? la dimensione deve essere un numero intero? Cosè un numero reale, quindi penso che la struttura sia nota come frattali se lintera struttura è composta da ogni sottoparte si ripete da sola.
  • @RiaGeorge $ n $ sta per un numero naturale (intero $ \ ge 1 $), così come $ N $. Potrebbe esserci una teoria più avanzata per frazionario / r Dimensioni a valore reale, ma ‘ non vengono visualizzate così spesso. ” Topologia ” e ” collettore ” significano due cose molto distinte, quindi non sono termini intercambiabili. Un ” collettore ” ha una ” topologia “. Il campo della topologia studia gli spazi che hanno ” topologie “, che sono raccolte di insiemi che soddisfano tre regole / condizioni. Uno degli obiettivi dello studio delle ” topologie ” è descrivere in modo coerente e riproducibile le nozioni di ” comportamento ” locale.
  • @RiaGeorge Gli assiomi per una ” topologia ” può essere trovato sulla pagina Wikipedia: en.wikipedia.org / wiki / General_topology # A_topology_on_a_set – nota anche che il link che ti ho fornito per la definizione (equivalente) di ” topologia ” in termini di quartiere indicava qualcosa di correlato ma non lo stesso, ho modificato la mia risposta per riflettere questo: en.wikipedia.org/wiki/… Nota tuttavia che la definizione in termini di quartieri è più difficile da capire (immagino di poterla capire bene, ma non ‘ t anche fastidio, perché ‘ sono pigro
  • quindi comunque ‘ è mia opinione personale e parziale che tu non ‘ t bisogno di conoscere la definizione di vicinato della topologia – sappi solo che la definizione più semplice ti dà la stessa potenza della definizione di vicinato in termini di descrizione rigorosa del comportamento locale, dal momento che sono equivalente). Ad ogni modo, se sei interessato ai frattali, forse troverai interessanti queste pagine di Wikipedia – Non posso ‘ aiutarti di più però, perché non conosco a fondo il teoria e non ‘ conoscere o comprendere la maggior parte delle definizioni – Ho solo sentito parlare di alcune delle
  • Questa è lunica risposta finora a cui prestare attenzione alla moderna idea matematica di assemblare un oggetto globale da dati locali. Sfortunatamente, ‘ non raggiunge il livello di semplicità e chiarezza richiesto da un ” non tecnico ” account.

Risposta

In questo contesto, il termine collettore è accurato, ma è inutilmente highfalutin. Tecnicamente, una varietà è qualsiasi spazio (insieme di punti con una topologia) che sia sufficientemente liscio e continuo (in un modo che può, con un certo sforzo, essere reso matematicamente ben definito).

Immagina lo spazio di tutti i possibili valori dei tuoi fattori originali. Dopo una tecnica di riduzione dimensionale, non tutti i punti in quello spazio sono raggiungibili. Saranno invece raggiungibili solo i punti su qualche sottospazio incorporato allinterno di quello spazio. Quel sub-spazio incorporato sembra soddisfare la definizione matematica di una varietà. Per una tecnica di riduzione dimensionale lineare come PCA, quel sottospazio è solo un sottospazio lineare (ad esempio un iperpiano), che è una varietà relativamente banale. Ma per la tecnica di riduzione dimensionale non lineare, quel sottospazio potrebbe essere più complicato (ad esempio uniper-superficie curva). Ai fini dellanalisi dei dati, capire che si tratta di spazi secondari è molto più importante di qualsiasi inferenza che potresti trarre dal sapere che soddisfano la definizione di varietà.

Commenti

  • ” Highfalutin ” … ho imparato una nuova parola oggi!
  • Matematicamente , una varietà è qualsiasi spazio topologico localmente continuo. Mi piace lidea di cercare di spiegare le cose in un linguaggio semplice, ma questa caratterizzazione in realtà ‘ non funziona. Prima di tutto, la continuità è sempre una proprietà locale, quindi ‘ non sono sicuro di cosa intendi per continuo locale. Inoltre, la tua definizione non esclude molte cose che non sono ‘ t varietà, come la retta numerica razionale o lunione di due rette intersecanti nel piano euclideo.
  • Sono daccordo con Ben, tecnicamente ‘ s ” euclideo locale “. ‘ non sono sicuro che ci sia un buon modo per ridurlo a un semplice inglese.
  • Devo anche essere assolutamente daccordo con i due commenti sopra. In effetti, la risposta che ho scritto di seguito doveva essere originariamente un commento chiarificatore a questa risposta che è diventata troppo lunga. Non esiste una nozione precisa di uno spazio topologico ” continuo ” (vedi qui: math.stackexchange.com/questions/1822769/… ). Definire varietà in termini di concetti inesistenti è, a mio avviso, a lungo termine più probabile che sia fonte di confusione che di chiarimento. Come minimo, suggerirei di sostituire la parola ” matematicamente ” nella prima frase con qualcosaltro.
  • Io ‘ userò questo commento come unopportunità per porre una piccola domanda … Penso di aver avuto lidea delle varietà, ma perché ” localmente ” necessario? Non è ‘ uno spazio ” localmente ” continuo … continuo nel suo insieme?

Risposta

Come hanno affermato Bronstein e altri in Geometric deep learning: andare oltre i dati euclidei ( Leggi larticolo qui )

Approssimativamente, un manifold è uno spazio localmente euclideo. Uno degli esempi più semplici è una superficie sferica che modella il nostro pianeta: intorno a un punto, sembra essere planare, il che ha portato generazioni di persone a credere nella piattezza della Terra. Formalmente parlando, una varietà d-dimensionale X (differenziabili) è uno spazio topologico in cui ogni punto x ha un intorno topologicamente equivalente (omeomorfo) a uno spazio euclideo d-dimensionale, chiamato spazio tangente. = “ca8b50dedd”>

Commenti

  • La citazione è contraddittoria. Allinizio descrive una varietà riemanniana (” localmente euclidea “) ma alla fine descrive una varietà topologica (gli omeomorfismi no, per definizione, devono rispettare la struttura differenziale e quindi il concetto di spazio tangente non si applica).

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *