Ce este o varietate?

În tehnica de reducere a dimensionalității, cum ar fi analiza componentelor principale, LDA etc., adesea se folosește termenul colector. Ce este o varietate în termeni non-tehnici? Dacă un punct $ x $ aparține unei sfere a cărei dimensiune vreau să o reduc și dacă există un zgomot $ y $ și $ x $ și $ y $ sunt necorelate, atunci punctele reale $ x $ ar fi departe de fiecare altele din cauza zgomotului. Prin urmare, ar fi necesară filtrarea zgomotului. Deci, reducerea dimensiunii ar fi efectuată pe $ z = x + y $. Prin urmare, aici $ x $ și $ y $ aparțin diferitelor varietăți?

Lucrez la date din cloud de puncte care sunt adesea folosite în viziunea robotică; norii punctelor sunt zgomotoși din cauza zgomotului în achiziție și trebuie să reduc zgomotul înainte de reducerea dimensiunii. În caz contrar, voi primi o reducere incorectă a dimensiunii. Deci, care este colectorul aici și este zgomotul o parte din același colector căruia îi aparține $ x $?

Comentarii

  • Este ‘ nu este cu adevărat posibil să se utilizeze corect termenul fără a fi precis din punct de vedere matematic

Răspuns

În termeni non-tehnici, un colector este o structură geometrică continuă având dimensiuni finite: o linie, o curbă, un plan, o suprafață, o sferă, o bilă, un cilindru, un toro, o „pâlc” … ceva de genul acesta: introduceți descrierea imaginii aici

Este un termen generic folosit de matematicienii să spună „o curbă” (dimensiunea 1) sau „suprafață” (dimensiunea 2) sau un obiect 3D (dimensiunea 3) … pentru orice dimensiune finită posibilă $ n $. O varietate unidimensională este pur și simplu o curbă (linie, cerc …). Un colector bidimensional este pur și simplu o suprafață (plan, sferă, tor, cilindru …). O varietate tridimensională este un „obiect complet” (bilă, cub complet, spațiul 3D din jurul nostru …).

O varietate este adesea descrisă printr-o ecuație: setul de puncte $ (x, y) $ cum ar fi $ x ^ 2 + y ^ 2 = 1 $ este o varietate unidimensională (un cerc).

O varietate are aceeași dimensiune peste tot. De exemplu, dacă adăugați o linie (dimensiunea 1) la o sferă (dimensiunea 2), atunci structura geometrică rezultată nu este o varietate.

Spre deosebire de noțiunile mai generale de spațiu metric sau spațiu topologic, de asemenea, destinate să descrie intuiția noastră naturală a unui set continuu de puncte, o varietate se intenționează a fi ceva local simplu: ca un spațiu vectorial cu dimensiune finită: \ mathbb {R} ^ n $. Acest lucru exclude spațiile abstracte (cum ar fi spațiile cu dimensiuni infinite) care deseori nu reușesc să aibă o semnificație concretă geometrică.

Spre deosebire de un spațiu vector, varietățile pot avea diferite forme. Unele varietăți pot fi vizualizate cu ușurință (sferă, minge …), unele sunt dificil de vizualizat, cum ar fi sticla Klein sau plan proiectiv real .

În statistici, învățare automată sau matematică aplicată, în general, cuvântul „colector” este adesea folosit pentru a spune „ca un sub spațiu liniar”, dar posibil curbat . De fiecare dată când scrieți o ecuație liniară cum ar fi: $ 3x + 2y-4z = 1 $ veți obține un sub-spațiu liniar (afinat) (aici un plan). De obicei, atunci când ecuația este neliniară ca $ x ^ 2 + 2y ^ 2 + 3z ^ 2 = 7 $, acesta este o varietate (aici o sferă întinsă).

De exemplu, „ ipoteza colectorului „al ML spune că” datele cu dimensiuni ridicate sunt puncte într-un colector cu dimensiuni reduse, cu zgomot dimensional ridicat adăugat „. Vă puteți imagina punctele unui cerc 1D cu ceva zgomot 2D adăugat. În timp ce punctele nu sunt exact pe cerc, ele satisfac statistic ecuația $ x ^ 2 + y ^ 2 = 1 $. Cercul este varietatea de bază: https://i.stack.imgur.com/iEm2m.png

Comentarii

  • @RiaGeorge În imagine, suprafața este o varietate. ‘ este continuu, deoarece vă puteți deplasa liber în jurul său fără întrerupere și nu trebuie să sari niciodată de pe suprafață pentru a ajunge între oricare două locuri. Găurile la care faceți aluzie sunt importante pentru a descrie cum vă puteți deplasa la suprafață între oricare două puncte în cel mai simplu mod, iar numărarea acestora este o tehnică importantă în studierea varietăților.
  • Explicarea a ceea ce este topologia ar fi o întrebare mult mai largă pentru acest site și puțin dezactivată. Aș căuta schimbul de matematică pentru informații despre asta. Manifoldurile și topologia nu sunt sinonime: varietățile sunt obiecte matematice studiate cu tehnicile topologiei, topologia este un sub-subiect al matematicii.
  • Aceasta pare o explicație foarte bună pentru cineva care învață despre concept pentru prima timp, cu exemple bine alese, concrete. (Nu ‘ știu cu siguranță, deși am mai întâlnit conceptul.) Ca o minusculă minte, aș recomanda reformularea ultimei propoziții pentru a fi mai puțin absolută (” Ori de câte ori ecuația este neliniară ca …”): așa cum este scris chiar acum, nu este de fapt adevărat. În afară de acea discuție minoră, găsesc acest lucru foarte bine scris.
  • Răspunsul ratează toate punctele fundamentale care fac ca o varietate să fie astfel, nu ‘ cum are atât de multe voturi pozitive. Topologia, diagramele și netezimea nici măcar nu sunt menționate, iar răspunsul oferă practic impresia că o varietate este o suprafață, care nu este nu .
  • Punct tehnic, setul de soluții al unui sistemul de ecuații nu trebuie să fie o varietate. ‘ este o varietate, deci ‘ este în mare parte o varietate, dar poate avea puncte de auto-intersecție în care proprietatea varietății eșuează.

Răspuns

Un colector (topologic) este un spațiu $ M $ care este:

(1) „local” „echivalent” cu $ \ mathbb {R} ^ n $ pentru aproximativ $ n $.

„Local”, „echivalența” poate fi exprimată prin funcțiile de coordonate $ n $, $ c_i: M \ to \ mathbb {R} $, care formează împreună o funcție de „păstrare a structurii”, $ c: M \ to \ mathbb {R} ^ n $, numită diagramă .

(2) poate fi realizată într-un mod „păstrare structură” ca subset de $ \ mathbb {R} ^ N $ pentru ceva $ N \ ge n $. (1) (2)

Rețineți că, pentru a faceți „structura” precisă aici, trebuie să înțelegeți noțiunile de bază ale topologie ( def. ), care permite să creați noțiuni precise despre comportamentul „local” și, prin urmare, „local” de mai sus. Când spun „echivalent”, mă refer la o structură topologică echivalentă ( homeomorfă ) și când spun „păstrarea structurii” mă refer la același lucru (creează un echivalent structură topologică).

Rețineți, de asemenea, că, pentru a face calcul pe colectoare , este nevoie de o condiție suplimentară care nu urmează din mai sus de două condiții, care, practic, spune ceva de genul „diagramele sunt suficient de bine comportate încât să ne permită să facem calculul”. Acestea sunt varietățile cele mai des utilizate în practică. colectoare , pe lângă calcul, permit și triangulații , care este foarte important în aplicații precum al tău care implică date despre cloud de puncte .

Rețineți că nu toți oamenii folosesc aceeași definiție pentru o varietate (topologică). Mai mulți autori o vor defini ca satisfăcătoare doar condiție (1) abo ve, nu neapărat și (2). Cu toate acestea, definiția care satisface atât (1) cât și (2) se comportă mult mai bine, prin urmare este mai utilă pentru practicieni. S-ar putea aștepta intuitiv că (1) implică (2), dar de fapt nu „t.

EDIT: Dacă sunteți interesat să aflați ce este exact o „topologie”, cel mai important exemplu de topologie de înțeles este topologia euclidiană de $ \ mathbb {R} ^ n $. Acest lucru va fi analizat în detaliu în orice carte introductivă (bună) despre „analiză reală” .

Comentarii

  • Vă mulțumim pentru răspunsul dvs.: Puteți explica, de asemenea, ce este o topologie și în termenul non-tehnic? Este termenul topologie și varietate folosit alternativ? dimensiunea trebuie să fie un număr întreg? Ce este un număr real, atunci cred că structura este cunoscută sub numele de fractali dacă întreaga structură este compusă din fiecare sub-parte se repetă de la sine.
  • @RiaGeorge $ n $ reprezintă un număr natural (întreg $ \ ge 1 $), la fel ca $ N $. S-ar putea să existe o teorie mai avansată pentru fracțional / r dimensiuni valoroase, dar nu ‘ nu apar la fel de des. ” Topologie ” și ” colector ” înseamnă două lucruri foarte distincte, deci nu sunt termeni interschimbabili. Un ” colector ” are o ” topologie „. Câmpul Topologiei studiază spații care au ” topologii „, care sunt colecții de seturi care îndeplinesc trei reguli / condiții. Un obiectiv al studierii ” topologiilor ” este de a descrie într-un mod consecvent și reproductibil noțiunile de ” local ” comportament.
  • @RiaGeorge Axiomele pentru o ” topologie ” poate fi găsit pe pagina Wikipedia: en.wikipedia.org / wiki / General_topology # A_topology_on_a_set – rețineți, de asemenea, că link-ul pe care vi l-am dat pentru definiția (echivalentă) a ” topologie ” în ceea ce privește vecinătatea a indicat ceva legat, dar nu același lucru, mi-am editat răspunsul pentru a reflecta acest lucru: en.wikipedia.org/wiki/… Rețineți totuși că definiția în termeni de cartiere este mai dificil de înțeles (îmi imaginez că aș putea să o înțeleg bine, dar nu ‘ t deranjez și eu, pentru că ‘ sunt leneș
  • așa că oricum ‘ este părerea mea personală părtinitoare că nu ‘ nu trebuie să cunoașteți definiția topologiei de vecinătate – știți doar că definiția mai simplă vă oferă aceeași putere a definiției vecinătății în ceea ce privește descrierea rigurosă a comportamentului local, deoarece acestea echivalent). Oricum, dacă sunteți interesat de fractali, poate veți găsi aceste pagini Wikipedia interesante – nu vă pot ‘ să vă ajut cu asta mai mult, pentru că nu sunt profund familiarizat cu teoria și nu ‘ nu știu sau nu înțeleg majoritatea definițiilor – am auzit doar de unele dintre
  • Acesta este singurul răspuns de până acum care acordă atenție la ideea matematică modernă de asamblare a unui obiect global din date locale. Din păcate, nu ‘ ajunge la nivelul de simplitate și claritate cerut de un ” non-tehnic ” cont.

Răspuns

În acest context, termenul colector este corect, dar este inutil de bogat în folin. Din punct de vedere tehnic, o varietate este orice spațiu (set de puncte cu topologie) suficient de neted și continuu (într-un mod care poate, cu un efort, să fie făcut matematic bine definit).

Imaginați-vă spațiul a tuturor valorilor posibile ale factorilor dvs. originali. După o tehnică de reducere dimensională, nu toate punctele din acel spațiu sunt atinse. În schimb, numai punctele de pe un sub-spațiu încorporat în interiorul spațiului respectiv vor fi realizabile. Acel sub-spațiu încorporat se întâmplă să îndeplinească definiția matematică a unei varietăți. Pentru o tehnică de reducere dimensională liniară, cum ar fi PCA, acel sub-spațiu este doar un sub-spațiu liniar (de exemplu, un hiper-plan), care este o varietate relativ banală. Dar pentru tehnica de reducere dimensională neliniară, acel sub-spațiu ar putea fi mai complicat (de exemplu, o suprafață curbată). În scopuri de analiză a datelor, înțelegerea faptului că acestea sunt sub-spații este mult mai importantă decât orice deducție pe care ați trage-o din faptul că știu că îndeplinesc definiția colectorului.

Comentarii

  • ” Highfalutin ” … am învățat astăzi un cuvânt nou!
  • Matematic , o varietate este orice spațiu topologic local continuu. Îmi place ideea de a încerca să explic lucrurile într-un limbaj simplu, dar această caracterizare nu funcționează cu adevărat ‘. În primul rând, continuitatea este întotdeauna o proprietate locală, așa că nu ‘ nu sunt sigur ce înțelegeți prin continuu local. De asemenea, definiția dvs. nu reușește să excludă o mulțime de lucruri care nu sunt ‘ t multiple, cum ar fi linia numărului rațional sau unirea a două linii care se intersectează în planul euclidian.
  • Sunt de acord cu Ben, tehnic ‘ s ” local euclidian „. Nu ‘ nu sunt sigur că există o modalitate bună de a rezolva acest lucru până la simpla engleză.
  • De asemenea, trebuie să fiu de acord cu cele două comentarii de mai sus. De fapt, răspunsul pe care l-am scris mai jos a fost inițial menit să fie un comentariu clarificator la acest răspuns care a devenit prea lung. Nu există o noțiune precisă de spațiu topologic ” continuu ” (vezi aici: math.stackexchange.com/questions/1822769/… ). În opinia mea, definirea multitudinilor în termeni de concepte inexistente este, pe termen lung, mai confuză decât clarificatoare. Cel puțin aș sugera înlocuirea cuvântului ” matematic ” din prima propoziție cu altceva.
  • Voi ‘ voi folosi acest comentariu ca o oportunitate de a pune o mică întrebare … Am (cred) că am avut ideea de multiple, dar de ce este ” local ” necesar? Nu este ‘ t un spațiu ” local ” continuu … continuu ca întreg?

Răspuns

Așa cum Bronstein și alții l-au pus în Geometric deep learning: merge dincolo de datele euclide ( Citiți articolul aici )

Aproximativ, un colector este un spațiu care este local euclidian. Unul dintre cele mai simple exemple este o suprafață sferică care modelează planeta noastră: în jurul unui punct, pare a fi plană, ceea ce a determinat generații de oameni să creadă în planul Pământului. Vorbind formal, o varietate X (diferențiată) D-dimensională este un spațiu topologic în care fiecare punct x are un vecinătate care este echivalent topologic (homeomorf) cu un spațiu euclidian d-dimensional, numit spațiu tangent. = „ca8b50dedd”>

Comentarii

  • Cota este contradictorie. La început descrie o varietate riemanniană (” local euclidiană „), dar la sfârșit descrie o varietate topologică (homeomorfismele nu, prin definiție, trebuie să respecte structura diferențială și, prin urmare, conceptul de spațiu tangent nu se aplică).

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *