Co to jest rozmaitość?

W technikach redukcji wymiarowości, takich jak analiza głównych składowych, LDA itp., często używa się terminu rozmaitość. Co to jest kolektor w terminach nietechnicznych? Jeśli punkt $ x $ należy do sfery, której wymiar chcę zmniejszyć, i jeśli występuje szum $ y $, $ x $ i $ y $ są nieskorelowane, to rzeczywiste punkty $ x $ byłyby daleko oddzielone od każdego inne z powodu hałasu. Dlatego wymagane byłoby filtrowanie szumów. Zatem redukcja wymiaru zostanie przeprowadzona na $ z = x + y $. Zatem czy tutaj $ x $ i $ y $ należą do różnych rozmaitości?

Pracuję na danych chmury punktów, które są często używane w wizji robotów; chmury punktów są zaszumione z powodu szumu podczas akwizycji i przed redukcją wymiarów muszę zredukować hałas. W przeciwnym razie otrzymam nieprawidłowe zmniejszenie wymiarów. Czym więc jest ta rozmaitość i czy szum jest częścią tej samej rozmaitości, do której należy $ x $?

Komentarze

  • It ' nie można poprawnie użyć tego terminu bez dokładności matematycznej

Odpowiedź

W terminologii nietechnicznej rozmaitość to ciągła struktura geometryczna o skończonych wymiarach: linia, krzywa, płaszczyzna, powierzchnia, kula, kula, cylinder, torus, „kropelka” … coś takiego: tutaj wprowadź opis obrazu

Jest to termin ogólny używany przez matematycy, aby powiedzieć „krzywa” (wymiar 1) lub „powierzchnia” (wymiar 2) lub obiekt 3D (wymiar 3)… dla dowolnego skończonego wymiaru $ n $. Jednowymiarowa rozmaitość to po prostu krzywa (linia, okrąg …). Dwuwymiarowa kolektor to po prostu powierzchnia (płaszczyzna, kula, torus, cylinder…). Trójwymiarowa rozmaitość to „pełny obiekt” (kula, pełny sześcian, przestrzeń 3D wokół nas…).

Rozmaitość jest często opisywana równaniem: zbiór punktów $ (x, y) $ taki jak $ x ^ 2 + y ^ 2 = 1 $ to jednowymiarowa rozmaitość (okrąg).

Różnorodność ma wszędzie ten sam wymiar. Na przykład, jeśli dodasz linię (wymiar 1) do kuli (wymiar 2), to wynikowa struktura geometryczna nie jest rozmaitością.

W przeciwieństwie do bardziej ogólnych pojęć przestrzeni metrycznej lub przestrzeni topologicznej, które również mają na celu opisanie naszej naturalnej intuicji ciągłego zbioru punktów, rozmaitość ma być czymś lokalnie prostym: jak przestrzeń wektorowa o skończonych wymiarach: $ \ mathbb {R} ^ n $. Wyklucza to abstrakcyjne przestrzenie (takie jak nieskończone przestrzenie wymiarowe), które często nie mają geometrycznego konkretnego znaczenia.

W przeciwieństwie do przestrzeni wektorowej, rozmaitości mogą mieć różne kształty. Niektóre kolektory można łatwo zwizualizować (kula, kula …), inne są trudne do wizualizacji, np. butelka Kleina lub prawdziwa płaszczyzna rzutowa .

W statystyce, uczeniu maszynowym lub ogólnie w matematyce stosowanej słowo „rozmaitość” jest często używane na określenie „jak podprzestrzeń liniowa”, ale prawdopodobnie zakrzywiona . Za każdym razem, gdy piszesz równanie liniowe, takie jak: $ 3x + 2y-4z = 1 $, otrzymujesz liniową (afiniczną) podprzestrzeń (tutaj płaszczyznę). Zwykle, gdy równanie jest nieliniowe, np. $ X ^ 2 + 2y ^ 2 + 3z ^ 2 = 7 $, to jest to rozmaitość (tutaj rozciągnięta kula).

Na przykład „ wielowymiarowa hipoteza „ML mówi:” dane wysokowymiarowe to punkty w niskowymiarowej rozmaitości z dodanym dużym szumem wymiarowym „. Możesz sobie wyobrazić punkty koła 1D z dodatkiem szumu 2D. Chociaż punkty nie znajdują się dokładnie na okręgu, statystycznie spełniają równanie $ x ^ 2 + y ^ 2 = 1 $. Krąg to podstawowa rozmaitość: https://i.stack.imgur.com/iEm2m.png

Komentarze

  • @RiaGeorge Na zdjęciu jest to powierzchnia , która jest rozmaitością. Jest ' ciągły, ponieważ można go swobodnie poruszać bez przerywania i nigdy nie trzeba wyskakiwać z powierzchni, aby dostać się między dwoma dowolnymi miejscami. Dziury, o których wspominasz, są ważne w opisywaniu jak możesz poruszać się po powierzchni między dowolnymi dwoma punktami w najprostszy sposób, a ich liczenie jest ważną techniką badania rozmaitości.
  • Wyjaśnienie, czym jest topologia, byłoby zdecydowanie zbyt szerokim pytaniem dla tej witryny i trochę nie na temat. Przeszukałbym stos matematyczny w poszukiwaniu informacji na ten temat. Rozmaitości i topologia nie są synonimami: rozmaitości są obiektami matematycznymi badanymi technikami topologii, topologia jest podtematem matematyki.
  • Wydaje się, że jest to bardzo dobre wyjaśnienie dla kogoś, kto poznaje pojęcie po raz pierwszy czas, z dobrze dobranymi, konkretnymi przykładami. (Nie ' nie wiem jednak na pewno, ponieważ spotkałem się z tą koncepcją wcześniej). Jako drobny spór, zaleciłbym przeformułowanie ostatniego zdania, aby było mniej bezwzględne (” Za każdym razem, gdy równanie jest nieliniowe, np. …”): tak jak jest teraz napisane, tak naprawdę nie jest prawdą. Oprócz tego drobnego sporu uważam, że to bardzo dobrze napisane.
  • W odpowiedzi pomijamy wszystkie podstawowe punkty, które sprawiają, że różnorodność jest taka, nie ' nie rozumiem jak ma tak wiele głosów poparcia. Nie ma nawet wzmianki o topologii, wykresach i gładkości, a odpowiedź w zasadzie sprawia wrażenie, że rozmaitość jest powierzchnią, której nie .
  • Punkt techniczny, zbiór rozwiązań układ równań nie musi być rozmaitością. Jest to ' różnorodność, więc ' jest głównie rozmaitością, ale może mieć punkty przecięcia siebie, w których właściwość rozmaitości zawodzi.

Odpowiedź

Rozmaitość (topologiczna) to przestrzeń $ M $, która jest następująca:

(1) „lokalnie” „odpowiednik” $ \ mathbb {R} ^ n $ dla jakiegoś $ n $.

„Lokalnie”, „równoważność” można wyrazić za pomocą funkcji współrzędnych $ n $, $ c_i: M \ do \ mathbb {R} $, które razem tworzą funkcję „zachowującą strukturę”, $ c: M \ to \ mathbb {R} ^ n $, zwany wykresem .

(2) można zrealizować w sposób „zachowujący strukturę” jako podzbiór $ \ mathbb {R} ^ N $ dla jakiegoś $ N \ ge n $. (1) (2)

Pamiętaj, że aby doprecyzować tutaj „strukturę”, trzeba zrozumieć podstawowe pojęcia topologii ( def. ), co pozwala precyzyjnie określić zachowanie „lokalne” , a tym samym „lokalnie” powyżej. Kiedy mówię „równoważna”, mam na myśli równoważną strukturę topologiczną ( homeomorficzna ), a kiedy mówię „zachowująca strukturę”, mam na myśli to samo (tworzy odpowiednik struktura topologiczna).

Zauważ również, że aby wykonywać obliczenia na rozmaitościach , potrzebny jest dodatkowy warunek, który nie wynika z powyżej dwóch warunków, co w zasadzie mówi coś w rodzaju „wykresy zachowują się na tyle dobrze, że pozwalają nam na wykonanie rachunku różniczkowego”. Są to rozmaitości najczęściej używane w praktyce. W przeciwieństwie do ogólnej topologii rozmaitości , oprócz rachunku różniczkowego, umożliwiają także triangulacje , co jest bardzo ważne w zastosowaniach takich jak Twój, obejmujący dane chmury punktów .

Zauważ, że nie wszyscy używają tej samej definicji dla rozmaitości (topologicznej). Kilku autorów zdefiniuje ją jako spełniający jedynie warunek (1) abo ve, niekoniecznie również (2). Jednak definicja, która spełnia zarówno (1), jak i (2), zachowuje się znacznie lepiej, a zatem jest bardziej przydatna dla praktyków. Można by się intuicyjnie spodziewać, że (1) implikuje (2), ale tak naprawdę nie „t.

EDYCJA: Jeśli chcesz dowiedzieć się, czym dokładnie jest „topologia”, najważniejszym przykładem topologii do zrozumienia jest topologia euklidesowa $ \ mathbb {R} ^ n $. Zostanie to szczegółowo omówione w każdej (dobrej) książce wprowadzającej o „rzeczywistej analizie” .

Komentarze

  • Dziękuję za odpowiedź: Czy możesz wyjaśnić, czym jest topologia również w terminach nietechnicznych? Czy termin topologia i rozmaitość są używane zamiennie? wymiar musi być liczbą całkowitą? Co to jest liczba rzeczywista, to myślę, że struktura jest nazywana fraktalami, jeśli cała struktura składa się z każdej części, która się powtarza.
  • @RiaGeorge $ n $ oznacza liczbę naturalną (liczba całkowita $ \ ge 1 $), podobnie jak $ N $. Może istnieć bardziej zaawansowana teoria na temat ułamka / r wymiarów eal, ale nie ' nie pojawiają się tak często. ” Topologia ” i ” rozdzielacz ” oznaczają dwie bardzo różne rzeczy, więc nie są to terminy zamienne. ” rozdzielacz ” ma ” topologię „. Dziedzina badań topologii ma ” topologie „, które są zbiorami zbiorów spełniających trzy reguły / warunki. Jednym z celów studiowania ” topologii ” jest opisanie w spójny i odtwarzalny sposób pojęć ” lokalne ” zachowanie.
  • @RiaGeorge Aksjomaty dla ” topologii ” można znaleźć na stronie Wikipedii: en.wikipedia.org / wiki / General_topology # A_topology_on_a_set – zwróć również uwagę, że link, który podałem dla (równoważnej) definicji ” topologii ” pod względem sąsiedztwa wskazywał na coś związanego, ale nie to samo, poprawiłem odpowiedź, aby to odzwierciedlić: en.wikipedia.org/wiki/… Zwróć jednak uwagę, że definicja dotycząca okolic jest trudniejsza do zrozumienia (wyobrażam sobie, że mogłem to dobrze zrozumieć, ale nie ' t też przeszkadzam, ponieważ ' jestem leniwy
  • , więc w każdym razie ' to moja osobista, stronnicza opinia, że nie ' t trzeba znać definicję sąsiedztwa topologii – po prostu wiedz, że prostsza definicja daje ci taką samą moc definicji sąsiedztwa w zakresie rygorystycznego opisywania lokalnych zachowań, ponieważ są one równowartość). W każdym razie, jeśli interesują Cię fraktale, może zainteresują Cię te strony Wikipedii – nie mogę jednak ' w tym pomóc, ponieważ nie jestem dogłębnie zaznajomiony z teoria i nie ' nie znam lub nie rozumiem większości definicji – słyszałem tylko o niektórych
  • To jedyna jak dotąd odpowiedź, która zwraca uwagę do współczesnej matematycznej idei składania globalnego obiektu z lokalnych danych. Niestety, nie ' nie osiąga poziomu prostoty i przejrzystości wymaganego od ” nietechnicznych ” konto.

Odpowiedź

W tym kontekście termin rozmaitość jest dokładny, ale jest niepotrzebnie highfalutin. Z technicznego punktu widzenia rozmaitość to dowolna przestrzeń (zbiór punktów z topologią), która jest wystarczająco gładka i ciągła (w sposób, który można przy pewnym wysiłku uczynić dobrze zdefiniowanym matematycznie).

Wyobraź sobie przestrzeń wszystkich możliwych wartości oryginalnych czynników. Po zastosowaniu techniki redukcji wymiarów nie wszystkie punkty w tej przestrzeni są osiągalne. Zamiast tego dostępne będą tylko punkty na pewnej wbudowanej podprzestrzeni wewnątrz tej przestrzeni. Ta zagnieżdżona podprzestrzeń zdarza się spełniać matematyczną definicję rozmaitości. Dla techniki liniowej redukcji wymiarów, takiej jak PCA, ta podprzestrzeń jest po prostu liniową podprzestrzenią (np. Hiperpłaszczyzną), która jest stosunkowo trywialną rozmaitością. Ale w przypadku nieliniowej techniki redukcji wymiarów ta podprzestrzeń może być bardziej skomplikowana (np. Zakrzywiona hiperpowierzchnia). Dla celów analizy danych zrozumienie, że są to podprzestrzenie, jest o wiele ważniejsze niż jakiekolwiek wnioski, które można wyciągnąć ze świadomości, że spełniają one definicję rozmaitości.

Komentarze

  • ” Highfalutin ” … nauczyłem się dziś nowego słowa!
  • Matematycznie , rozmaitość to dowolna lokalnie ciągła przestrzeń topologiczna. Podoba mi się pomysł wyjaśniania rzeczy prostym językiem, ale ta charakterystyka naprawdę ' nie działa. Po pierwsze, ciągłość jest zawsze własnością lokalną, więc ' nie jestem pewien, co masz na myśli, mówiąc o lokalnie ciągłej. Ponadto, Twoja definicja nie pozwala wykluczyć wielu rzeczy, które nie są ' t rozmaitościami, takich jak oś liczb wymiernych lub suma dwóch przecinających się linii na płaszczyźnie euklidesowej.
  • Zgadzam się z Benem, technicznie to ' s ” lokalnie euclidean „. ' Nie jestem pewien, czy jest dobry sposób, aby sprowadzić to do prostego angielskiego.
  • Muszę również zdecydowanie zgodzić się z dwoma powyższymi komentarzami. W rzeczywistości odpowiedź, którą napisałem poniżej, miała pierwotnie być wyjaśniającym komentarzem do tej odpowiedzi, która stała się zbyt długa. Nie ma precyzyjnego pojęcia ” ciągłej ” przestrzeni topologicznej (patrz tutaj: math.stackexchange.com/questions/1822769/… ). Definiowanie rozmaitości w kategoriach nieistniejących pojęć jest moim zdaniem w dłuższej perspektywie bardziej zagmatwane niż wyjaśniające. Sugerowałbym przynajmniej zamianę słowa ” matematycznie ” w pierwszym zdaniu na coś innego.
  • ' wykorzystam ten komentarz jako okazję do zadania małego pytania … Myślę, że mam pojęcie o rozmaitościach, ale dlaczego jest ” lokalnie ” potrzebne? Czy nie ' nie jest spacją ” lokalnie ” ciągłą … ciągłą jako całość?

Odpowiedź

Jak Bronstein i inni ujęli to w Głębokie uczenie geometryczne: wykraczanie poza dane euklidesowe ( Przeczytaj artykuł tutaj )

Z grubsza kolektor to przestrzeń lokalnie euklidesowa. Jednym z najprostszych przykładów jest sferyczna powierzchnia modelująca naszą planetę: wokół punktu wydaje się być płaska, co skłoniło pokolenia ludzi do wiary w płaskość Ziemi. Formalnie rzecz biorąc, (różniczkowalna) d-wymiarowa rozmaitość X jest przestrzenią topologiczną, w której każdy punkt x ma sąsiedztwo topologicznie równoważne (homeomorficzne) d-wymiarowej przestrzeni euklidesowej, zwanej przestrzenią styczną.

Komentarze

  • Cytat jest wewnętrznie sprzeczny. Na początku opisuje rozmaitość riemannowską (” lokalnie euklidesa „), ale na końcu opisuje rozmaitość topologiczną (homeomorfizmy nie, z definicji muszą przestrzegać struktury różniczkowej i dlatego pojęcie przestrzeni stycznej nie ma zastosowania).

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *