V technice redukce dimenzionality, jako je analýza hlavních komponent, LDA atd., se často používá termín potrubí. Co je potrubí v netechnickém smyslu? Pokud bod $ x $ patří do sféry, jejíž dimenzi chci zmenšit, a pokud je hluk $ y $ a $ x $ a $ y $ nesouvisí, pak by skutečné body $ x $ byly od každého daleko oddělené jiné kvůli hluku. Proto by bylo zapotřebí filtrování šumu. Redukce dimenze by tedy proběhla na $ z = x + y $. Proto zde $ x $ a $ y $ patří do různých potrubí?
Pracuji na datech mračen bodů, která se často používají v robotickém vidění; mračna bodů jsou hlučná kvůli šumu v akvizici a musím snížit šum před redukcí dimenze. Jinak dostanu nesprávné zmenšení rozměrů. Jaké je zde potrubí a je hluk součástí stejného potrubí, do kterého $ x $ patří?
Komentáře
- It ‚ není skutečně možné použít tento výraz správně, aniž by byl matematicky přesný
odpověď
Z netechnického hlediska je rozdělovač spojitá geometrická struktura mající konečný rozměr: úsečka, křivka, rovina, povrch, koule, koule, válec, torus, „blob“ … něco jako toto:
Je to obecný termín používaný matematici říkají „křivka“ (dimenze 1) nebo „povrch“ (dimenze 2) nebo 3D objekt (dimenze 3) … pro jakoukoli možnou konečnou dimenzi $ n $. Jednorozměrný potrubí je jednoduše křivka (přímka, kružnice …). Dvourozměrný potrubí je jednoduše povrch (rovina, koule, torus, válec …). Trojrozměrný potrubí je „plný objekt“ (koule, plná kostka, 3D prostor kolem nás …).
Rozdělovač je často popsán rovnicí: množina bodů $ (x, y) $ jako $ x ^ 2 + y ^ 2 = 1 $ je jednorozměrný rozdělovač (kruh).
Rozdělovač má všude stejnou dimenzi. Například pokud připojíte čáru (kóta 1) ke kouli (kóta 2), pak výsledná geometrická struktura není potrubí.
Na rozdíl od obecnějších pojmů metrického prostoru nebo topologického prostoru, jejichž cílem je také popsat naši přirozenou intuici spojité množiny bodů, je potrubí určeno jako něco lokálně jednoduchého: jako vektorový prostor konečné dimenze: $ \ mathbb {R} ^ n $. Toto vylučuje abstraktní prostory (jako nekonečné dimenzionální prostory), které často nemají konkrétní geometrický význam.
Na rozdíl od vektorového prostoru mohou mít různá potrubí různé tvary. Některá potrubí lze snadno vizualizovat (koule, koule …), některá se zobrazují obtížně, například Kleinova láhev nebo skutečná projektivní rovina .
Ve statistikách, strojovém učení nebo obecně v aplikované matematice se slovo „manifold“ často používá k označení „jako lineární podprostor“, ale může být zakřivené . Kdykoli píšete lineární rovnici jako: $ 3x + 2y-4z = 1 $, získáte lineární (afinní) podprostor (zde rovina). Obvykle, když rovnice není lineární jako $ x ^ 2 + 2y ^ 2 + 3z ^ 2 = 7 $, jedná se o varietu (zde roztažená koule).
Například „ hypotéza potrubí „ML říká“ vysoko dimenzionální data jsou body v nízkodimenzionálním potrubí s přidaným vysoko dimenzionálním šumem „. Můžete si představit body 1D kruhu s přidaným 2D šumem. Zatímco body nejsou přesně na kružnici, statisticky uspokojují rovnici $ x ^ 2 + y ^ 2 = 1 $. Kruh je základním potrubím:
Komentáře
- @RiaGeorge Na obrázku je to povrch , který je varietou. Je to ‚ nepřetržité, protože se po něm můžete volně pohybovat bez přerušení a nikdy nemusíte skákat z povrchu, abyste se dostali mezi dvě místa. Díry, na které narážíte, jsou důležité při popisu toho, jak můžete nejjednodušším způsobem obejít povrch mezi libovolnými dvěma body, a jejich počítání je důležitou technikou při studiu variet.
- Vysvětlení, co je topologie, by bylo pro tento web příliš širokou otázkou a trochu mimo téma. Prohledal bych výměnu matematických zásobníků o tom. Rozdělovače a topologie nejsou synonyma: rozdělovače jsou matematické objekty studované technikami topologie, topologie je dílčím předmětem matematiky.
- Zdá se to jako velmi dobré vysvětlení, když se někdo dozví o konceptu prvního čas, s dobře zvolenými konkrétními příklady. (I když ‚ nevím jistě, protože jsem se s tímto konceptem setkal už dříve.) Jako menší dohad bych doporučil přeformulovat poslední větu tak, aby byla méně absolutní (“ Kdykoli je rovnice nelineární jako …“): jak je právě napsáno, není to ve skutečnosti pravda. Kromě toho drobného hajzlu mi připadá velmi dobře napsaný.
- Odpověď postrádá všechny základní body, díky nimž je rozmanitý, nedostávám ‚ jak to má tolik hlasů. Topologie, grafy a plynulost nejsou ani zmíněny a odpověď v zásadě vyvolává dojem, že potrubí je povrch, který není .
- Technický bod, sada řešení soustava rovnic nemusí být rozmanitá. Je to ‚ sa odrůda, takže ‚ je to většinou varieté, ale může mít body vlastního průniku, kde selže vlastnost variet.
Odpověď
(Topologická) varieta je prostor $ M $, což je:
(1) „místně“ „ekvivalent“ k $ \ mathbb {R} ^ n $ za některé $ n $.
„Lokálně“ lze „ekvivalenci“ vyjádřit pomocí $ n $ souřadnicových funkcí, $ c_i: M \ to \ mathbb {R} $, které společně tvoří funkci „zachování struktury“, $ c: M \ to \ mathbb {R} ^ n $, nazývané graf .
(2) lze realizovat způsobem zachovávajícím strukturu jako podmnožinu $ \ mathbb {R} ^ N $ za některé $ N \ ge n $. (1) (2)
Upozorňujeme, že zde upřesnit „strukturu“, je třeba porozumět základním pojmům topologie ( def. ), který umožňuje přesně si představit chování „local“ , a tedy „místně“ výše. Když řeknu „ekvivalent“, mám na mysli ekvivalentní topologickou strukturu ( homeomorphic ), a když řeknu „zachování struktury“, mám na mysli totéž (vytvoří ekvivalent topologická struktura).
Všimněte si také, že pro provedení počtu na varietách potřebujete další podmínku, která nevyplývá z nad dvěma podmínkami, které v zásadě říkají něco jako „grafy se chovají dostatečně dobře, aby nám umožňovaly provádět počet“. Toto jsou různá potrubí, která se v praxi nejčastěji používají. Na rozdíl od obecné topologické různá potrubí , kromě počtu také umožňují triangulace , což je velmi důležité v aplikacích jako vaše zahrnující data mračen bodů .
Všimněte si, že ne všichni lidé používají stejnou definici pro (topologické) potrubí. Několik autorů to definuje jako splňující pouze podmínku (1) abo ve, ne nutně také (2). Definice, která splňuje podmínky (1) i (2), se však chová mnohem lépe, a proto je pro odborníky užitečnější. Dá se intuitivně očekávat, že (1) implikuje (2), ale ve skutečnosti tomu tak není.
EDIT: Pokud máte zájem dozvědět se, co přesně je „topologie“, nejdůležitějším příkladem topologie, kterou musíte pochopit, je euklidovská topologie z $ \ mathbb {R} ^ n $. Tomu se podrobně věnujeme v jakékoli (dobré) úvodní knize o „skutečné analýze“ .
Komentáře
- Děkuji za odpověď: Můžete mi prosím vysvětlit, co je topologie také v netechnickém smyslu? Používá se pojem topologie a rozmanité termíny zaměnitelně? dimenze musí být celé číslo? Co je to skutečné číslo, pak si myslím, že struktura je známá jako fraktály, pokud se celá struktura skládá z každé podčásti, která se opakuje.
- @RiaGeorge $ n $ znamená přirozené číslo (celé číslo $ \ ge 1 $), stejně jako $ N $. Pro zlomek / r může existovat pokročilejší teorie dimenze s hodnotou eál, ale ‚ se neobjevuje tak často. “ Topologie “ a “ manifold “ znamenají dvě velmi odlišné věci, takže nejde o zaměnitelné výrazy. “ manifold “ má “ topologii „. Pole topologie studuje prostory, které mají “ topologie „, což jsou kolekce sad splňujících tři pravidla / podmínky. Jedním cílem studia “ topologií “ je popsat důsledně a reprodukovatelně pojmy “ local “ chování.
- @RiaGeorge Axiomy pro “ topologii “ najdete na stránce Wikipedie: en.wikipedia.org / wiki / General_topology # A_topology_on_a_set – všimněte si také, že odkaz, který jsem vám dal pro (ekvivalentní) definici “ topologie “ z hlediska sousedství poukázal na něco souvisejícího, ale ne stejného, upravil jsem svou odpověď tak, aby odrážela toto: en.wikipedia.org/wiki/… Všimněte si však, že definici pojmu sousedství je obtížnější pochopit (domnívám se, že bych tomu mohl dobře rozumět, ale ne ‚ t také se obtěžuj, protože jsem ‚ m líný
- tak každopádně ‚ je můj osobní zaujatý názor, že ne div id = „bb94ea00c8“>
nepotřebujete znát definici sousedství topologie – stačí vědět, že jednodušší definice vám dává stejnou sílu definice sousedství, pokud jde o důsledný popis místního chování, protože jsou ekvivalent). Každopádně, pokud vás zajímají fraktály, možná vás tyto stránky Wikipedie zaujmou – s tím vám ale ‚ nemohu pomoci, protože nejsem hluboce obeznámen s teorie a ‚ neznám nebo nerozumím většině definic – slyšel jsem pouze o některých
Odpověď
V této souvislosti je termín manifold přesný, ale je zbytečně highfalutin. Po technické stránce je potrubí jakýkoli prostor (množina bodů s topologií), který je dostatečně plynulý a spojitý (způsobem, který lze s určitým úsilím učinit matematicky dobře definovaným).
Představte si prostor všech možných hodnot vašich původních faktorů. Po technice dimenzionální redukce nelze dosáhnout všech bodů v tomto prostoru. Místo toho budou dosažitelné pouze body na nějakém vloženém subprostoru uvnitř tohoto prostoru. Že vložený subprostor splňuje matematickou definici potrubí. Pro techniku lineární dimenzionální redukce, jako je PCA, je tento subprostor pouze lineárním subprostorem (např. Hyperrovina), což je relativně triviální rozmanitost. Ale pro techniku nelineární dimenzionální redukce může být tento subprostor komplikovanější (např. Zakřivený hyperplocha). Pro účely analýzy dat je pochopení toho, že se jedná o meziprostory, mnohem důležitější než jakýkoli závěr, který byste čerpali z vědomí, že splňují definici potrubí.
Komentáře
- “ Highfalutin “ … dnes se naučil nové slovo!
- Matematicky , manifold je jakýkoli lokálně spojitý topologický prostor. Líbí se mi myšlenka pokusu vysvětlit věci prostým jazykem, ale tato charakteristika opravdu nefunguje ‚ t. Nejprve je kontinuita vždy místní vlastností, takže si ‚ nejsem jistý, co myslíte lokálně spojitým. Vaše definice také nevylučuje mnoho věcí, které nejsou ‚ t rozmanité, jako je racionální číselná řada nebo spojení dvou protínajících se čar v euklidovské rovině.
- souhlasím s Benem, technicky ‚ s “ místně euklidovský „. ‚ Nejsem si jistý, že existuje dobrý způsob, jak to převést na jednoduchou angličtinu.
- Také musím rozhodně souhlasit s výše uvedenými dvěma komentáři. Ve skutečnosti odpověď, kterou jsem napsal níže, měla původně sloužit jako objasňující komentář k této odpovědi, který se stal příliš dlouhý. Neexistuje přesná představa o “ spojitém “ topologickém prostoru (viz zde: math.stackexchange.com/questions/1822769/… ). Definování potrubí z hlediska neexistujících konceptů je podle mého názoru z dlouhodobého hlediska spíše matoucí než objasňující. Přinejmenším bych navrhl nahradit slovo “ matematicky “ v první větě něčím jiným.
- Já ‚ tento komentář použiji jako příležitost položit malou otázku … Já (myslím) jsem dostal představu o varietách, ale proč je to “ místně “ potřebujete? Není ‚ t prostor “ lokálně “ kontinuální … kontinuální jako celek?
Odpověď
Jak uvedl Bronstein a další v Geometrickém hlubokém učení: jít nad rámec euklidovských dat ( Přečtěte si článek zde )
Zhruba, manifold je prostor, který je místně euklidovský. Jedním z nejjednodušších příkladů je sférický povrchový model naší planety: kolem bodu se zdá být rovinný, což vedlo generace lidí k víře v plochost Země. Formálně vzato, (diferencovatelný) d-dimenzionální variet X je topologický prostor, kde každý bod x má sousedství, které je topologicky ekvivalentní (homeomorfní) s d-dimenzionálním euklidovským prostorem, který se nazývá tečna.
= „ca8b50dedd“>
Komentáře
- Citace je protichůdná. Na začátku popisuje riemannovské potrubí (“ místně euklidovské „), ale na konci popisuje topologické potrubí (homeomorfismy ne, podle definice musí respektovat diferenciální strukturu, a proto koncept tečného prostoru neplatí).