I dimensioneringsreduktionsteknik såsom huvudkomponentanalys, LDA etc används ofta termen grenrör. Vad är en mångfald i icke-teknisk term? Om en punkt $ x $ tillhör en sfär vars dimension jag vill minska, och om det är ett ljud $ y $ och $ x $ och $ y $ är okorrelerade, skulle de faktiska poängen $ x $ vara långt åtskilda från varje annat på grund av bullret. Därför skulle brusfiltrering krävas. Så dimensionsreduktion skulle utföras på $ z = x + y $. Därför tillhör $ x $ och $ y $ olika grenrör här?
Jag arbetar med punktmolndata som ofta används i robotvision; punktmolnen är bullriga på grund av buller vid förvärv och jag måste minska bullret innan dimensionreduceringen. Annars får jag fel dimensionreduktion. Så, vad är grenröret här och är buller en del av samma grenrör som $ x $ tillhör?
Kommentarer
- Det ’ är inte riktigt möjligt att använda ordet korrekt utan att vara matematiskt exakt
Svar
I icke-tekniska termer är ett samlingsrör en kontinuerlig geometrisk struktur med ändlig dimension: en linje, en kurva, ett plan, en yta, en sfär, en boll, en cylinder, en torus, en ”blob” … något så här:
Det är en generisk term som används av matematiker att säga ”en kurva” (dimension 1) eller ”yta” (dimension 2), eller ett 3D-objekt (dimension 3) … för alla möjliga ändliga dimensioner $ n $. Ett endimensionellt grenrör är helt enkelt en kurva (linje, cirkel …). Ett tvådimensionellt grenrör är helt enkelt en yta (plan, sfär, torus, cylinder …). Ett tredimensionellt grenrör är ett ”fullt föremål” (boll, full kub, 3D-rummet runt oss …).
Ett grenrör beskrivs ofta med en ekvation: uppsättningen punkter $ (x, y) $ såsom $ x ^ 2 + y ^ 2 = 1 $ är ett endimensionellt grenrör (en cirkel).
Ett grenrör har samma dimension överallt. Om du till exempel lägger till en linje (dimension 1) till en sfär (dimension 2) är den resulterande geometriska strukturen inte ett grenrör.
Till skillnad från de mer generella föreställningarna om metriskt utrymme eller topologiskt utrymme som också är avsedda att beskriva vår naturliga intuition av en kontinuerlig uppsättning punkter, är ett grenrör avsett att vara något lokalt enkelt: som ett begränsat dimensioneringsvektorutrymme: $ \ mathbb {R} ^ n $. Detta utesluter abstrakta utrymmen (som oändliga dimensioner) som ofta inte har en geometrisk konkret betydelse.
Till skillnad från ett vektorutrymme kan grenrör ha olika former. Vissa grenrör kan enkelt visualiseras (sfär, boll …), andra är svåra att visualisera, som Klein-flaskan eller verkligt projektivt plan .
I statistik, maskininlärning eller tillämpad matematik i allmänhet används ordet ”grenrör” ofta för att säga ”som ett linjärt delutrymme” men möjligen böjt . Varje gång du skriver en linjär ekvation som: $ 3x + 2y-4z = 1 $ får du ett linjärt (affint) underområde (här ett plan). När ekvationen inte är linjär som $ x ^ 2 + 2y ^ 2 + 3z ^ 2 = 7 $ är detta vanligtvis ett grenrör (här en sträckt sfär).
Till exempel ” mångfaldshypotes ”av ML säger” högdimensionella data är punkter i ett lågdimensionellt grenrör med högdimensionellt brus adderat ”. Du kan föreställa dig punkter i en 1D-cirkel med lite 2D-brus. Även om punkterna inte exakt finns på cirkeln, uppfyller de statistiskt ekvationen $ x ^ 2 + y ^ 2 = 1 $. Cirkeln är det underliggande grenröret:
Kommentarer
- @RiaGeorge På bilden är det ytan som är ett grenrör. Det ’ är kontinuerligt eftersom du kan röra dig fritt utan avbrott och aldrig behöva hoppa av ytan för att komma mellan två platser. Hålen du hänvisar till är viktiga för att beskriva hur du kan komma runt på ytan mellan två punkter på det enklaste sättet, och att räkna dem är en viktig teknik för att studera grenrör.
- Att förklara vad topologi är skulle vara en alltför bred fråga för den här webbplatsen och lite av ämnet. Jag skulle söka i matematikstackutbytet för information om det. Grenrör och topologi är inte synonymer: grenrör är matematiska objekt som studerats med topologins tekniker, topologi är ett ämne i matematik.
- Detta verkar vara en mycket bra förklaring för någon som lär sig om konceptet för det första tid, med väl valda, konkreta exempel. (Jag vet inte ’ men eftersom jag har stött på konceptet tidigare.) Som en mindre gräl rekommenderar jag att omformulera den sista meningen för att vara mindre absolut (” När som helst är ekvationen ickelinjär som …”): som det skrivs just nu är det faktiskt inte sant. Bortsett från det mindre grälet, tycker jag att detta är väldigt välskrivet.
- Svaret saknar alla grundläggande punkter som gör en mångfald sådan, jag får inte ’ hur det har så många röster. Topologi, diagram och jämnhet nämns inte ens och svaret ger i princip intrycket att ett grenrör är en yta som det är inte .
- Teknisk punkt, lösningsuppsättningen av en system av ekvationer behöver inte vara ett mångfald. Det ’ är en variation, så det ’ är mestadels ett grenrör, men det kan ha punkter med självkorsning där fördelningsegenskapen misslyckas.
Svar
Ett (topologiskt) grenrör är ett mellanslag $ M $ som är:
(1) ”lokalt” ”motsvarande” till $ \ mathbb {R} ^ n $ för några $ n $.
”Lokalt” kan ”ekvivalensen” uttryckas via $ n $ koordinatfunktioner, $ c_i: M \ till \ mathbb {R} $, som tillsammans bildar en ”strukturbevarande” funktion, $ c: M \ till \ mathbb {R} ^ n $, kallat ett diagram .
(2) kan realiseras på ett ”strukturbevarande” sätt som en delmängd av $ \ mathbb {R} ^ N $ för vissa $ N \ ge n $. (1) (2)
Observera att för att gör ”struktur” exakt här, man måste förstå grundläggande föreställningar om topologi ( def. ), vilket gör att man kan göra exakta uppfattningar om ”lokalt” beteende, och därmed ”lokalt” ovan. När jag säger ”ekvivalent” menar jag ekvivalent topologisk struktur ( homeomorf ), och när jag säger ”strukturbevarande” menar jag samma sak (skapar en ekvivalent topologisk struktur).
Observera också att för att göra kalkyl på grenrör behöver man ett ytterligare tillstånd som inte följer från ovanför två villkor, som i princip säger något som ”diagrammen är välskötta så att vi kan göra kalkyl”. Dessa är de grenrör som oftast används i praktiken. Till skillnad från allmän topologisk grenrör , förutom kalkyl tillåter de också trianguleringar , vilket är mycket viktigt i applikationer som din som involverar punktmolndata .
Observera att inte alla använder samma definition för ett (topologiskt) grenrör. Flera författare definierar det som endast uppfyller villkor (1) abo ve, inte nödvändigtvis också (2). Men definitionen som uppfyller både (1) och (2) uppträder mycket bättre, därför mer användbar för utövare. Man kan förvänta sig intuitivt att (1) antyder (2), men det gör det faktiskt inte.
EDIT: Om du är intresserad av att lära dig vad exakt en ”topologi” är, är det viktigaste exemplet på en topologi att förstå Euklidisk topologi på $ \ mathbb {R} ^ n $. Detta kommer att behandlas djupgående i alla (bra) introduktionsböcker om ”verklig analys” .
Kommentarer
- Tack för ditt svar: Kan du snälla förklara vad en topologi är i icke-teknisk term? Används termen topologi och grenrör omväxlande? dimension måste vara ett heltal? Vad är det är ett verkligt tal, då tror jag att strukturen kallas fraktaler om hela strukturen består av varje del är självupprepande.
- @RiaGeorge $ n $ står för ett naturligt tal (heltal $ \ ge 1 $), liksom $ N $. Det kan finnas mer avancerad teori för bråkdel / r eal-värderade dimensioner, men det ’ t kommer upp så ofta. ” Topologi ” och ” grenrör ” betyder två mycket distinkta saker, så de är inte utbytbara termer. En ” grenrör ” har en ” topologi ”. Topologifältet studerar utrymmen som har ” topologier ”, som är samlingar av uppsättningar som uppfyller tre regler / villkor. Ett mål med att studera ” topologier ” är att på ett konsekvent och reproducerbart sätt beskriva föreställningar om ” lokalt ” beteende.
- @RiaGeorge Axiomerna för en ” topologi ” finns på Wikipedia-sidan: en.wikipedia.org / wiki / General_topology # A_topology_on_a_set – notera också att länken jag gav dig för (motsvarande) definition av ” topologi ” när det gäller grannskap pekade på något relaterat men inte detsamma, jag har redigerat mitt svar för att återspegla detta: sv.wikipedia.org/wiki/… Observera dock att definitionen när det gäller stadsdelar är svårare att förstå (jag antar att jag kunde förstå den väl, men jag ’ t bry dig också för att jag ’ är lat
- så ändå är det ’ min personliga partiska åsikt att du inte ’ t behöver veta grannskapsdefinitionen av topologi – bara vet att den enklare definitionen ger dig alla samma kraft i grannskapsdefinitionen när det gäller att strikt beskriva lokalt beteende, eftersom de är likvärdig). Hur som helst, om du är intresserad av fraktaler, kanske du kommer att hitta dessa Wikipedia-sidor intressanta – jag kan ’ inte hjälpa dig med det mer, för jag är inte djupt bekant med teori och vet ’ vet inte eller förstår de flesta definitionerna – jag har bara hört talas om några av
- Detta är det enda svaret hittills som uppmärksammar till den moderna matematiska idén att samla ett globalt objekt från lokal data. Tyvärr går det inte ’ t till den nivå av enkelhet och tydlighet som krävs av en ” icke-teknisk ” konto.
Svar
I detta sammanhang är termen grenrör korrekt, men är onödigt högfalutin. Tekniskt sett är ett grenrör vilket utrymme som helst (uppsättning punkter med topologi) som är tillräckligt smidigt och kontinuerligt (på ett sätt som med viss ansträngning kan göras matematiskt väldefinierat). av alla möjliga värden för dina ursprungliga faktorer. Efter en dimensionell reduktionsteknik är inte alla punkter i det utrymmet uppnåbara. Istället kan endast punkter på något inbäddat underutrymme inuti det rummet uppnås. Det inbäddade underrummet råkar uppfylla den matematiska definitionen av ett grenrör. För en linjär dimensionell reduktionsteknik som PCA är det delutrymmet bara ett linjärt delutrymme (t.ex. ett hyperplan), vilket är en relativt trivial grenrör. Men för icke-linjär dimensionell reduktionsteknik kan det delutrymmet vara mer komplicerat (t.ex. en krökt hyperyta). För dataanalysändamål är det mycket viktigare att förstå att det här är delområden än någon slutsats som man kan dra av att veta att de uppfyller definitionen av grenrör.
Kommentarer
- ” Highfalutin ” … lärde sig ett nytt ord idag!
- Matematiskt , ett samlingsrör är något lokalt kontinuerligt topologiskt utrymme. Jag gillar tanken att försöka förklara saker på vanligt språk, men den här karakteriseringen fungerar verkligen inte ’. För det första är kontinuitet alltid en lokal egendom, så jag ’ är inte säker på vad du menar med lokalt kontinuerlig. Dessutom misslyckas din definition med att utesluta många saker som inte är ’ t-grenrör, såsom den rationella talraden eller sammanslutningen av två korsande linjer i det euklidiska planet.
- Jag håller med Ben, tekniskt sett ’ s ” lokalt euklidiskt ”. Jag ’ är inte säker på att det finns ett bra sätt att koka ner det till enkel engelska.
- Jag måste också vara överens med de två kommentarerna ovan. Faktum är att svaret jag skrev nedan ursprungligen var tänkt att vara en klargörande kommentar till detta svar som blev för långt. Det finns ingen exakt uppfattning om ett ” kontinuerligt ” topologiskt utrymme (se här: math.stackexchange.com/questions/1822769/… ). Att definiera grenrör i termer av obefintliga begrepp är enligt min mening på sikt mer sannolikt att vara förvirrande än att klargöra. Jag föreslår åtminstone att ersätta ordet ” matematiskt ” i första meningen med något annat.
- Jag ’ Jag använder den här kommentaren som en möjlighet att ställa en liten fråga … Jag (tror) jag fick tanken på grenrör, men varför är det ” lokalt ” behövs? Är ’ t ett mellanslag ” lokalt ” kontinuerligt … kontinuerligt som helhet?
Svar
Som Bronstein och andra har uttryckt det i Geometrisk djupinlärning: går utöver euklidiska data ( Läs artikeln här )
Grovt, en grenrör är ett utrymme som är lokalt euklidiskt. Ett av de enklaste exemplen är en sfärisk yta som modellerar vår planet: runt en punkt verkar det vara plan, vilket har lett generationer av människor att tro på planhet på jorden. Formellt sett är ett (differentierbart) d-dimensionellt grenrör X ett topologiskt utrymme där varje punkt x har ett grannskap som är topologiskt ekvivalent (homeomorf) till ett d-dimensionellt euklidiskt utrymme, kallat tangentrummet.
Kommentarer
- Citatet är självmotsägande. I början beskriver den ett Riemannian grenrör (” lokalt euklidiskt ”) men i slutet beskriver det ett topologiskt grenrör (homeomorfismer gör inte, per definition måste respektera den differentiella strukturen och därför gäller inte begreppet tangentutrymme).