Wat is een spruitstuk?

In dimensionaliteitsreductietechnieken zoals Principal Component Analysis, LDA enz. wordt vaak de term spruitstuk gebruikt. Wat is een spruitstuk in niet-technische term? Als een punt $ x $ behoort tot een bol waarvan ik de dimensie wil verkleinen, en als er een ruis is $ y $ en $ x $ en $ y $ niet gecorreleerd zijn, dan zouden de feitelijke punten $ x $ ver van elkaar verwijderd zijn andere vanwege het lawaai. Daarom zou ruisfiltering nodig zijn. Dimensiereductie zou dus worden uitgevoerd op $ z = x + y $. Daarom behoren $ x $ en $ y $ hier tot verschillende verdeelstukken?

Ik werk aan puntenwolkgegevens die vaak worden gebruikt in robotvisie; de puntenwolken zijn lawaaierig als gevolg van ruis tijdens acquisitie en ik moet de ruis verminderen voordat dimensies worden verkleind. Anders krijg ik een verkeerde afmetingreductie. Dus, wat is hier het verdeelstuk en maakt ruis deel uit van hetzelfde verdeelstuk waartoe $ x $ behoort?

Opmerkingen

  • It ‘ het is niet echt mogelijk om de term correct te gebruiken zonder wiskundig nauwkeurig te zijn

Answer

In niet-technische termen is een spruitstuk een continue geometrische structuur met een eindige afmeting: een lijn, een curve, een vlak, een oppervlak, een bol, een bal, een cilinder, een torus, een “klodder” … zoiets als dit: voer de beschrijving van de afbeelding hier in

Het is een algemene term die wordt gebruikt door wiskundigen om te zeggen “een curve” (dimensie 1) of “oppervlak” (dimensie 2), of een 3D-object (dimensie 3) … voor elke mogelijke eindige dimensie $ n $. Een eendimensionaal verdeelstuk is gewoon een curve (lijn, cirkel …). Een tweedimensionaal verdeelstuk is gewoon een oppervlak (vlak, bol, torus, cilinder …). Een driedimensionaal spruitstuk is een “volledig object” (bal, volledige kubus, de 3D-ruimte om ons heen …).

Een verdeelstuk wordt vaak beschreven door een vergelijking: de verzameling punten $ (x, y) $ zoals $ x ^ 2 + y ^ 2 = 1 $ is een eendimensionaal verdeelstuk (een cirkel).

Een verdeelstuk heeft overal dezelfde afmeting. Als u bijvoorbeeld een lijn (maat 1) aan een bol (maat 2) toevoegt, is de resulterende geometrische structuur geen verdeelstuk.

In tegenstelling tot de meer algemene noties van metrische ruimte of topologische ruimte die ook bedoeld zijn om onze natuurlijke intuïtie van een continue reeks punten te beschrijven, is een verdeelstuk bedoeld als iets lokaals eenvoudigs: als een eindige dimensie vectorruimte: $ \ mathbb {R} ^ n $. Dit sluit abstracte ruimtes uit (zoals oneindige dimensieruimten) die vaak geen geometrische concrete betekenis hebben.

In tegenstelling tot een vectorruimte kunnen spruitstukken verschillende vormen hebben. Sommige spruitstukken kunnen gemakkelijk worden gevisualiseerd (bol, bal …), andere zijn moeilijk te visualiseren, zoals de kleinfles of de echt projectief vlak .

In statistiek, machine learning of toegepaste wiskunde in het algemeen wordt het woord spruitstuk vaak gebruikt om te zeggen als een lineaire deelruimte, maar mogelijk gebogen . Elke keer dat je een lineaire vergelijking schrijft zoals: $ 3x + 2y-4z = 1 $, krijg je een lineaire (affiene) deelruimte (hier een vlak). Als de vergelijking niet lineair is, zoals $ x ^ 2 + 2y ^ 2 + 3z ^ 2 = 7 $, is dit meestal een verdeelstuk (hier een uitgerekte bol).

Bijvoorbeeld de “ spruitstukhypothese “van ML zegt” hoog-dimensionale gegevens zijn punten in een laag-dimensionaal verdeelstuk waaraan hoge dimensionale ruis is toegevoegd “. Je kunt je punten van een 1D-cirkel voorstellen waaraan wat 2D-ruis is toegevoegd. Hoewel de punten niet precies op de cirkel liggen, voldoen ze statistisch gezien aan de vergelijking $ x ^ 2 + y ^ 2 = 1 $. De cirkel is het onderliggende spruitstuk: https://i.stack.imgur.com/iEm2m.png

Opmerkingen

  • @RiaGeorge Op de foto is het oppervlak dat een veelvoud is. Het ‘ is continu omdat je er vrij rond kunt bewegen zonder onderbreking en nooit van het oppervlak hoeft te springen om tussen twee plaatsen te komen. De gaten waarnaar u verwijst, zijn belangrijk bij het beschrijven van hoe u op de eenvoudigste manier tussen twee punten aan de oppervlakte kunt komen, en het tellen ervan is een belangrijke techniek bij het bestuderen van spruitstukken.
  • Uitleggen wat topologie is, zou een veel te brede vraag zijn voor deze site en een beetje afwijkend van het onderwerp. Ik zou de wiskunde-stack-uitwisseling zoeken naar informatie daarover. Spruitstukken en topologie zijn geen synoniemen: spruitstukken zijn wiskundige objecten bestudeerd met de technieken van topologie, topologie is een subonderwerp van wiskunde.
  • Dit lijkt een zeer goede uitleg voor iemand die voor het eerst over het concept leert tijd, met goedgekozen, concrete voorbeelden. (Ik weet het echter niet ‘ zeker sinds ik het concept eerder ben tegengekomen.) Als kleine klacht zou ik aanraden om de laatste zin te herformuleren zodat deze minder absoluut is (” Elke keer dat de vergelijking niet-lineair is, zoals …”): zoals het nu is geschreven, is het niet echt waar. Afgezien van die kleine klacht, vind ik dit erg goed geschreven.
  • Het antwoord mist alle fundamentele punten die een spruitstuk zo maken, ik begrijp ‘ niet hoe het zoveel upvotes heeft. Topologie, grafieken en gladheid worden niet eens genoemd en het antwoord geeft in feite de indruk dat een verdeelstuk een oppervlak is, wat het niet is.
  • Technisch punt, de oplossingsset van een stelsel van vergelijkingen hoeft geen spruitstuk te zijn. Het ‘ is een variëteit, dus ‘ is meestal een spruitstuk, maar het kan zelfdoorsnijdingspunten hebben waar de spruitstukeigenschap niet werkt.

Answer

Een (topologisch) verdeelstuk is een spatie $ M $ wat is:

(1) “lokaal” “equivalent” aan $ \ mathbb {R} ^ n $ voor ongeveer $ n $.

“Lokaal” kan de “equivalentie” worden uitgedrukt via $ n $ coördinaatfuncties, $ c_i: M \ to \ mathbb {R} $, die samen een “structuurbehoudende” functie vormen, $ c: M \ to \ mathbb {R} ^ n $, een chart genoemd.

(2) kan worden gerealiseerd op een “structuurbehoudende” manier als een subset van $ \ mathbb {R} ^ N $ voor ongeveer $ N \ ge n $. (1) (2)

Houd er rekening mee dat maak “structuur” hier nauwkeurig, men moet de basisbegrippen begrijpen van topologie ( def. ), waardoor men precieze noties kan maken van “lokaal” gedrag, en dus “lokaal” hierboven. Als ik “equivalent” zeg, bedoel ik gelijkwaardige topologische structuur ( homeomorphic ), en wanneer ik zeg “structuurbehoud” bedoel ik hetzelfde (creëert een equivalent topologische structuur).

Merk ook op dat om calculus op spruitstukken te doen, men een aanvullende voorwaarde nodig heeft die niet volgt uit de boven twee voorwaarden, die in feite iets zeggen als “de grafieken gedragen zich goed genoeg om ons in staat te stellen calculus te doen”. Dit zijn de spruitstukken die in de praktijk het vaakst worden gebruikt. In tegenstelling tot algemene topologische spruitstukken , staan ze naast calculus ook triangulaties toe, wat erg belangrijk is in toepassingen zoals de jouwe met betrekking tot puntenwolkgegevens .

Merk op dat niet alle mensen dezelfde definitie gebruiken voor een (topologische) variëteit. Verschillende auteurs zullen deze definiëren als bevredigend slechts voorwaarde (1) abo ve, niet noodzakelijk ook (2). De definitie die aan zowel (1) als (2) voldoet, gedraagt zich echter veel beter en is daarom nuttiger voor beoefenaars. Men zou intuïtief kunnen verwachten dat (1) impliceert (2), maar het is eigenlijk niet “t.

EDIT: Als u geïnteresseerd bent in wat een “topologie” precies is, is het belangrijkste voorbeeld van een topologie dat u moet begrijpen de Euclidische topologie van $ \ mathbb {R} ^ n $. Dit zal uitgebreid worden behandeld in elk (goed) inleidend boek over “echte analyse” .

Opmerkingen

  • Bedankt voor je antwoord: Kunt u alstublieft ook uitleggen wat een topologie is in niet-technische termen? Worden de termen topologie en spruitstuk door elkaar gebruikt? dimensie moet een geheel getal zijn? Wat is het een reëel getal, dan denk ik dat de structuur bekend staat als fractals als de hele structuur is samengesteld uit elk subdeel zelfherhalend is.
  • @RiaGeorge $ n $ staat voor een natuurlijk getal (integer $ \ ge 1 $), net als $ N $. Er is mogelijk een meer geavanceerde theorie voor fractioneel / r eal-gewaardeerde dimensies, maar ‘ komt niet zo vaak voor. ” Topologie ” en ” spruitstuk ” betekenen twee heel verschillende dingen, dus het zijn geen onderling verwisselbare termen. Een ” verdeelstuk ” heeft een ” topologie “. Het vakgebied Topologie bestudeert ruimtes met ” topologieën “, die verzamelingen sets zijn die voldoen aan drie regels / voorwaarden. Een van de doelen van het bestuderen van ” topologieën ” is om op een consistente en reproduceerbare manier begrippen van ” local ” gedrag.
  • @RiaGeorge De axiomas voor een ” topologie ” is te vinden op de Wikipedia-pagina: en.wikipedia.org / wiki / General_topology # A_topology_on_a_set – merk ook op dat de link die ik je gaf voor de (equivalente) definitie van ” topologie ” in termen van buurt wees naar iets verwant maar niet hetzelfde, ik heb mijn antwoord aangepast om dit weer te geven: en.wikipedia.org/wiki/… Merk echter op dat de definitie in termen van buurten moeilijker te begrijpen is (ik veronderstel dat ik het goed zou kunnen begrijpen, maar ‘ t stoor je ook, want ik ‘ m lui
  • dus het ‘ s mijn persoonlijke bevooroordeelde mening dat je niet ‘ Je hoeft de buurtdefinitie van topologie niet te kennen – weet gewoon dat de eenvoudigere definitie je dezelfde kracht geeft als de buurtdefinitie in termen van een rigoureuze beschrijving van lokaal gedrag, aangezien ze dat zijn gelijkwaardig). Hoe dan ook, als je geïnteresseerd bent in fractals, zul je deze Wikipedia-paginas misschien interessant vinden – ik kan je ‘ je daar echter niet meer mee helpen, omdat ik niet goed bekend ben met de theorie en niet ‘ ken of begrijp de meeste definities niet – ik heb alleen gehoord van enkele van de
  • Dit is het enige antwoord tot nu toe dat aandacht besteedt tot het moderne wiskundige idee om een globaal object samen te stellen uit lokale gegevens. Helaas haalt het ‘ niet het niveau van eenvoud en duidelijkheid dat vereist is van een ” niet-technische ” account.

Antwoord

In deze context is de term spruitstuk juist, maar is onnodig hoogfalutine. Technisch gezien is een spruitstuk elke ruimte (reeks punten met een topologie) die voldoende vloeiend en continu is (op een manier die, met enige moeite, wiskundig goed gedefinieerd kan worden).

Stel je de ruimte voor. van alle mogelijke waarden van uw oorspronkelijke factoren. Na een dimensionale reductietechniek zijn niet alle punten in die ruimte haalbaar. In plaats daarvan zijn alleen punten op een ingebedde subruimte binnen in die ruimte haalbaar. Die ingebedde subruimte voldoet toevallig aan de wiskundige definitie van een verdeelstuk. Voor een lineaire dimensionale reductietechniek zoals PCA is die subruimte slechts een lineaire subruimte (bijv. Een hypervlak), wat een relatief triviaal spruitstuk is. Maar voor de niet-lineaire dimensionale reductietechniek kan die subruimte gecompliceerder zijn (bijvoorbeeld een gekromd hyperoppervlak). Voor gegevensanalysedoeleinden is het veel belangrijker om te begrijpen dat dit subruimten zijn dan enige gevolgtrekking die u zou trekken uit de wetenschap dat ze voldoen aan de definitie van veelvoud.

Opmerkingen

  • ” Highfalutin ” … heeft vandaag een nieuw woord geleerd!
  • Wiskundig , een verdeelstuk is elke lokaal continue topologische ruimte. Ik hou van het idee om dingen in duidelijke taal uit te leggen, maar deze karakterisering werkt niet echt ‘. Ten eerste is continuïteit altijd een lokale eigenschap, dus ik ‘ weet niet zeker wat u bedoelt met lokaal continu. Ook sluit uw definitie niet veel dingen uit die geen spruitstukken ‘ t zijn, zoals de rationale getallenlijn of de vereniging van twee elkaar snijdende lijnen in het Euclidische vlak.
  • Ik ben het met Ben eens, technisch gezien is het ‘ s ” lokaal euclidisch “. Ik ‘ m niet zeker of er een goede manier is om dat in eenvoudig Engels samen te vatten.
  • Ik ben het ook volledig eens met de twee opmerkingen hierboven. In feite was het antwoord dat ik hieronder schreef oorspronkelijk bedoeld als een verhelderende opmerking op dit antwoord, dat te lang werd. Er is geen exact begrip van een ” continue ” topologische ruimte (zie hier: math.stackexchange.com/questions/1822769/… ). Het definiëren van spruitstukken in termen van niet-bestaande concepten is naar mijn mening op de lange termijn eerder verwarrend dan verhelderend. Ik zou op zijn minst willen voorstellen het woord ” wiskundig ” in de eerste zin te vervangen door iets anders.
  • Ik ‘ zal deze opmerking gebruiken als een gelegenheid om een kleine vraag te stellen … Ik (denk) dat ik het idee van spruitstukken kreeg, maar waarom is het ” lokaal ” nodig? Is niet ‘ t een spatie ” lokaal ” continu … continu als geheel?

Antwoord

Zoals Bronstein en anderen het hebben gezegd in Geometrisch diep leren: verder gaan dan Euclidische gegevens ( Lees het artikel hier )

Ongeveer een spruitstuk is een ruimte die lokaal Euclidisch is. Een van de eenvoudigste voorbeelden is een bolvormig oppervlak dat onze planeet modelleert: rond een punt lijkt het vlak te zijn, waardoor generaties mensen in de vlakheid van de aarde zijn gaan geloven. Formeel gesproken is een (differentieerbare) d-dimensionale verdeelstuk X een topologische ruimte waarin elk punt x een buurt heeft die topologisch equivalent (homeomorf) is aan een d-dimensionale Euclidische ruimte, de raakruimte genaamd.

Reacties

  • Het citaat is met zichzelf in tegenspraak. In het begin beschrijft het een Riemann-spruitstuk (” lokaal Euclidisch “), maar aan het einde beschrijft het een topologisch spruitstuk (homeomorfismen niet, moeten per definitie de differentiële structuur respecteren en daarom is het concept van raakruimte niet van toepassing).

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *