Wat zijn enkele populaire keuzes voor het visualiseren van 4-dimensionale gegevens?

Stel dat ik de volgende vierdimensionale gegevens heb, waarbij de eerste drie als coördinaten kunnen worden beschouwd en de laatste als waarden.

c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 

Hoe kan ik het effect van de eerste drie coördinaten op de laatste waarde beter visualiseren?

Ik ben me bewust van drie methoden.

De ene is een 3D-plot voor de eerste drie coördinaten met de grootte van punten als de vier waarde. Maar dat is niet zo gemakkelijk om de trend in de gegevens te zien.

Een andere is het gebruik van een reeks 3D-plot, waarvan elk een vaste coördinaat heeft. voer hier de afbeeldingsbeschrijving in

Een andere kan een zogenaamde “trellis graphs” zijn in het rooster van R. Niet zeker of dit voor dit doel is, maar het lijkt zo. voer hier de beeldbeschrijving in

Reacties

  • Heb je een statische weergave nodig (bijv. voor een paper)?

Antwoord

Als de eerste drie slechts ruimtelijke coördinaten zijn en de gegevens schaars zijn, kunt u eenvoudig een 3D-spreidingsplot maken met punten van verschillende grootte of gekleurde punten voor de waarde.

Ziet er ongeveer zo uit this: Scatter
(bron: gatech.edu )

Als het de bedoeling is dat uw gegevens continu van aard zijn en op een rooster staan, kunt u verschillende isocontours van de gegevens met behulp van Marching Cubes .

Een andere benadering wanneer u dichte 4D-gegevens heeft, is om verschillende 2D " snijdt " van de gegevens in 3D. Het ziet er ongeveer zo uit:

Plakjes

Commentaar

  • De gekleurde 3D scatterplot is alleen echt geschikt voor continue functies op 3D data. Als het verloop van de functie vloeiend verandert, kun je een patroon zien over de puntverstrooiing. Evenzo werkt de volumevisualisatie onderaan het beste in dit scenario. Als de functie erg veel lawaai maakt, is het moeilijk om iets te zien. Als je 4 verklarende variabelen hebt (zoals voor het doen van PCA of clustering), dan 3 plotten in Euclidische coördinaten en de 4e met een niet-lineaire mapping naar kleur bij het introduceren van enige perceptuele bias, die ' niet kan zijn gekwantificeerd.
  • @DianneCook dat ' waar is. Ik denk dat ' is wat ik krijg als ik altijd met soepele, continue 3D-volumetrische gegevens werk;)
  • Hé, dat ' s wat de vraag stelde% ^)

Antwoord

Heeft u vier kwantitatieve variabelen? Als dat zo is, probeer dan rondleidingen, parallelle coördinatenplots, scatterplotmatrices. Het tourr (en tourrGui) -pakket in R zal tours uitvoeren, in feite rotatie in hoge afmetingen, je kunt ervoor kiezen om te projecteren in 1D, 2D of meer, en er is een JSS-paper dat je kunt lezen om aan de slag te gaan, geciteerd in het pakket. Parallelle coördinatenplots en scatterplotmatrices bevinden zich in het GGally-pakket, ook scatterplotmatrices bevinden zich in het YaleToolkit-pakket. Je kunt ook de http://www.ggobi.org bekijken voor videos en meer documentatie over al deze videos.

Als uw gegevens volledig categorisch zijn, moet u mozaïekplots of varianten gebruiken. Kijk eens naar het productplots-pakket in R, ook heeft vcd een aantal redelijke functies, of het ggparallel-pakket om het equivalent van parallelle coördinaatplots voor categorische gegevens te doen. Ik heb ook zojuist ontdekt dat het extracat-pakket enkele functies heeft voor het weergeven van categorische gegevens.

Ik heb de vraag oorspronkelijk verkeerd gelezen, omdat ik bij de vraag stopte en de volledige beschrijving niet las. Vergelijkbaar met de onderstaande benadering (kleurpunten in 3D) kunt u gekoppeld poetsen gebruiken om functies te verkennen die zijn gedefinieerd in hoog-dimensionale ruimtes. Bekijk de video hier die laat zien hoe u dit doet voor een normale 3D-multivariate functie. Het penseel schildert punten met een hoge dichtheid (hoge functiewaarden) en gaat vervolgens naar lagere en lagere dichtheidswaarden (lage functiewaarden). De locaties waar de functie wordt bemonsterd, worden weergegeven in een roterende 3D-scatterplot met behulp van de tour, die kan worden gebruikt om ook naar domeinen met 4, 5 of hoger dimensies te kijken.

Antwoord

Probeer Chernoff-gezichten . Het idee is om de variabelen aan gelaatstrekken te koppelen. De grootte van de glimlach zou bijvoorbeeld de ene variabele zijn, de ronding van het gezicht is een andere enz. Hoe belachelijk het ook klinkt, dit kan echt werken als je een slimme manier vindt om variabelen aan elementen toe te wijzen.

Nog een manier is om 2-d projecties van het 3-d fasendiagram te tonen. Stel dat u x1, x2, x3, x4 uw variabelen heeft.Teken voor elke waarde van x4 een 3D-grafiek van (x1, x2, x3) punten en verbind de punten. Dit werkt het beste wanneer x4 is besteld, bijv. het is de datum of tijd.

UPDATE: je kunt ook bellenplots proberen. Drie dimensies zijn de gebruikelijke cartesische x, y, z en de 4e dimensie is de grootte van het bellenpunt.

Je kunt animatie proberen, dwz tijd als vierde dimensie gebruiken.

Ook een combinatie van bel en animatie: x, y, bel en tijd.

Ook gerelateerd aan Chernoff is glyph-plot , wat er misschien wat serieuzer uitziet. Het zijn sterren waarvan de lengte van de stralen evenredig is met de variabele waarden.

Opmerkingen

  • Bedankt voor het antwoord. Het lijkt erop dat de tweede optie mogelijk is voor mijn probleem. Ik denk dat de eerste niet zo serieus lijkt voor een onderzoeksartikel. In principe zou ik willen dat de plot een trend of invloed van drie factoren op de waarde (vierde dimensie) onthult.
  • Chernoff-gezichten werden gebruikt in serieus onderzoek, afaik.
  • Chernoff-gezichten kunnen buitengewoon nuttig zijn, vooral wanneer de dimensionaliteit ongeveer 10-20 variabelen is. Voor vier dimensies zijn ze ' niet zo effectief als andere soorten grafische weergaven.
  • Tsjernoff-gezichten zijn een vreselijk idee! als je een icoonplot moet gebruiken, gebruik dan een starplot. Als je een heel kleine gegevensset hebt, kunnen deze handig zijn, maar probeer 1000 pictogrammen uit te zetten en kijk of je echt iets kunt zien!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *