Hvad er nogle populære valg til visualisering af 4-dimensionelle data?

Sig, at jeg har følgende fire dimensionelle data, hvor de første tre kan betragtes som koordinater, og den sidste kan betragtes som værdier.

c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 

Hvordan visualiseres effekten af de første tre koordinater bedre på den sidste værdi?

Jeg er opmærksom på tre metoder.

Den ene er 3D-plot for de første tre koordinater med størrelsen af punkter som de fire værdier. Men det er ikke så let at se tendensen i dataene.

En anden bruger en række 3D-plot, som hver er med en koordinat fast. indtast billedbeskrivelse her

En anden kan være en såkaldt “trellisgrafer” i gitter af R. Ikke sur eif det er til dette formål, men det ser ud til at være det. indtast billedbeskrivelse her

Kommentarer

  • Har du brug for en statisk skærm (f.eks. til et papir)?

Svar

Hvis de første tre kun er geografiske koordinater, og dataene er sparsomme, kan du blot lave et 3D-spredningsdiagram med forskellige størrelser eller farvede punkter for værdien.

Ser noget ud som dette: Scatter
(kilde: gatech.edu )

Hvis dine data er beregnet til at være kontinuerlige i naturen og findes på et gittergitter, kan du plotte flere isokonturer af dataene ved hjælp af Marching Cubes .

En anden tilgang, når du har tætte 4D-data, er at vise flere 2D " skiver " af dataene indlejret i 3D. Det vil se sådan ud:

Slices

Kommentarer

  • Den farvede 3D-scatterplot er kun rigtig velegnet til kontinuerlige funktioner på 3D-data. Hvis funktionsgradienten ændres glat, kan du se noget mønster på tværs af punktpredningen. På samme måde fungerer volumenvisualiseringen nederst også bedst i dette scenarie. Hvis funktionen er meget støjende, har du svært ved at se noget. Hvis du har 4 forklarende variabler (som for at lave PCA eller klyngedannelse), der plotter 3 i euklidiske koordinater og den fjerde ved hjælp af en ikke-lineær kortlægning til farve i introduktion af en vis perceptuel bias, som kan ' t være kvantificeret.
  • @DianneCook at ' er sandt. Jeg antager at ' er hvad jeg får for altid at arbejde med glatte, kontinuerlige 3D-volumetriske data;)
  • Hej, at ' s hvad quesiton spurgte% ^)

Svar

Har du fire kvantitative variabler? Hvis ja, prøv ture, parallelle koordinatdiagrammer, scatterplot-matricer. Tourr (og tourrGui) -pakken i R kører ture, dybest set rotation i høje dimensioner, du kan vælge at projicere i 1D, 2D eller mere, og der er et JSS-papir, som du kan læse for at komme i gang citeret i pakken. Parallelle koordinatdiagrammer og scatterplot-matricer er i GGally-pakken, også scatterplot-matricer findes i YaleToolkit-pakken. Du kan også se på http://www.ggobi.org for videoer og mere dokumentation om alle disse.

Hvis dine data er helt kategoriske, skal du bruge mosaikplotter eller varianter. Se på produktplotspakken i R, også vcd har nogle rimelige funktioner, eller ggparallelpakken til at udføre ækvivalenten med parallelle koordinatdiagrammer til kategoriske data. Også lige fundet, at extracat-pakken har nogle funktioner til visning af kategoriske data.

Jeg læste fejlagtigt spørgsmålet, fordi jeg stoppede ved spørgsmålet og forsømte at læse den fulde beskrivelse. I lighed med fremgangsmåden nedenfor (farvepunkter i 3D) kan du bruge sammenkædet børstning til at udforske funktioner defineret i højdimensionelle rum. Se videoen her , som viser at gøre dette til en 3D-multivariat normal funktion. Børsten maler punkter med høj densitet (høje funktionsværdier) og flytter derefter til lavere og lavere densitetsværdier (lave funktionsværdier). De placeringer, hvor funktionen samples, vises i et 3D-roterende scatterplot ved hjælp af turen, som også kan bruges til at se på 4, 5 eller højere dimensionelle domæner.

Svar

Prøv Chernoff-ansigter . Ideen er at knytte variablerne til ansigtstræk. For eksempel ville størrelsen af smilet være en variabel, rundhed i ansigtet er en anden osv. Så latterligt som det lyder, kan dette faktisk fungere, hvis du finder ud af en smart måde at kortlægge variabler til funktioner.

En anden måde er at vise 2-d fremskrivninger af 3-d fasediagrammet. Sig, at du har x1, x2, x3, x4 dine variabler.For hver værdi af x4 tegner du en 3-d-graf over (x1, x2, x3) punkter og forbinder punkterne. Dette fungerer bedst, når x4 bestilles, f.eks. det er dato eller klokkeslæt.

OPDATERING: Du kan også prøve bobleplotter. Tre dimensioner ville normalt være kartesisk x, y, z og den 4. dimension ville være størrelsen på boblepunktet.

Du kan prøve animation, dvs. bruge tid som fjerde dimension.

Også en kombination af boble og animation: x, y, boble og tid.

Også relateret til Chernoff er glyfplot , hvilket kan se lidt mere seriøst ud. Det er stjerner med strålelængde, der er proportional med variable værdier.

Kommentarer

  • Tak for svaret. Det ser ud til, at den anden mulighed er mulig for mit problem. Jeg synes, den første synes ikke så seriøs for en forskningsopgave. Grundlæggende vil jeg gerne, at plottet kan afsløre en tendens eller indflydelse af tre faktorer på værdien (fjerde dimension).
  • Chernoff-ansigter blev brugt i seriøs forskning, afaik.
  • Chernoff-ansigter kan være ekstraordinært nyttig, især når dimensionaliteten er omkring 10-20 variabler. For fire dimensioner er de ' t så effektive som andre former for grafiske repræsentationer.
  • chernoff ansigter er en frygtelig idé! hvis du skal bruge et ikonplot, skal du bruge en stjerneplot. Hvis du har et virkelig lille datasæt, kan disse være nyttige, men prøv at plotte 1000 ikoner og se om du virkelig kan se noget!

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *