Si at jeg har følgende fire dimensjonale data, der de tre første kan betraktes som koordinater, og den siste kan betraktes som verdier.
c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95
Hvordan visualiserer man effekten av de tre første koordinatene bedre på den siste verdien?
Jeg er klar over tre metoder.
Den ene er 3D-plot for de tre første koordinatene med størrelsen på poeng som de fire verdiene. Men det er ikke så lett å se trenden i dataene.
En annen bruker en serie 3D-plot, som hver har en koordinat fast.
En annen kan være en såkalt «trellisgrafer» i gitter av R. Ikke sur eif det er for dette formålet, men det virker slik.
Kommentarer
- Trenger du en statisk skjerm (f.eks. for et papir)?
Svar
Hvis de tre første bare er romlige koordinater og dataene er sparsomme, kan du ganske enkelt gjøre et 3D-spredningsdiagram med forskjellige størrelser eller fargede punkter for verdien.
Ser omtrent ut som dette:
(kilde: gatech.edu )
Hvis dataene dine er ment å være kontinuerlige i naturen og finnes på et gitterrist, kan du plotte flere isokonturer av dataene ved hjelp av Marching Cubes .
En annen tilnærming når du har tette 4D-data er å vise flere 2D " skiver " av dataene som er innebygd i 3D. Det vil se ut slik:
Kommentarer
- Den fargede 3D-spredningen er bare veldig bra for kontinuerlige funksjoner på 3D-data. Hvis gradienten til funksjonen endres jevnt, kan du se noe mønster over punktet. På samme måte fungerer volumvisualiseringen nederst også best i dette scenariet. Hvis funksjonen er veldig støyende, vil du ha vanskelig for å se noe. Hvis du har fire forklaringsvariabler (som for å gjøre PCA eller klynging), tegner du 3 i euklidiske koordinater og den fjerde ved hjelp av en ikke-lineær kartlegging for å farge for å introdusere noen perseptuell skjevhet, som kan ' t være kvantifisert.
- @DianneCook at ' er sant. Jeg antar at ' er det jeg får for alltid å jobbe med jevne, kontinuerlige 3D-volumetriske data;)
- Hei, det ' s hva quesiton spurte% ^)
Svar
Har du fire kvantitative variabler? I så fall kan du prøve turer, parallelle koordinatplott, scatterplot-matriser. Tourr-pakken (og tourrGui) i R vil kjøre turer, i utgangspunktet rotasjon i høye dimensjoner, du kan velge å projisere i 1D, 2D eller mer, og det er et JSS-papir som du kan lese for å komme i gang sitert i pakken. Parallelle koordinatdiagrammer og scatterplot-matriser er i GGally-pakken, også scatterplot-matriser er i YaleToolkit-pakken. Du kan også se på http://www.ggobi.org for videoer og mer dokumentasjon på alle disse.
Hvis dataene dine er helt kategoriske, bør du bruke mosaikkplott eller varianter. Ta en titt på produktplottpakken i R, også har vcd noen rimelige funksjoner, eller ggparallellpakken for å gjøre det som tilsvarer parallelle koordinatplott for kategoriske data. Også, nettopp funnet at extracat-pakken har noen funksjoner for å vise kategoriske data.
Jeg leste feil, opprinnelig, fordi jeg stoppet ved spørsmålet, og forsømte å lese hele beskrivelsen. I likhet med fremgangsmåten nedenfor (fargeleggingspunkter i 3D) kan du bruke koblet børsting for å utforske funksjoner definert på høydimensjonale mellomrom. Ta en titt på videoen her som viser å gjøre dette for en 3D-multivariat normalfunksjon. Børsten maler punkter med høy tetthet (høye funksjonsverdier) og beveger seg deretter til lavere og lavere tetthetsverdier (lave funksjonsverdier). Stedene der funksjonen er samplet vises i et 3D-roterende spredningsdiagram ved hjelp av turen, som også kan brukes til å se på 4, 5 eller høyere dimensjonale domener.
Svar
Prøv Chernoff ansikter . Tanken er å knytte variablene til ansiktsegenskaper. For eksempel vil størrelsen på smilet være en variabel, ansikts rundhet er en annen osv. Så latterlig som det høres ut, kan dette faktisk fungere hvis du finner ut en smart måte å kartlegge variabler til funksjoner.
En annen måte er å vise 2-d projeksjoner av 3-d fasediagrammet. Si at du har x1, x2, x3, x4 variablene dine.For hver verdi av x4, tegne 3-d graf av (x1, x2, x3) poeng, og koble punktene. Dette fungerer best når x4 bestilles, f.eks. det er dato eller klokkeslett.
OPPDATERING: Du kan også prøve boblediagrammer. Tre dimensjoner vil vanlig kartesisk x, y, z og den fjerde dimensjonen vil være størrelsen på bobelpunktet.
Du kan prøve animasjon, dvs. bruke tid som fjerde dimensjon.
Også en kombinasjon av boble og animasjon: x, y, boble og tid.
Også relatert til Chernoff er tegnplott , som kan se litt mer alvorlig ut. Det er stjerner med strålelengde proporsjonal med variable verdier.
Kommentarer
- Takk for svaret. Det ser ut til at det andre alternativet er mulig for mitt problem. Jeg tror den første ikke virker så seriøs for en forskningsartikkel. I utgangspunktet vil jeg at plottet kan avsløre en tendens eller innflytelse av tre faktorer på verdien (fjerde dimensjon).
- Chernoff-ansikter ble brukt i seriøs forskning, afaik.
- Chernoff-ansikter kan være ekstraordinært nyttig, spesielt når dimensjonaliteten er rundt 10-20 variabler. For fire dimensjoner er de ikke ' t like effektive som andre typer grafiske fremstillinger.
- chernoff ansikter er en forferdelig idé! hvis du må bruke et ikonplott, bruk en stjerneplott. Hvis du har et veldig lite datasett, kan dette være nyttig, men prøv å tegne 1000 ikoner og se om du virkelig kan se noe!