Quali sono alcune scelte popolari per la visualizzazione di dati quadridimensionali?

Supponiamo che io disponga dei seguenti dati quadridimensionali, dove i primi tre possono essere considerati come coordinate e lultimo può essere considerato come valori.

c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 

Come visualizzare meglio leffetto delle prime tre coordinate sullultimo valore?

Conosco tre metodi.

Uno è il grafico 3D per le prime tre coordinate con la dimensione dei punti come valore dei quattro. Ma non lo è che è facile vedere la tendenza nei dati.

Un altro sta usando una serie di grafici 3D, ognuno dei quali ha una coordinata fissa. inserisci la descrizione dellimmagine qui

Un altro potrebbe essere un cosiddetto “grafo a traliccio” nel reticolo di R. Non sicuro se è per questo scopo ma sembra di sì. inserisci qui la descrizione dellimmagine

Commenti

  • Hai bisogno di una visualizzazione statica (ad esempio, per un articolo)?

Risposta

Se le prime tre sono solo coordinate spaziali e i dati sono scarsi, puoi semplicemente creare un grafico a dispersione 3D con punti colorati o di dimensioni diverse per il valore.

Assomiglia a qualcosa di simile questo: Scatter
(fonte: gatech.edu )

Se i tuoi dati devono essere di natura continua ed esistono su una griglia reticolare, puoi tracciare diversi isocontours dei dati utilizzando i Marching Cubes .

Un altro approccio quando si hanno dati 4D densi consiste nel visualizzare diversi " divide " dei dati incorporati in 3D. Sarà simile a questo:

Slices

Commenti

  • Lo scatterplot 3D colorato è veramente adatto solo per funzioni continue su dati 3D. Se il gradiente della funzione cambia in modo uniforme, è possibile vedere un motivo attraverso la dispersione dei punti. Allo stesso modo, la visualizzazione del volume in basso funziona meglio anche in questo scenario. Se la funzione è molto rumorosa, sarà difficile vedere qualcosa. Se hai 4 variabili esplicative (come per fare PCA o clustering) tracciare 3 in coordinate euclidee e la quarta utilizzando una mappatura non lineare per colorare introducendo un bias percettivo, che può ' essere quantificato.
  • @DianneCook che ' è vero. Immagino che ' sia quello che ottengo lavorando sempre con dati volumetrici 3D fluidi e continui;)
  • Ehi, ' è quello che ha chiesto la domanda% ^)

Risposta

Hai quattro variabili quantitative? In tal caso, provare tour, grafici a coordinate parallele, matrici di grafici a dispersione. Il pacchetto tourr (e tourrGui) in R eseguirà tour, fondamentalmente rotazione in dimensioni elevate, puoi scegliere di proiettare in 1D, 2D o più, e cè un documento JSS che puoi leggere per iniziare citato nel pacchetto. I grafici a coordinate parallele e le matrici dei grafici a dispersione si trovano nel pacchetto GGally, anche le matrici dei grafici a dispersione sono nel pacchetto YaleToolkit. Puoi anche guardare http://www.ggobi.org per i video e altra documentazione su tutti questi.

Se i tuoi dati sono interamente categoriali, dovresti utilizzare grafici a mosaico o varianti. Dai unocchiata al pacchetto productplots in R, anche vcd ha alcune funzioni ragionevoli, o il pacchetto ggparallel per fare lequivalente di grafici a coordinate parallele per dati categoriali. Inoltre, ho appena scoperto che il pacchetto extracat ha alcune funzioni per visualizzare dati categoriali.

Ho letto male la domanda, inizialmente, perché mi sono fermato alla domanda e ho trascurato di leggere la descrizione completa. Simile allapproccio di seguito (punti di colorazione in 3D) è possibile utilizzare la pennellatura collegata per esplorare le funzioni definite su spazi ad alta dimensione. Dai unocchiata al video qui che mostra come eseguire questa operazione per una normale funzione 3D multivariata. Il pennello colora i punti con alta densità (valori di funzione alti) e quindi si sposta su valori di densità sempre più bassi (valori di funzione bassi). Le posizioni in cui viene campionata la funzione vengono mostrate in un grafico a dispersione rotante 3D, utilizzando il tour, che potrebbe essere utilizzato anche per osservare i domini di dimensione 4, 5 o superiore.

Risposta

Prova volti di Chernoff . Lidea è di associare le variabili ai tratti del viso. Ad esempio, la dimensione del sorriso sarebbe una variabile, la rotondità del viso unaltra ecc. Per quanto ridicolo possa sembrare, questo potrebbe effettivamente funzionare se trovi un modo intelligente per mappare le variabili alle caratteristiche.

Un altro il modo è mostrare le proiezioni 2-d del diagramma di fase 3-d. Supponi di avere x1, x2, x3, x4 le tue variabili.Per ogni valore di x4, traccia il grafico 3-d di (x1, x2, x3) punti e collega i punti. Funziona meglio quando viene ordinato x4, ad es. è la data o lora.

AGGIORNAMENTO: puoi anche provare i grafici a bolle. Tre dimensioni sarebbero le normali x, y, z cartesiane e la quarta dimensione sarebbe la dimensione del punto della bolla.

Puoi provare lanimazione, ovvero utilizzare il tempo come quarta dimensione.

Anche una combinazione di bolla e animazione: x, y, bolla e tempo.

Inoltre, correlato a Chernoff è il grafico dei glifi , che potrebbe sembrare un po più serio. Sono stelle con lunghezza dei raggi proporzionale ai valori variabili.

Commenti

  • Grazie per la risposta. Sembra che la seconda opzione sia possibile per il mio problema. Penso che il primo non sembri così serio per un articolo di ricerca. Fondamentalmente vorrei che la trama rivelasse una tendenza o linfluenza di tre fattori sul valore (quarta dimensione).
  • I volti di Chernoff sono stati usati in ricerche serie, afaik.
  • I volti di Chernoff possono essere straordinariamente utili, soprattutto quando la dimensionalità è intorno a 10-20 variabili. Per quattro dimensioni non sono ' efficaci quanto altri tipi di rappresentazioni grafiche.
  • I volti di chernoff sono unidea terribile! se devi usare un grafico ad icone usa uno starplot. Se hai un set di dati molto piccolo, questi potrebbero essere utili, ma prova a tracciare 1000 icone e vedi se riesci a vedere davvero qualcosa!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *