Quels sont les choix populaires pour visualiser des données en 4 dimensions?

Disons que jai les données à quatre dimensions suivantes, où les trois premiers peuvent être considérés comme des coordonnées et le dernier peut être considéré comme des valeurs.

c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 

Comment mieux visualiser leffet des trois premières coordonnées sur la dernière valeur?

Je connais trois méthodes.

Lune est un tracé 3D pour les trois premières coordonnées avec la taille des points comme valeur de quatre. Mais ce nest pas très facile de voir la tendance dans les données.

Une autre consiste à utiliser une série de tracés 3D, dont chacun a une coordonnée fixe. entrez la description de limage ici

Un autre peut être un soi-disant « graphes en treillis » en treillis de R. Pas sur e si cest à cet effet mais il semble que oui. entrez la description de limage ici

Commentaires

  • Avez-vous besoin dun affichage statique (par exemple, pour un article)?

Réponse

Si les trois premiers ne sont que des coordonnées spatiales et que les données sont rares, vous pouvez simplement faire un nuage de points 3D avec des points de taille ou de couleur différente pour la valeur.

Cela ressemble à quelque chose comme ceci: Scatter
(source: gatech.edu )

Si vos données sont destinées à être de nature continue et existent sur une grille en treillis, vous pouvez en tracer plusieurs isocontours des données en utilisant les Marching Cubes .

Une autre approche lorsque vous avez des données 4D denses consiste à afficher plusieurs découpe " des données intégrées en 3D. Cela ressemblera à quelque chose comme ceci:

Tranches

Commentaires

  • Le nuage de points 3D coloré ne convient vraiment quaux fonctions continues sur des données 3D. Si le dégradé de la fonction change en douceur, vous pouvez voir un motif sur la dispersion de points. De même, la visualisation du volume en bas fonctionne mieux dans ce scénario également. Si la fonction est très bruyante, vous aurez du mal à voir quoi que ce soit. Si vous avez 4 variables explicatives (comme pour faire lACP ou le clustering) en traçant 3 en coordonnées euclidiennes et la quatrième en utilisant un mappage non linéaire pour colorer en introduisant un biais de perception, ce qui peut quantifié.
  • @DianneCook que ' est vrai. Je suppose que ' est ce que jobtiens en travaillant toujours avec des données volumétriques 3D fluides et continues;)
  • Hé, que ' est ce que la question a demandé% ^)

Réponse

Avez-vous quatre variables quantitatives? Si tel est le cas, essayez des visites, des tracés de coordonnées parallèles, des matrices de nuages de points. Le package tourr (et tourrGui) dans R exécutera des visites, essentiellement une rotation dans des dimensions élevées, vous pouvez choisir de projeter en 1D, 2D ou plus, et il existe un article JSS que vous pouvez lire pour commencer, cité dans le package. Les tracés de coordonnées parallèles et les matrices de nuage de points sont dans le package GGally, ainsi que les matrices de nuage de points dans le package YaleToolkit. Vous pouvez également consulter le http://www.ggobi.org pour des vidéos et plus de documentation sur tout cela.

Si vos données sont entièrement catégoriques, vous devez utiliser des graphiques en mosaïque ou des variantes. Jetez un œil au package productplots dans R, vcd a également des fonctions raisonnables, ou au package ggparallel pour faire léquivalent des tracés de coordonnées parallèles pour les données catégorielles. De plus, je viens de trouver que le paquet extracat a des fonctions pour afficher des données catégorielles.

Jai mal lu la question, à lorigine, parce que je me suis arrêté à la question, et jai négligé de lire la description complète. Similaire à lapproche ci-dessous (coloration des points en 3D), vous pouvez utiliser le brossage lié pour explorer les fonctions définies sur des espaces de grande dimension. Regardez la vidéo ici qui montre faire cela pour une fonction normale multivariée 3D. Le pinceau peint des points avec une densité élevée (valeurs de fonction élevées), puis se déplace vers des valeurs de densité inférieures et inférieures (valeurs de fonction faibles). Les emplacements où la fonction est échantillonnée sont affichés dans un nuage de points rotatif 3D, en utilisant la visite guidée, qui pourrait également être utilisé pour examiner des domaines de dimension 4, 5 ou plus.

Réponse

Essayez Chernoff faces . Lidée est dattacher les variables aux traits du visage. Par exemple, la taille du sourire serait une variable, la rondeur du visage en est une autre etc. Aussi ridicule que cela puisse paraître, cela peut fonctionner si vous trouvez une façon intelligente de mapper des variables à des caractéristiques.

Autre est de montrer les projections 2D du diagramme de phase 3-d. Disons que vous avez x1, x2, x3, x4 vos variables.Pour chaque valeur de x4, dessinez un graphique en trois dimensions de (x1, x2, x3) points et connectez les points. Cela fonctionne mieux lorsque x4 est commandé, par exemple cest la date ou lheure.

MISE À JOUR: Vous pouvez également essayer des graphiques à bulles. Trois dimensions correspondraient à des cartes cartésiennes habituelles x, y, z et la 4ème dimension correspondrait à la taille du point de la bulle.

Vous pouvez essayer lanimation, cest-à-dire utiliser le temps comme quatrième dimension.

Également une combinaison de bulle et danimation: x, y, bulle et temps.

Aussi, lié à Chernoff est glyph plot , ce qui peut sembler un peu plus sérieux. Ce sont des étoiles dont la longueur des rayons est proportionnelle à des valeurs variables.

Commentaires

  • Merci pour la réponse. Il semble que la deuxième option soit possible pour mon problème. Je pense que le premier ne semble pas si sérieux pour un document de recherche. Fondamentalement, jaimerais que lintrigue puisse révéler une tendance ou une influence de trois facteurs sur la valeur (quatrième dimension).
  • Les visages de Chernoff ont été utilisés dans des recherches sérieuses, afaik.
  • Les visages de Chernoff peuvent être extrêmement utile, en particulier lorsque la dimensionnalité est denviron 10-20 variables. Pour quatre dimensions, ils ne sont pas ' aussi efficaces que d’autres types de représentations graphiques.
  • Les visages chernoff sont une idée terrible! si vous devez utiliser un diagramme dicônes, utilisez un diagramme en étoile. Si vous avez un très petit ensemble de données, cela peut être utile, mais essayez de tracer 1000 icônes et voyez si vous pouvez vraiment voir quelque chose!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *