Was sind einige beliebte Optionen für die Visualisierung von 4-dimensionalen Daten?

Angenommen, ich habe die folgenden vierdimensionalen Daten, wobei die ersten drei als Koordinaten und die letzten als Werte betrachtet werden können.

c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 

Wie kann die Auswirkung der ersten drei Koordinaten auf den letzten Wert besser visualisiert werden?

Mir sind drei Methoden bekannt.

Eine ist die 3D-Darstellung der ersten drei Koordinaten mit der Größe der Punkte als vier Werte. Dies ist jedoch nicht der Fall So einfach ist es, den Trend in den Daten zu erkennen.

Ein anderer verwendet eine Reihe von 3D-Plots, von denen jedes eine feste Koordinate hat. Geben Sie hier die Bildbeschreibung ein

Ein anderes kann ein sogenannter „Gittergraph“ im Gitter von R sein. Nicht sicher, dass dies für diesen Zweck vorgesehen ist, aber es scheint so. Geben Sie hier die Bildbeschreibung ein

Kommentare

  • Benötigen Sie eine statische Anzeige (z. B. für ein Papier)?

Antwort

Wenn die ersten drei nur räumliche Koordinaten sind und die Daten spärlich sind, können Sie einfach ein 3D-Streudiagramm mit unterschiedlich großen oder farbigen Punkten für den Wert erstellen.

Sieht ungefähr so aus dies: Streuung
(Quelle: gatech.edu )

Wenn Ihre Daten kontinuierlicher Natur sein sollen und in einem Gitterraster vorhanden sind, können Sie mehrere zeichnen Isokonturen der Daten mit Marching Cubes .

Ein anderer Ansatz bei dichten 4D-Daten besteht darin, mehrere 2D schneidet " der in 3D eingebetteten Daten. Es sieht ungefähr so aus:

Slices

Kommentare

  • Das farbige 3D-Streudiagramm eignet sich nur für kontinuierliche Funktionen von 3D-Daten. Wenn sich der Gradient der Funktion gleichmäßig ändert, können Sie ein Muster über die Punktstreuung sehen. In ähnlicher Weise funktioniert die Volumenvisualisierung unten auch in diesem Szenario am besten. Wenn die Funktion sehr laut ist, fällt es Ihnen schwer, etwas zu sehen. Wenn Sie 4 erklärende Variablen haben (wie zum Beispiel für PCA oder Clustering), zeichnen Sie 3 in euklidischen Koordinaten und die vierte unter Verwendung einer nichtlinearen Zuordnung zur Farbe, um eine Wahrnehmungsverzerrung einzuführen, die ' sein kann quantifiziert.
  • @DianneCook, dass ' wahr ist. Ich denke, dass ' das ist, was ich bekomme, wenn ich immer mit glatten, kontinuierlichen 3D-Volumendaten arbeite;)
  • Hey, das ' s, was die Frage gestellt hat% ^)

Antwort

Haben Sie vier quantitative Variablen? Wenn ja, versuchen Sie es mit Touren, parallelen Koordinatendiagrammen und Streudiagrammmatrizen. Das tourr- (und tourrGui-) Paket in R führt Touren durch, im Grunde genommen Rotation in hohen Dimensionen. Sie können wählen, ob Sie in 1D, 2D oder mehr projizieren möchten, und es gibt ein JSS-Papier, das Sie lesen können, um mit dem Paket zu beginnen. Parallele Koordinatendiagramme und Streudiagrammmatrizen sind im GGally-Paket enthalten, ebenso wie Streudiagrammmatrizen im YaleToolkit-Paket. Sie können sich auch die http://www.ggobi.org ansehen, um Videos und weitere Dokumentationen zu all diesen Themen zu erhalten.

Wenn Ihre Daten vollständig kategorisch sind, sollten Sie Mosaikdiagramme oder Varianten verwenden. Schauen Sie sich das Produktplot-Paket in R an, außerdem hat vcd einige sinnvolle Funktionen, oder das ggparallel-Paket, um das Äquivalent von parallelen Koordinatendiagrammen für kategoriale Daten zu erstellen. Ich habe gerade festgestellt, dass das extracat-Paket einige Funktionen zum Anzeigen kategorialer Daten enthält.

Ich habe die Frage ursprünglich falsch verstanden, weil ich bei der Frage stehen geblieben bin und es versäumt habe, die vollständige Beschreibung zu lesen. Ähnlich wie im folgenden Ansatz (Farbpunkte in 3D) können Sie mithilfe des verknüpften Bürstens Funktionen untersuchen, die in hochdimensionalen Räumen definiert sind. Schauen Sie sich das Video hier an, das dies für eine multivariate 3D-Normalfunktion zeigt. Der Pinsel malt Punkte mit hoher Dichte (hohe Funktionswerte) und bewegt sich dann zu immer niedrigeren Dichtewerten (niedrige Funktionswerte). Die Orte, an denen die Funktion abgetastet wird, werden in einem rotierenden 3D-Streudiagramm unter Verwendung der Tour angezeigt, mit der auch Domänen mit 4, 5 oder höheren Dimensionen betrachtet werden können.

Antwort

Versuchen Sie Chernoff-Gesichter . Die Idee ist, die Variablen an Gesichtsmerkmale anzuhängen. Zum Beispiel würde die Größe des Lächelns eine Variable sein, die Rundheit des Gesichts eine andere usw. So lächerlich es auch klingen mag, dies kann tatsächlich funktionieren, wenn Sie eine clevere Möglichkeit finden, Variablen Features zuzuordnen.

Eine andere Weg ist es, 2D-Projektionen des 3D-Phasendiagramms zu zeigen. Angenommen, Sie haben x1, x2, x3, x4 Ihre Variablen.Zeichnen Sie für jeden Wert von x4 einen 3D-Graphen von (x1, x2, x3) Punkten und verbinden Sie die Punkte. Dies funktioniert am besten, wenn x4 bestellt wird, z. Es ist Datum oder Uhrzeit.

UPDATE: Sie können auch Blasendiagramme ausprobieren. Drei Dimensionen würden normalerweise kartesisches x, y, z und die vierte Dimension die Größe des Blasenpunkts.

Sie können Animation ausprobieren, dh Zeit als vierte Dimension verwenden.

Auch eine Kombination aus Blase und Animation: x, y, Blase und Zeit.

Auch im Zusammenhang mit Chernoff ist Glyphenplot , der möglicherweise etwas ernster aussieht. Es handelt sich um Sterne mit einer Strahlenlänge, die proportional zu variablen Werten ist.

Kommentare

  • Vielen Dank für die Antwort. Es scheint, dass die zweite Option für mein Problem möglich ist. Ich denke, der erste scheint für eine Forschungsarbeit nicht so ernst zu sein. Grundsätzlich möchte ich, dass die Darstellung einen Trend oder Einfluss von drei Faktoren auf den Wert (vierte Dimension) aufzeigt.
  • Chernoff-Gesichter wurden in ernsthaften Forschungen verwendet, afaik.
  • Chernoff-Gesichter können außerordentlich nützlich sein, insbesondere wenn die Dimensionalität etwa 10 bis 20 Variablen beträgt. Für vier Dimensionen sind sie ' nicht so effektiv wie andere Arten von grafischen Darstellungen.
  • chernoff-Gesichter sind eine schreckliche Idee! Wenn Sie ein Icon-Plot verwenden müssen, verwenden Sie ein Starplot. Wenn Sie einen wirklich kleinen Datensatz haben, können diese nützlich sein. Zeichnen Sie jedoch 1000 Symbole und prüfen Sie, ob Sie wirklich etwas sehen können!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.