Spuneți că am următoarele patru date dimensionale, în care primele trei pot fi considerate coordonate, iar ultima poate fi considerată valori.
c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95
Cum se vizualizează mai bine efectul primelor trei coordonate asupra ultimei valori?
Sunt conștient de trei metode.
Una este reprezentarea graficului 3D pentru primele trei coordonate cu dimensiunea punctelor ca valoare a celor patru. Dar nu este atât de ușor de văzut tendința în date.
Un altul folosește o serie de grafice 3D, fiecare cu o coordonată fixată.
Un altul ar putea fi un numit „grafic de spalier” în zăbrele lui R. Nu e eif este în acest scop, dar se pare.
Comentarii
- Aveți nevoie de un afișaj static (de exemplu, pentru o hârtie)?
Răspuns
Dacă primele trei sunt doar coordonate spațiale și datele sunt rare, puteți face pur și simplu un grafic scatter 3D cu puncte de dimensiuni diferite sau colorate pentru valoare.
Arată ceva de genul aceasta:
(sursa: gatech.edu )
Dacă datele dvs. sunt destinate a fi continue și există pe o grilă de rețea, puteți parcela mai multe izocontururile datelor folosind Cuburi de marș .
O altă abordare atunci când aveți date 4D dense este să afișați mai multe 2D " felii " din datele încorporate în 3D. Va arăta cam așa:
Comentarii
- Dispozitivul de împrăștiere 3D colorat este adecvat doar pentru funcții continue pe date 3D. Dacă gradientul funcției se modifică ușor, atunci puteți vedea un anumit model pe dispersia punctelor. În mod similar, vizualizarea volumului în partea de jos funcționează cel mai bine și în acest scenariu. Dacă funcția este foarte zgomotoasă, veți avea dificultăți în a vedea ceva. Dacă aveți 4 variabile explicative (cum ar fi pentru a face PCA sau clustering), graficul 3 în coordonatele euclidiene și al patrulea folosind o cartografiere neliniară a culorilor în introducerea unor prejudecăți perceptive, care poate ' să fie cuantificat.
- @DianneCook că ' este adevărat. Cred că ' este ceea ce obțin pentru lucrul întotdeauna cu date volumetrice 3D continue și netede;)
- Hei, ' s-a întrebat întrebarea% ^)
Răspuns
Aveți patru variabile cantitative? Dacă da, încercați tururi, parcele de coordonate paralele, matrice de diagramă de dispersie. Pachetul tourr (și tourrGui) din R va rula tururi, practic rotație în dimensiuni ridicate, puteți alege să proiectați în 1D, 2D sau mai mult și există o lucrare JSS pe care o puteți citi pentru a începe citată în pachet. Graficele de coordonate paralele și matricile scatterplot sunt în pachetul GGally, de asemenea, matricele scatterplot sunt în pachetul YaleToolkit. De asemenea, puteți consulta http://www.ggobi.org pentru videoclipuri și mai multe documente despre toate acestea.
Dacă datele dvs. sunt complet categorice, ar trebui să utilizați comploturi mozaic sau variante. Aruncați o privire la pachetul productplots din R, de asemenea, vcd are câteva funcții rezonabile sau pachetul ggparallel pentru a face echivalentul graficelor de coordonate paralele pentru date categorice. De asemenea, tocmai am găsit că pachetul extracat are câteva funcții pentru afișarea datelor categorice.
Am citit greșit întrebarea, inițial, deoarece m-am oprit la întrebare și am neglijat să citesc descrierea completă. Similar cu abordarea de mai jos (puncte de colorat în 3D), puteți utiliza periajul legat pentru a explora funcțiile definite pe spații cu dimensiuni ridicate. Aruncați o privire la videoclipul aici care arată că faceți acest lucru pentru o funcție normală 3D multivariantă. Pensula pictează puncte cu densitate mare (valori funcționale ridicate) și apoi se deplasează la valori de densitate tot mai mici (valori funcționale scăzute). Locațiile în care este eșantionată funcția sunt afișate într-un diagramă de împrăștiere rotativă 3D, utilizând turul, care ar putea fi folosit pentru a privi și domenii cu dimensiuni mai mari sau mai mari de 4, 5 sau mai mari. h2>
Încercați fețele Chernoff . Ideea este de a atașa variabilele la trăsăturile feței. De exemplu, dimensiunea zâmbetului ar fi una variabilă, rotunjirea feței este alta, oricât de ridicolă pe cât pare, acest lucru poate funcționa de fapt dacă descoperiți un mod inteligent de a asocia variabilele la caracteristici.
modul este de a arăta proiecții 2-d ale diagramei de fază 3-d. Spuneți că aveți variabilele dvs. x1, x2, x3, x4.Pentru fiecare valoare a lui x4, desenați un grafic 3-d de puncte (x1, x2, x3) și conectați punctele. Acest lucru funcționează cel mai bine când se comandă x4, de ex. este data sau ora.
ACTUALIZARE: Puteți încerca și graficele cu bule. Trei dimensiuni ar fi obișnuite carteziene x, y, z, iar cea de-a patra dimensiune ar avea dimensiunea punctului de bule.
Puteți încerca animația, adică utilizați timpul ca a patra dimensiune.
De asemenea, o combinație de bule și animație: x, y, bule și timp.
De asemenea, legat de Chernoff este grafic glif , care poate părea puțin mai grav. Este „stele cu lungimea razelor proporționale cu valorile variabile.
Comentarii
- Vă mulțumim pentru răspuns. Se pare că a doua opțiune este posibilă pentru problema mea. Cred că primul nu pare atât de grav pentru o lucrare de cercetare. Practic aș vrea ca complotul să dezvăluie o tendință sau o influență a trei factori asupra valorii (a patra dimensiune).
- Fetele Chernoff au fost utilizate în cercetări serioase, afaik.
- Fețele Chernoff pot să fie extraordinar de util, mai ales când dimensionalitatea este în jur de 10-20 de variabile. Pentru patru dimensiuni, acestea nu sunt ' t la fel de eficiente ca și alte tipuri de reprezentări grafice.
- fețele chernoff sunt o idee teribilă! dacă trebuie să folosești un complot cu pictograme, folosește un complot stelar. Dacă aveți un set de date foarte mic, acestea ar putea fi utile, dar încercați să trasați 1000 de pictograme și vedeți dacă puteți vedea cu adevărat ceva!