Řekněme, že mám následující čtyřrozměrná data, přičemž první tři lze považovat za souřadnice a poslední za hodnoty.
c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95
Jak lépe vizualizovat účinek prvních tří souřadnic na poslední hodnotu?
Znám tři metody.
Jedním z nich je 3D graf pro první tři souřadnice s velikostí bodů jako čtyřmi hodnotami. Ale není to tak že je snadno vidět trend v datech.
Další používá řadu 3D grafů, z nichž každý má pevnou souřadnici.
Dalším může být takzvaný „mřížovkový graf“ v mřížce R. Není tomu tak, ale je to tak.
Komentáře
- Potřebujete statické zobrazení (např. pro papír)?
Odpověď
Pokud jsou první tři jen prostorové souřadnice a data jsou řídká, můžete jednoduše udělat 3D bodový graf s různě velkými nebo barevnými body pro hodnotu.
Vypadá podobně this:
(zdroj: gatech.edu )
Pokud mají být vaše data v přírodě spojitá a existují v mřížkové mřížce, můžete vykreslit několik izokonty dat pomocí pochodových kostek .
Dalším přístupem, pokud máte hustá 4D data, je zobrazení několika 2D " řezy " dat vložených ve 3D. Bude to vypadat asi takto:
Komentáře
- Barevný 3D bodový graf je vhodný pouze pro spojité funkce na 3D datech. Pokud se gradient funkce plynule mění, pak můžete vidět nějaký vzor přes bodový rozptyl. Podobně i v tomto scénáři nejlépe funguje vizualizace svazku dole. Pokud je funkce velmi hlučná, je těžké něco vidět. Pokud máte 4 vysvětlující proměnné (například pro vytváření PCA nebo shlukování), které vykreslují 3 v euklidovských souřadnicích a čtvrtá používá nelineární mapování k barvě při zavádění nějakého vnímavého zkreslení, které ' t kvantifikováno.
- @DianneCook, že ' je pravda. Myslím, že ' je to, co dostávám za to, že vždy pracuji s plynulými, plynulými 3D objemovými daty;)
- Hej, že ' s co se dotaz zeptal% ^)
Odpověď
Máte čtyři kvantitativní proměnné? Pokud ano, zkuste prohlídky, paralelní souřadnicové grafy, matice scatterplot. Balíček tourr (a tourrGui) v R bude spouštět prohlídky, v zásadě rotace ve vysokých rozměrech, můžete si vybrat promítnout do 1D, 2D nebo více a v balíčku je uveden papír JSS, který si můžete přečíst, abyste mohli začít. Paralelní souřadnicové grafy a matice scatterplot jsou v balíčku GGally, také matice scatterplot jsou v balíčku YaleToolkit. Můžete se také podívat na http://www.ggobi.org videí a další dokumentace ke všem těmto věcem.
Pokud jsou vaše údaje zcela kategorické, měli byste použít mozaikové grafy nebo varianty. Podívejte se na balíček productplots v R, také vcd má některé rozumné funkce, nebo balíček ggparallel pro ekvivalent paralelních souřadnicových grafů pro kategorická data. Právě jsem také zjistil, že balíček extracat má některé funkce pro zobrazení kategorických dat.
Původně jsem otázku špatně přečetl, protože jsem se nad otázkou zastavil a nedbal jsem si přečíst celý popis. Podobně jako v níže uvedeném postupu (zbarvení bodů ve 3D) můžete pomocí propojeného kartáče prozkoumat funkce definované ve výškových prostorech. Podívejte se na video zde , které ukazuje, jak to udělat pro normální vícerozměrnou funkci 3D. Štětec namaluje body s vysokou hustotou (vysoké hodnoty funkcí) a poté se pohybuje na nižší a nižší hodnoty hustoty (nízké hodnoty funkce). Místa, kde je funkce vzorkována, jsou zobrazena ve 3D rotujícím bodovém grafu pomocí prohlídky, kterou lze použít také ke sledování domén 4, 5 nebo vyšších dimenzí.
Odpovědět
Vyzkoušejte černoffské tváře . Cílem je připojit proměnné k rysům obličeje. Například velikost úsměvu by byla jedna proměnná, kulatost obličeje je jiná atd. Jakkoli to zní směšně, ve skutečnosti to může fungovat, pokud najdete chytrý způsob mapování proměnných na prvky.
Další způsob je ukázat 2-d projekce 3-d fázového diagramu. Řekněme, že máte své proměnné x1, x2, x3, x4.Pro každou hodnotu x4 nakreslete 3-d graf bodů (x1, x2, x3) a spojte body. To funguje nejlépe, když je objednáno x4, např. je to datum nebo čas.
AKTUALIZACE: Můžete také zkusit bublinové grafy. Tři dimenze by byly obvyklé kartézské x, y, z a čtvrtá dimenze by měla velikost bublinového bodu.
Můžete zkusit animaci, tj. použít čas jako čtvrtou dimenzi.
Také kombinace bubliny a animace: x, y, bublina a čas.
Také související s Černoffem je glyfový graf , který může vypadat trochu vážněji. Jsou to hvězdy s délkou paprsků úměrné proměnným hodnotám.
Komentáře
- Děkuji za odpověď. Zdá se, že druhá možnost je pro můj problém možná. Myslím, že první z nich není pro výzkumný papír tak závažný. V zásadě bych chtěl, aby děj mohl odhalit nějaký trend nebo vliv tří faktorů na hodnotu (čtvrtá dimenze).
- Černoffovy tváře byly použity ve vážném výzkumu, afaik.
- Černoffovy tváře mohou být mimořádně užitečné, zvláště když je rozměrnost kolem 10-20 proměnných. Pro čtyři dimenze nejsou ' tak efektivní jako jiné druhy grafických zobrazení.
- černošské tváře jsou hrozný nápad! pokud musíte použít graf ikon, použijte graf hvězd. Pokud máte opravdu malou sadu dat, může to být užitečné, ale zkuste vykreslit 1000 ikon a zjistěte, zda něco opravdu vidíte!