Powiedzmy, że mam następujące dane czterowymiarowe, gdzie pierwsze trzy można uznać za współrzędne, a ostatnią za wartości.
c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95
Jak lepiej zwizualizować wpływ pierwszych trzech współrzędnych na ostatnią wartość?
Znam trzy metody.
Jedna to wykres 3D dla pierwszych trzech współrzędnych z rozmiarem punktów jako czterema wartościami. Ale tak nie jest tak łatwo zobaczyć trend w danych.
Innym jest użycie serii wykresów 3D, z których każdy ma ustaloną współrzędną.
Innym może być tak zwany „wykres kratowy” w kracie R. Nie sur e, jeśli jest do tego celu, ale na to wygląda.
Komentarze
- Czy potrzebujesz statycznego wyświetlacza (np. na papier)?
Odpowiedź
Jeśli pierwsze trzy to tylko współrzędne przestrzenne, a dane są skąpe, możesz po prostu wykonać wykres punktowy 3D z punktami o różnej wielkości lub kolorze.
Wygląda jak to:
(źródło: gatech.edu )
Jeśli dane mają być z natury ciągłe i istnieją w siatce kratowej, możesz wykreślić kilka izokontury danych przy użyciu kostek marszowych .
Innym podejściem w przypadku gęstych danych 4D jest wyświetlenie kilku " plasterki " danych osadzonych w 3D. Będzie to wyglądało mniej więcej tak:
Komentarze
- Kolorowy wykres rozrzutu 3D nadaje się naprawdę tylko do funkcji ciągłych na danych 3D. Jeśli gradient funkcji zmienia się płynnie, możesz zobaczyć wzór na rozproszeniu punktów. Podobnie wizualizacja objętości na dole działa najlepiej w tym scenariuszu. Jeśli funkcja jest bardzo głośna, trudno będzie cokolwiek zobaczyć. Jeśli masz 4 zmienne objaśniające (np. Do wykonywania PCA lub grupowania), wykreślając 3 we współrzędnych euklidesowych, a czwartą wykorzystując pewne nieliniowe mapowanie do koloru, wprowadzając pewne nastawienie percepcyjne, które może ' nie być ilościowo.
- @DianneCook, że ' jest prawdą. Wydaje mi się, że ' to to, co otrzymuję za ciągłą pracę z płynnymi, ciągłymi danymi wolumetrycznymi 3D;)
- Hej, że ' o co pytał quesiton% ^)
Odpowiedź
Czy masz cztery zmienne ilościowe? Jeśli tak, wypróbuj trasy, wykresy współrzędnych równoległych, macierze wykresów rozrzutu. Pakiet tourr (i tourrGui) w R będzie zawierał wycieczki, w zasadzie rotację w dużych wymiarach, możesz wybrać rzutowanie na 1D, 2D lub więcej, a jest tam artykuł JSS, który możesz przeczytać, aby rozpocząć, cytowany w pakiecie. Równoległe wykresy współrzędnych i macierze wykresów rozrzutu znajdują się w pakiecie GGally, również macierze wykresu rozrzutu znajdują się w pakiecie YaleToolkit. Możesz również zajrzeć do http://www.ggobi.org , aby znaleźć filmy i więcej dokumentacji na ich temat.
Jeśli Twoje dane są całkowicie kategorialne, powinieneś użyć wykresów mozaiki lub wariantów. Spójrz na pakiet productplots w R, również vcd ma kilka rozsądnych funkcji, lub pakiet ggparallel, aby zrobić odpowiednik równoległych wykresów współrzędnych dla danych kategorialnych. Właśnie odkryłem, że pakiet extracat ma pewne funkcje do wyświetlania danych kategorycznych.
Początkowo źle odczytałem pytanie, ponieważ zatrzymałem się na pytaniu i nie przeczytałem pełnego opisu. Podobnie jak w poniższym podejściu (punkty kolorowania w 3D) możesz użyć połączonego pędzla do eksploracji funkcji zdefiniowanych w przestrzeniach o dużych wymiarach. Obejrzyj wideo tutaj , które pokazuje, jak to zrobić dla normalnej funkcji 3D na wielu odmianach. Pędzel maluje punkty o dużej gęstości (wysokie wartości funkcji), a następnie przesuwa się na coraz niższe wartości gęstości (niskie wartości funkcji). Lokalizacje, w których funkcja jest próbkowana, są pokazane na trójwymiarowym obrotowym wykresie rozrzutu, przy użyciu wycieczki, która może być również wykorzystana do spojrzenia na domeny 4, 5 lub wyższego wymiaru.
Odpowiedź
Wypróbuj Chernoff Faces . Chodzi o to, aby dołączyć zmienne do rysów twarzy. Na przykład rozmiar uśmiechu byłby jedną zmienną, krągłość twarzy inną itd. Choć brzmi to śmiesznie, może to faktycznie zadziałać, jeśli znajdziesz sprytny sposób mapowania zmiennych na cechy.
Inny sposobem jest pokazanie dwuwymiarowych rzutów trójwymiarowego schematu fazowego. Powiedzmy, że masz x1, x2, x3, x4 swoje zmienne.Dla każdej wartości x4 narysuj trójwymiarowy wykres punktów (x1, x2, x3) i połącz punkty. Działa to najlepiej, gdy zamówiono x4, np. to jest data lub godzina.
AKTUALIZACJA: Możesz także wypróbować wykresy bąbelkowe. Trzy wymiary oznaczałyby zwykłe kartezjańskie x, y, z, a czwarty wymiar byłby wielkością punktu bąbelkowego.
Możesz spróbować animacji, tj. użyć czasu jako czwartego wymiaru.
Również połączenie bańki i animacji: x, y, bąbelek i czas.
Także w odniesieniu do Chernoffa to wykres glifowy , który może wyglądać nieco poważniej. Są to gwiazdy o długości promieni proporcjonalnej do wartości zmiennych.
Komentarze
- Dziękuję za odpowiedź. Wydaje się, że druga opcja jest możliwa dla mojego problemu. Myślę, że pierwszy wydaje się nie być tak poważny jak na artykuł badawczy. Zasadniczo chciałbym, aby wykres mógł ujawnić pewien trend lub wpływ trzech czynników na wartość (czwarty wymiar).
- Twarze Chernoffa były używane w poważnych badaniach, afaik.
- Twarze Chernoffa mogą być niezwykle przydatne, zwłaszcza gdy wymiarowość wynosi około 10–20 zmiennych. W czterech wymiarach nie są one ' tak skuteczne, jak inne rodzaje reprezentacji graficznych.
- Twarze czarnowa to okropny pomysł! jeśli musisz użyć wykresu ikon, użyj wykresu gwiazd. Jeśli masz naprawdę mały zestaw danych, mogą one być przydatne, ale spróbuj wykreślić 1000 ikon i sprawdź, czy naprawdę możesz coś zobaczyć!