Quais são algumas opções populares para visualizar dados quadridimensionais?

Digamos que eu tenha os seguintes dados quadridimensionais, onde os três primeiros podem ser considerados como coordenadas e o último pode ser considerado como valores.

c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 

Como visualizar melhor o efeito das três primeiras coordenadas no último valor?

Estou ciente de três métodos.

Um é o gráfico 3D para as três primeiras coordenadas com o tamanho dos pontos como o valor quatro. Mas não é tão fácil ver a tendência nos dados.

Outra é usar uma série de gráficos 3D, cada um com uma coordenada fixa. insira a descrição da imagem aqui

Outro pode ser os chamados “gráficos de treliça” na rede de R. Não é certo que seja para esse propósito, mas parece que sim. insira a descrição da imagem aqui

Comentários

  • Você precisa de uma tela estática (por exemplo, para um artigo)?

Resposta

Se as três primeiras forem apenas coordenadas espaciais e os dados forem esparsos, você pode simplesmente fazer um gráfico de dispersão 3D com pontos de tamanhos ou cores diferentes para o valor.

É algo como este: Dispersão
(fonte: gatech.edu )

Se os seus dados se destinam a ser contínuos por natureza e existem em uma grade de treliça, você pode plotar vários isocontornos dos dados usando Cubos de marcha .

Outra abordagem quando você tem dados 4D densos é exibir vários fatias " dos dados incorporados em 3D. Será algo parecido com isto:

Fatias

Comentários

  • O gráfico de dispersão 3D colorido só é adequado para funções contínuas em dados 3D. Se o gradiente da função mudar suavemente, você poderá ver algum padrão na dispersão do ponto. Da mesma forma, a visualização do volume na parte inferior também funciona melhor neste cenário. Se a função for muito barulhenta, você terá dificuldade em ver qualquer coisa. Se você tiver 4 variáveis explicativas (como para fazer PCA ou clustering), plotando 3 em coordenadas euclidianas e a 4ª usando algum mapeamento não linear para colorir na introdução de algum viés perceptual, que pode ' ser quantificado.
  • @DianneCook that ' é verdadeiro. Acho que ' é o que ganho por trabalhar sempre com dados volumétricos 3D suaves e contínuos;)
  • Ei, isso ' é o que a pergunta perguntou% ^)

Resposta

Você tem quatro variáveis quantitativas? Em caso afirmativo, tente passeios, gráficos de coordenadas paralelas, matrizes de gráficos de dispersão. O pacote tourr (e tourrGui) em R executará passeios, basicamente rotação em dimensões altas, você pode escolher projetar em 1D, 2D ou mais, e há um artigo JSS que você pode ler para começar citado no pacote. Gráficos de coordenadas paralelas e matrizes de gráfico de dispersão estão no pacote GGally, e matrizes de gráfico de dispersão também estão no pacote YaleToolkit. Você também pode consultar http://www.ggobi.org para vídeos e mais documentação sobre todos eles.

Se os seus dados forem totalmente categóricos, você deve usar gráficos de mosaico ou variantes. Dê uma olhada no pacote productplots em R, também vcd tem algumas funções razoáveis, ou o pacote ggparallel para fazer o equivalente a gráficos coordenados paralelos para dados categóricos. Além disso, acabei de descobrir que o pacote extracat tem algumas funções para exibir dados categóricos.

Eu interpretei mal a pergunta, originalmente, porque parei na pergunta e deixei de ler a descrição completa. Semelhante à abordagem abaixo (pontos de colorir em 3D), você pode usar escovagem vinculada para explorar funções definidas em espaços de grande dimensão. Dê uma olhada no vídeo aqui que mostra como fazer isso para uma função normal multivariada 3D. O pincel pinta pontos com alta densidade (valores de função altos) e, em seguida, move para valores de densidade cada vez mais baixos (valores de função baixos). Os locais onde a função é amostrada são mostrados em um gráfico de dispersão giratório 3D, usando o passeio, que pode ser usado para observar 4, 5 ou domínios dimensionais superiores também.

Resposta

Experimente Chernoff faces . A ideia é anexar as variáveis às características faciais. Por exemplo, o tamanho do sorriso seria uma variável, a redondeza do rosto é outra etc. Por mais ridículo que pareça, isso pode realmente funcionar se você descobrir uma maneira inteligente de mapear variáveis para características.

Outro maneira é mostrar projeções 2-d do diagrama de fases 3-d. Digamos que você tenha x1, x2, x3, x4 suas variáveis.Para cada valor de x4, desenhe um gráfico 3-d de (x1, x2, x3) pontos e conecte os pontos. Isso funciona melhor quando x4 é pedido, por exemplo, é a data ou hora.

ATUALIZAÇÃO: você também pode tentar gráficos de bolha. Três dimensões seriam normalmente x, y, z cartesiano e a 4ª dimensão seria o tamanho do ponto de bolha.

Você pode tentar a animação, ou seja, usar o tempo como quarta dimensão.

Também uma combinação de bolha e animação: x, y, bolha e tempo.

Além disso, relacionado a Chernoff é o gráfico de glifo , que pode parecer um pouco mais sério. São estrelas com comprimento dos raios proporcionais aos valores variáveis.

Comentários

  • Obrigado pela resposta. Parece que a segunda opção é possível para o meu problema. Acho que o primeiro não parece tão sério para um artigo de pesquisa. Basicamente, gostaria que o gráfico pudesse revelar alguma tendência ou influência de três fatores no valor (quarta dimensão).
  • Rostos de Chernoff foram usados em pesquisas sérias, afaik.
  • Rostos de Chernoff podem ser extraordinariamente útil, especialmente quando a dimensionalidade está em torno de 10-20 variáveis. Para quatro dimensões, eles não são ' t tão eficazes quanto outros tipos de representações gráficas.
  • rostos de chernoff são uma ideia terrível! se você tiver que usar um gráfico de ícone, use um gráfico de estrela. Se você tiver um conjunto de dados muito pequeno, eles podem ser úteis, mas tente representar graficamente 1000 ícones e veja se consegue realmente ver alguma coisa!

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *