Analisar uma tabela genotípica 2X2 em vez de uma tabela 3X2

Esta pode ser uma pergunta simples para o pessoal experiente em genética estatística. Eu me empenhei nisso fazendo uma análise para uma amiga que estava trabalhando em uma tarefa de bioinformática na qual eu a estava ajudando. Uma oportunidade para eu aprender coisas novas.

Para o contexto: eu tenho uma tabela de frequências de genótipos para casos e controles saudáveis em diferentes etnias. Minha hipótese é que a gravidade da doença está associada ao genótipo. Ou seja, uma mutação de GG para GA ou AA pode aumentar a gravidade da doença.

Identifiquei alguns testes para tendências que são interessantes para minha pergunta: o teste de tendência Cochran-Armitage e o qui-quadrado teste para explorar a independência dos genótipos.

Especificamente, gosto de ser corrigido / criticado / aconselhado na minha estratégia de análise. A função R prop.trend.test () pode ser usada para o mesmo propósito do teste CA se eu tiver uma tabela de genótipos 2X2 (não alelo) em vez de uma tabela 3X2?

Então, para gentoypes GG (case = 41, controle = 29), GA (n = 1,2) e AA (n = 0,2). Quero ver se existe uma tendência associada apenas ao homozigoto AA, posso fazer uma tabela 2X2 da seguinte maneira:

 Control Case RowTotals AA 0 2 2 GA+GG 42 31 73 colTotals 42 33 75 

Então faça prop.trend. teste (c (2,31), c (2,73)) usando os totais das linhas.

Da mesma forma, se eu quiser ver se o envolvimento do alelo A mostra uma tendência, posso modificar a tabela como segue e fazer prop.trend.test (c (29,4), c (70,5)) :

 Control Case RowTotals GG 41 29 70 GA+AA 1 4 5 colTotals 42 33 75 

Os genótipos em casos e controles estão em equilíbrio de Hardy-Weinberg. A doença que estou testando tem uma prevalência baixa, não sei se a doença é multiplicativa e, portanto, estou usando genótipos em vez de frequências de alelos. Li isso em um artigo que sugere que essas três suposições devem ser válidas para trabalhar com contagens alélicas. Além disso, o tamanho da minha amostra é muito pequeno, consistindo apenas em 34 casos e 41 controles.

Minha ideia faz sentido?

Comentários

  • Você tentou meu método de prop.trend.test mencionado na resposta abaixo?

Resposta

Desde há 41, 1 e 0 casos de um total de 70, 3 e 2 indivíduos para GG, AG e AA, respectivamente, prop.trend.test pode ser feito da seguinte forma:

> prop.trend.test(c(41,1,0), c(70,3,2)) Chi-squared Test for Trend in Proportions data: c(41, 1, 0) out of c(70, 3, 2) , using scores: 1 2 3 X-squared = 3.3444, df = 1, p-value = 0.06743 

Mostra que há uma tendência de associação significativa de redução do risco de doença com o alelo A, uma vez que a proporção de casos está reduzindo de GG para AG para AA (de 59% para 33% para 0%) .

Editar: conforme discutido nos comentários, o teste Cochran-Armitage é o teste preferido para esta situação ( https://en.wikipedia.org/wiki/Cochran%E2%80%93Armitage_test_for_trend#Application_to_genetics )

> CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1.4139, p-value = 0.1574 alternative hypothesis: two.sided 

Também se deve ser capaz de fazer isso depois de combinar grupos de alelos A:

> CA_df<-data.frame(case=c(41,1), control=c(29,4)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1, p-value = 0.3173 alternative hypothesis: two.sided 

Comentários

  • Tha nks, eu usei prop.trend.test () dessa forma que funciona bem. Eu queria dar um passo adiante e aprender sobre a legitimidade de modificar as tabelas para 2X2 para enfatizar a tendência do genótipo AA em casos, bem como a tendência combinada de AA / GA em casos no contexto do WT GG.
  • O resultado que obtenho com prop.trend.test () é significativamente diferente em comparação com o que obtenho com o teste Cochrane-Armitage, que é incompreensível. Como isso pode ser explicado. Aqui está meu código library(coin) CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) independence_test(control ~ case, data=CA_df)
  • Concordo que o teste Cochran-Armitage deve ser feito. en.wikipedia.org/wiki/… Eu editei minha resposta.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *