Analysera en genotypisk 2X2-tabell istället för en 3X2-tabell

Detta kan vara en enkel fråga till erfarna statistiska genetikfolk. Jag har grävt in i detta genom att göra en analys för en vän på sidelinjen av en bioinformatikuppgift som jag hjälpte henne med. En möjlighet för mig att lära mig nya saker.

För sammanhang: Jag har en tabell med genotypfrekvenser för fall och hälsosamma kontroller över olika etniciteter. Min hypotes är att en sjukdoms svårighetsgrad är associerad med genotypen. En mutation från GG till GA eller AA kan öka sjukdomens svårighetsgrad.

Jag identifierade några tester för trender som är intressanta för min fråga: Trendtestet Cochran-Armitage och chi-kvadrat testa för att utforska genotypernas oberoende.

Specifikt, jag gillar att stå korrigerad / kritiserad / rådad om min analysstrategi. Kan R-funktionen prop.trend.test () användas för samma ändamål som CA-test om jag har en 2X2-genotyptabell (inte allel) istället för en 3X2-tabell?

Så för gentoypes GG (fall = 41, kontroll = 29), GA (n = 1,2) och AA (n = 0,2). Jag vill se om det bara finns en trend associerad med AA-homozygoten, jag kan göra en 2X2-tabell enligt följande:

 Control Case RowTotals AA 0 2 2 GA+GG 42 31 73 colTotals 42 33 75 

Gör sedan prop.trend. testa (c (2,31), c (2,73)) med hjälp av radsumman.

På samma sätt Om jag vill se om allel A-engagemanget visar en trend kan jag ändra tabellen enligt följande och göra prop.trend.test (c (29,4), c (70,5)) :

 Control Case RowTotals GG 41 29 70 GA+AA 1 4 5 colTotals 42 33 75 

Genotyperna i fall och kontroller finns i Hardy-Weinberg-jämvikt. Sjukdomen jag testar har låg prevalens, jag vet inte om sjukdomen är multiplikativ och därför använder jag genotyper istället för allelfrekvenser, jag läste att från ett papper som tyder på att dessa tre antaganden måste hålla för att arbeta med allelantal. Min provstorlek är också för liten och består endast av 34 fall och 41 kontroller.

Är min idé vettig?

Kommentarer

  • Testade du min metod för prop.trend.test som nämns i svaret nedan?

Svar

Eftersom det finns 41, 1 och 0 fall av totalt 70, 3 och 2 ämnen för GG, AG respektive AA, prop.trend.test kan göras enligt följande:

> prop.trend.test(c(41,1,0), c(70,3,2)) Chi-squared Test for Trend in Proportions data: c(41, 1, 0) out of c(70, 3, 2) , using scores: 1 2 3 X-squared = 3.3444, df = 1, p-value = 0.06743 

Det visar att det finns en trend mot signifikant samband för att minska risken för sjukdom med A-allel, eftersom andelen fall minskar från GG till AG till AA (från 59% till 33% till 0%) .

Redigera: Som diskuterat i kommentarer är Cochran-Armitage-testet det föredragna testet för denna situation ( https://en.wikipedia.org/wiki/Cochran%E2%80%93Armitage_test_for_trend#Application_to_genetics )

> CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1.4139, p-value = 0.1574 alternative hypothesis: two.sided 

Man borde också kunna göra det efter att ha kombinerat A-allelgrupper:

> CA_df<-data.frame(case=c(41,1), control=c(29,4)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1, p-value = 0.3173 alternative hypothesis: two.sided 

Kommentarer

  • Tha nks, jag använde prop.trend.test () på det sättet som fungerar bra. Jag ville ta ett steg längre och lära mig om legitimiteten att ändra tabellerna till 2X2 för att betona AA-genotyptrenden i fall såväl som den kombinerade AA / GA-trenden i fall mot bakgrund av WT GG.
  • Resultatet jag får från prop.trend.test () är väsentligt annorlunda jämfört med vad jag får från Cochrane-Armitage-testet som är otrolig. Hur kan det förklaras. Här är min kod library(coin) CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) independence_test(control ~ case, data=CA_df)
  • Jag håller med om att Cochran-Armitage-testet ska göras. sv.wikipedia.org/wiki/… Jag har redigerat mitt svar.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *