Analyse af en genotypisk 2X2-tabel i stedet for en 3X2-tabel

Dette kunne være et simpelt spørgsmål til erfarne statistiske genetikfolk. Jeg har dybt ind i dette ved at lave en analyse for en ven på sidelinjen af en bioinformatikopgave, som jeg hjalp hende med. En mulighed for mig at lære nye ting.

For kontekst: Jeg har en tabel med genotypefrekvenser til tilfælde og sunde kontroller på tværs af forskellige etniciteter. Min hypotese er, at en sygdoms sværhedsgrad er forbundet med genotypen. Det vil sige, at en mutation fra GG til GA eller AA kan øge sygdommens sværhedsgrad.

Jeg identificerede få tests for tendenser, der er interessante for mit spørgsmål: Cochran-Armitage-trendtesten og chi-firkanten test for at undersøge uafhængigheden af genotyperne.

Specifikt kan jeg lide at stå korrigeret / kritiseret / rådgivet om min analysestrategi. Kan R-funktionen prop.trend.test () bruges til samme formål som CA-test, hvis jeg har en 2X2-genotypetabel (ikke allel) i stedet for en 3X2-tabel?

Så for gentoypes GG (case = 41, kontrol = 29), GA (n = 1,2) og AA (n = 0,2). Jeg vil se, om der kun findes en tendens forbundet med AA-homozygoten, jeg kan lave en 2X2-tabel som følger:

 Control Case RowTotals AA 0 2 2 GA+GG 42 31 73 colTotals 42 33 75

Så gør prop.trend. test (c (2,31), c (2,73)) ved hjælp af ræktotalerne.

Tilsvarende Hvis jeg vil se, om allel A-engagementet viser en tendens, kan jeg ændre tabellen som følger og gøre prop.trend.test (c (29,4), c (70,5)) :

 Control Case RowTotals GG 41 29 70 GA+AA 1 4 5 colTotals 42 33 75

Genotyperne i tilfælde og kontroller er i Hardy-Weinberg-ligevægt. Den sygdom, jeg tester, har en lav prævalens, jeg ved ikke, om sygdommen er multiplikativ, og derfor bruger jeg genotyper i stedet for allelfrekvenser, jeg læste, at fra et papir, der tyder på, at disse tre antagelser skal holdes for at arbejde med alleltællinger. Også min stikprøvestørrelse er for lille, der kun består af 34 sager og 41 kontrolelementer.

Er min idé fornuftig?

Kommentarer

Forsøgte du min metode til prop.trend.test, der er nævnt i svaret nedenfor?

Svar

Siden der er 41, 1 og 0 tilfælde ud af i alt 70, 3 og 2 forsøgspersoner for henholdsvis GG, AG og AA, prop.trend.test kan gøres som følger:

> prop.trend.test(c(41,1,0), c(70,3,2)) Chi-squared Test for Trend in Proportions data: c(41, 1, 0) out of c(70, 3, 2) , using scores: 1 2 3 X-squared = 3.3444, df = 1, p-value = 0.06743

Det viser, at der er en tendens i retning af signifikant sammenhæng for at reducere risikoen for sygdom med A-allel, da andelen af tilfældene reduceres fra GG til AG til AA (fra 59% til 33% til 0%) .

Rediger: Som diskuteret i kommentarer er Cochran-Armitage test den foretrukne test for denne situation ( https://en.wikipedia.org/wiki/Cochran%E2%80%93Armitage_test_for_trend#Application_to_genetics )

> CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1.4139, p-value = 0.1574 alternative hypothesis: two.sided

Man skal også kunne gøre det efter at have kombineret A-allelgrupper:

> CA_df<-data.frame(case=c(41,1), control=c(29,4)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1, p-value = 0.3173 alternative hypothesis: two.sided

Kommentarer

Tha nks, jeg brugte prop.trend.test () på den måde, som fungerer godt. Jeg ville tage et skridt videre og lære om legitimiteten af at ændre tabellerne til 2X2 for at understrege AA-genotypetrenden i sager såvel som den kombinerede AA / GA-tendens i sager mod baggrunden for WT GG.
Resultatet, jeg får fra prop.trend.test (), er væsentligt forskelligt i forhold til hvad jeg får fra Cochrane-Armitage-testen, som er spændende. Hvordan kan det forklares. Her er min kode library(coin) CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) independence_test(control ~ case, data=CA_df)
Jeg er enig i, at Cochran-Armitage-test skal udføres. da.wikipedia.org/wiki/… Jeg har redigeret mit svar.

Kommentarer

Svar

Kommentarer

Skriv et svar Annuller svar