Dit zou een simpele vraag kunnen zijn voor ervaren mensen op het gebied van statistische genetica. Ik heb me hierin verdiept door een analyse te maken voor een vriend naast een bioinformatica-taak waarmee ik haar hielp. Een kans voor mij om nieuwe dingen te leren.
Voor de context: ik heb een tabel met genotype-frequenties voor gevallen en gezonde controles uit verschillende etniciteiten. Mijn hypothese is dat de ernst van de ziekte verband houdt met het genotype. Dat wil zeggen, een mutatie van GG naar GA of AA kan de ernst van de ziekte verhogen.
Ik heb enkele tests voor trends geïdentificeerd die interessant zijn voor mijn vraag: de Cochran-Armitage-trendtest en de chikwadraat test om de onafhankelijkheid van de genotypen te onderzoeken.
In het bijzonder sta ik graag gecorrigeerd / bekritiseerd / geadviseerd over mijn analysestrategie. Kan de R-functie prop.trend.test () voor hetzelfde doel worden gebruikt als CA-test als ik een 2X2-genotype-tabel (geen allel) heb in plaats van een 3X2-tabel?
Dus voor gentoypes GG (case = 41, controle = 29), GA (n = 1,2) en AA (n = 0,2). Ik wil zien of er een trend bestaat die alleen met de AA-homozygoot is geassocieerd, ik kan een 2X2-tabel als volgt doen:
Control Case RowTotals AA 0 2 2 GA+GG 42 31 73 colTotals 42 33 75
Doe dan prop.trend. test (c (2,31), c (2,73)) met behulp van de rijtotalen.
Evenzo als ik wil zien of de betrokkenheid van allel A een trend vertoont, kan ik de tabel als volgt aanpassen en prop.trend.test (c (29,4), c (70,5)) doen :
Control Case RowTotals GG 41 29 70 GA+AA 1 4 5 colTotals 42 33 75
De genotypen in gevallen en controles bevinden zich in Hardy-Weinberg-evenwicht. De ziekte die ik test heeft een lage prevalentie, ik weet niet of de ziekte vermenigvuldigend is en daarom gebruik ik genotypen in plaats van allelfrequenties.Ik las dat uit een paper waarin wordt gesuggereerd dat deze drie aannames moeten gelden voor het werken met allelentellingen. Ook is mijn steekproefomvang te klein, bestaande uit slechts 34 cases en 41 controles.
Klopt mijn idee?
Reacties
- Heb je mijn methode van prop.trend.test die in het onderstaande antwoord wordt genoemd geprobeerd?
Antwoord
Sinds er zijn 41, 1 en 0 gevallen van een totaal van 70, 3 en 2 onderwerpen voor respectievelijk GG, AG en AA, prop.trend.test kan als volgt worden gedaan:
> prop.trend.test(c(41,1,0), c(70,3,2)) Chi-squared Test for Trend in Proportions data: c(41, 1, 0) out of c(70, 3, 2) , using scores: 1 2 3 X-squared = 3.3444, df = 1, p-value = 0.06743
Het toont aan dat er een trend is naar een significant verband tussen het verminderen van het risico op ziekte en het A-allel, aangezien het percentage gevallen afneemt van GG naar AG naar AA (van 59% naar 33% naar 0%) .
Bewerken: zoals besproken in opmerkingen, is de Cochran-Armitage-test de voorkeurstest voor deze situatie ( https://en.wikipedia.org/wiki/Cochran%E2%80%93Armitage_test_for_trend#Application_to_genetics )
> CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1.4139, p-value = 0.1574 alternative hypothesis: two.sided
Men zou het ook moeten kunnen doen na het combineren van A-allelgroepen:
> CA_df<-data.frame(case=c(41,1), control=c(29,4)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1, p-value = 0.3173 alternative hypothesis: two.sided
Reacties
- Tha nks, ik heb prop.trend.test () op die manier gebruikt, wat goed werkt. Ik wilde een stap verder gaan en meer te weten komen over de legitimiteit van het aanpassen van de tabellen naar 2X2 om de AA-genotype-trend in gevallen te benadrukken, evenals de gecombineerde AA / GA-trend in gevallen tegen de achtergrond van de WT GG.
- Het resultaat dat ik krijg van prop.trend.test () is significant verschillend in vergelijking met wat ik krijg van de Cochrane-Armitage-test, wat verbijsterend is. Hoe is dat te verklaren? Hier is mijn code
library(coin) CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) independence_test(control ~ case, data=CA_df)
- Ik ben het ermee eens dat de Cochran-Armitage-test moet worden uitgevoerd. en.wikipedia.org/wiki/… Ik heb mijn antwoord aangepast.