Analiza tabeli genotypowej 2X2 zamiast tabeli 3X2

To może być proste pytanie dla doświadczonych specjalistów od genetyki statystycznej. Zagłębiłem się w to, wykonując analizę dla przyjaciółki na marginesie zadania bioinformatycznego, w którym jej pomagałem. Możliwość nauczenia się nowych rzeczy.

Kontekst: Mam tabelę częstości genotypów przypadków i zdrowych kontroli w różnych grupach etnicznych. Moja hipoteza jest taka, że ciężkość choroby jest związana z genotypem. Oznacza to, że mutacja z GG na GA lub AA może zwiększyć nasilenie choroby.

Zidentyfikowałem kilka testów trendów, które są interesujące dla mojego pytania: test trendu Cochrana-Armitagea i chi-kwadrat test, aby zbadać niezależność genotypów.

W szczególności lubię być korygowany / krytykowany / doradzany w sprawie mojej strategii analizy. Czy funkcja R prop.trend.test () może być używana do tego samego celu co test CA, jeśli mam tablicę genotypów 2X2 (nie allele) zamiast tabeli 3X2?

Więc dla gentoypes GG (przypadek = 41, kontrola = 29), GA (n = 1,2) i AA (n = 0,2). Chcę zobaczyć, czy istnieje trend związany tylko z homozygotą AA, mogę zrobić tabelę 2X2 w następujący sposób:

 Control Case RowTotals AA 0 2 2 GA+GG 42 31 73 colTotals 42 33 75 

Następnie wykonaj prop.trend. test (c (2,31), c (2,73)) przy użyciu sum w wierszach.

Podobnie, jeśli chcę zobaczyć, czy allel A wykazuje trend, mogę zmodyfikować tabelę w następujący sposób i zrobić prop.trend.test (c (29,4), c (70,5)) :

 Control Case RowTotals GG 41 29 70 GA+AA 1 4 5 colTotals 42 33 75 

Genotypy w przypadkach i kontrolach są w równowadze Hardyego-Weinberga. Choroba, którą testuję, ma niską częstość występowania, nie wiem, czy choroba jest multiplikatywna, dlatego używam genotypów zamiast częstotliwości alleli, przeczytałem, że z artykułu sugerującego, że te trzy założenia muszą się utrzymywać przy pracy z liczbą alleli. Również rozmiar mojej próby jest zbyt mały i składa się tylko z 34 przypadków i 41 kontroli.

Czy mój pomysł ma sens?

Komentarze

  • Czy wypróbowałeś moją metodę prop.trend.test wymienioną w odpowiedzi poniżej?

Odpowiedź

Ponieważ jest 41, 1 i 0 przypadków z łącznej liczby 70, 3 i 2 przedmiotów, odpowiednio dla GG, AG i AA, prop.trend.test można przeprowadzić w następujący sposób:

> prop.trend.test(c(41,1,0), c(70,3,2)) Chi-squared Test for Trend in Proportions data: c(41, 1, 0) out of c(70, 3, 2) , using scores: 1 2 3 X-squared = 3.3444, df = 1, p-value = 0.06743 

Pokazuje, że istnieje trend w kierunku istotnego związku zmniejszania ryzyka choroby z allelem A, ponieważ odsetek przypadków zmniejsza się od GG do AG do AA (z 59% do 33% do 0%) .

Edycja: jak omówiono w komentarzach, test Cochrana-Armitagea jest preferowanym testem w tej sytuacji ( https://en.wikipedia.org/wiki/Cochran%E2%80%93Armitage_test_for_trend#Application_to_genetics )

> CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1.4139, p-value = 0.1574 alternative hypothesis: two.sided 

Powinno się to również dać po połączeniu grup alleli A:

> CA_df<-data.frame(case=c(41,1), control=c(29,4)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1, p-value = 0.3173 alternative hypothesis: two.sided 

Komentarze

  • Tha nks, użyłem prop.trend.test () w ten sposób, który działa dobrze. Chciałem pójść o krok dalej i dowiedzieć się o zasadności modyfikowania tabel do 2X2 w celu podkreślenia trendu genotypu AA w przypadkach, jak również połączonego trendu AA / GA w przypadkach na tle WT GG.
  • Wynik, który otrzymuję z prop.trend.test () jest znacząco inny niż ten, który otrzymuję z testu Cochrane-Armitage, który jest zadziwiający. Jak to wyjaśnić. Oto mój kod library(coin) CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) independence_test(control ~ case, data=CA_df)
  • Zgadzam się, że należy przeprowadzić test Cochran-Armitage. pl.wikipedia.org/wiki/… Zmieniłem odpowiedź.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *