Analýza genotypové tabulky 2X2 namísto tabulky 3X2

To by mohla být jednoduchá otázka pro zkušené statistické genetiky. Ponořil jsem se do toho provedením analýzy pro kamarádku na vedlejším úkolu bioinformatického úkolu, se kterým jsem jí pomáhal. Příležitost, abych se naučil nové věci.

Pro kontext: Mám tabulku frekvencí genotypů pro případy a zdravé kontroly napříč různými etnikami. Moje hypotéza je, že závažnost onemocnění je spojena s genotypem. To znamená, že mutace z GG na GA nebo AA může zvýšit závažnost onemocnění.

Identifikoval jsem několik testů na trendy, které jsou zajímavé pro mou otázku: Cochran-Armitageův test trendů a chí-kvadrát test k prozkoumání nezávislosti genotypů.

Konkrétně bych rád stál ve své analytické strategii opravený / kritizovaný / doporučený. Lze funkci R prop.trend.test () použít pro stejný účel jako CA test, pokud mám místo tabulky 3X2 genotypovou tabulku 2X2 (ne alelu)?

Takže pro gentoypes GG (případ = 41, kontrola = 29), GA (n = 1,2) a AA (n = 0,2). Chci zjistit, zda existuje trend spojený pouze s AA homozygotem, mohu udělat tabulku 2X2 následovně:

 Control Case RowTotals AA 0 2 2 GA+GG 42 31 73 colTotals 42 33 75 

Pak proveďte prop.trend. test (c (2,31), c (2,73)) pomocí součtu řádků.

Podobně Pokud chci zjistit, zda alela A zahrnuje trend, můžu tabulku upravit následovně a udělat prop.trend.test (c (29,4), c (70,5)) :

 Control Case RowTotals GG 41 29 70 GA+AA 1 4 5 colTotals 42 33 75 

Genotypy v případech a kontrolách jsou v Hardy-Weinbergově rovnováze. Nemoc, kterou testuji, má nízkou prevalenci, nevím, jestli je nemoc multiplikativní, a proto používám genotypy místo frekvencí alel, dočetl jsem, že z článku, který naznačuje, že tyto tři předpoklady musí platit pro práci s počtem alel. Také moje velikost vzorku je příliš malá, skládá se pouze z 34 případů a 41 ovládacích prvků.

Má můj nápad smysl?

Komentáře

  • Vyzkoušeli jste moji metodu prop.trend.test uvedenou v odpovědi níže?

Odpověď

Protože existuje 41, 1 a 0 případů z celkem 70, 3 a 2 subjektů pro GG, AG a AA, prop.trend.test lze provést následovně:

> prop.trend.test(c(41,1,0), c(70,3,2)) Chi-squared Test for Trend in Proportions data: c(41, 1, 0) out of c(70, 3, 2) , using scores: 1 2 3 X-squared = 3.3444, df = 1, p-value = 0.06743 

Ukazuje, že existuje trend směrem k významné asociaci ke snížení rizika onemocnění s alelou A, protože podíl případů klesá z GG na AG na AA (z 59% na 33% na 0%) .

Upravit: Jak je popsáno v komentářích, test Cochran-Armitage je preferovaným testem pro tuto situaci ( https://en.wikipedia.org/wiki/Cochran%E2%80%93Armitage_test_for_trend#Application_to_genetics )

> CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1.4139, p-value = 0.1574 alternative hypothesis: two.sided 

Jeden by měl být schopen to udělat i po zkombinování všech alel skupin:

> CA_df<-data.frame(case=c(41,1), control=c(29,4)) > independence_test(control ~ case, data=CA_df) Asymptotic General Independence Test data: control by case Z = 1, p-value = 0.3173 alternative hypothesis: two.sided 

Komentáře

  • Tha nks, použil jsem prop.trend.test () tímto způsobem, který funguje dobře. Chtěl jsem udělat krok dále a dozvědět se o legitimitě úpravy tabulek na 2X2, abych zdůraznil trend genotypu AA v případech i kombinovaný trend AA / GA v případech na pozadí WT GG.
  • Výsledek, který dostanu z prop.trend.test (), je výrazně odlišný ve srovnání s tím, co dostanu z testu Cochrane-Armitage, který je ohromující. Jak to lze vysvětlit. Tady je můj kód library(coin) CA_df<-data.frame(case=c(41,1,0), control=c(29,2,2)) independence_test(control ~ case, data=CA_df)
  • Souhlasím, že by měl být proveden test Cochran-Armitage. en.wikipedia.org/wiki/… Upravil jsem svou odpověď.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *