Základy spárovaného vs. nepárového t-testu

Doufám, že to není příliš základní:

Chápu, že jsme použili párové testování v situacích, kdy např. , stejný předmět je sledován před a po experimentu / léčbě, např. před a poté, co pacient dostane lék.

Existují však případy, které nejsou v tomto formátu popsány, takže bych chtěl vědět, zda závislost testovaných událostí stačí k použití párových testů. Konkrétně mám na mysli tyto 2 experimenty:

1) Testujeme časy parkování pro vozy C1, C2 různých značek; chceme zjistit, zda jsou průměrné doby parkování stejné.

Máme 10 lidí, kteří zaparkují auto C1 a u každého měříme doby parkování, vypočítáme průměr $ \ mu_1 $ všech dob parkování. Pak máme stejných 10 lidí, kteří zaparkují auto C2 na stejném místě jako C1, měříme časy parkování a vypočítáme průměr $ \ mu_2 $ . Vzhledem k tomu, že parkovací úlohy provádí pokaždé stejná skupina, použijeme potom pomocí spárovaného t-testu k testování, zda $ \ mu_1 = \ mu_2 $ (při dané volbě důvěra), protože / protože tyto dva časy spolu souvisejí?

2) Chceme vyzkoušet, zda mají pravá a levá končetina stejnou délku. Používáme párové testování Pokud jsou končetiny měřeny u stejné osoby, protože měřené hodnoty jsou pravděpodobně korelované? A pokud jsme v některých případech měřili pouze jednu končetinu u jedné osoby a levou končetinu u jiné osoby nebo měřili jsme pouze jednu končetinu na osobu, nepoužili bychom párové testování? Děkujeme.

Odpověď

Obecně byste použili spárovaný $ t $ -test, když existuje variace mezi pozorováními, která jsou sdílená (a srovnatelná) mezi dvěma vzorky.

Takže ve vašem příkladu č. 1 ano: použijte spárovanou $ t $ -test, protože jednotliví řidiči mají různé schopnosti a spárování každého řidiče se sebou by mělo lépe odhadnout, zda je rozdíl v parkování automobilu C1 oproti C2.

Můžete také proveďte párový test, pokud jste měli řidiče různých zkušeností zastoupené rovnoměrně v obou vzorcích. Pak byste porovnali řidiče C1 a C2, kteří byli novými řidiči, řidiči s více zkušenostmi atd. (V závislosti na vašem seskupení zkušeností. To je méně než čistý ideál porovnání každého řidiče se sebou, ale protože očekáváme, že ovlivňují schopnost řízení (a tím i dobu parkování) spárovaný $ t $ -test je lepší než test spojený.

Pamatujte, že pokud jste nemohli spárujte pozorování 1: 1 pro vozy C1 a C2, můžete místo toho udělat stratifikovaný $ t $ -test. To je však trochu komplikovanější, protože potřebujete opravit různá čísla a variace v každém kombinovaném voze se skupinovým vozem. Tento zápis do stratifikovaného $ t $ -test ukazuje, jak je účetnictví trochu zapojeno.

Ve druhém příkladu byste opět udělali dobře, kdybyste použili spárovaný $ t $ -test, pokud jste změřili obě končetiny na každé osobě červené některé levé končetiny a některé pravé končetiny, použili byste souhrnný $ t $ -test, pokud neexistoval nějaký faktor, u kterého jste očekávali, že souvisí s rozdílem končetin. (Těžko si představuji nastavení, kde by spárovaný $ t $ -test fungoval pro měření některých levých a pravých končetin.)

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *