Ik hoop dat dit niet te basaal is:
Ik begrijp dat we gepaarde testen hebben gebruikt in situaties waarin bijv. , wordt hetzelfde onderwerp gevolgd voor en na een experiment / behandeling, bijv. voor en nadat de patiënt een medicijn heeft gekregen.
Maar er zijn gevallen die niet in dit formaat worden beschreven, dus ik zou graag om te weten of afhankelijkheid van geteste gebeurtenissen voldoende is om gepaarde tests te gebruiken. Concreet denk ik aan deze 2 experimenten:
1) We testen de parkeertijden voor autos C1, C2 van verschillende merken; we willen zien of de gemiddelde parkeertijden gelijk zijn.
We hebben 10 mensen die auto C1 parkeren en we meten parkeertijden voor elk, we berekenen het gemiddelde $ \ mu_1 $ van alle parkeertijden. We hebben dan dezelfde 10 mensen die auto C2 op dezelfde plek parkeren als C1, parkeertijden meten, de gemiddelde $ \ mu_2 $ berekenen. Aangezien parkeeropdrachten elke keer door dezelfde groep worden gedaan, gebruiken we dan de gepaarde t-Test om te testen of $ \ mu_1 = \ mu_2 $ (bij een bepaalde keuze uit vertrouwen), sinds / omdat de twee tijden gecorreleerd zijn?
2) We willen testen of de rechter- en linkerpoten even lang zijn. Gebruiken we gepaarde tests als de ledematen bij dezelfde persoon worden gemeten, omdat de metingen waarschijnlijk gecorreleerd zijn? En als we in sommige gevallen slechts één ledemaat bij de ene persoon en de linker ledemaat in een andere hebben gemeten of als we slechts één ledemaat per persoon hebben gemeten, zouden we geen paartest gebruiken? Bedankt.
Antwoord
In het algemeen zou je een gepaarde $ t $ gebruiken -test wanneer er variatie is tussen waarnemingen die wordt gedeeld (en matchbaar) tussen de twee steekproeven.
Dus, in uw voorbeeld # 1, ja: gebruik een gepaarde $ t $ -test aangezien individuele chauffeurs verschillende capaciteiten hebben en het koppelen van elke chauffeur aan zichzelf zou beter kunnen inschatten of er een verschil is tussen het parkeren van auto C1 en C2.
Je zou ook doe een gepaarde test als u chauffeurs met wisselende ervaring had die in beide voorbeelden gelijk waren. Dan zou je chauffeurs van C1 en C2 vergelijken die nieuwe chauffeurs waren, chauffeurs met meer ervaring, enzovoort (afhankelijk van je groep ervaring. Dat is minder dan het zuivere ideaal om elke chauffeur met zichzelf te vergelijken, maar aangezien we verwachten dat ervaring de rijvaardigheid (en dus de parkeertijd) beïnvloeden, is een gepaarde $ t $ -test beter dan een gepoolde test.
Merk op dat als je dat niet zou kunnen koppel de waarnemingen 1: 1 voor auto C1 en C2, dan zou je in plaats daarvan een gestratificeerde $ t $ -test kunnen doen. Dat wordt echter een beetje ingewikkelder, aangezien je om te corrigeren voor verschillende getallen en variaties in elke groep-auto-combinatie. Deze beschrijving op de gestratificeerde $ t $ -test laat zien hoe de boekhouding er een beetje bij betrokken raakt.
In je tweede voorbeeld zou je er opnieuw goed aan doen om een gepaarde $ t $ -test of je beide ledematen bij elke persoon hebt gemeten Als u enkele linker ledematen en enkele rechter ledematen red, zou u een gepoolde $ t $ -test gebruiken, tenzij er een factor was waarvan u verwachtte dat deze verband houdt met ledemaatverschil. (Ik vind het moeilijk om me een opstelling voor te stellen waarbij een gepaarde $ t $ -test zou werken voor het meten van enkele linkerbenen en enkele rechter ledematen.)