Testing av binære data

Jeg har et datasett som er en gruppe deltakere som godtar eller avviser hver av to enheter, og jeg vil teste om to enheter aksepteres med forskjellige priser. Sammendragstabell slik

Overall Acceptance Accept Reject X 124 20 Y 111 33 

Hva er den beste statistiske testen for å avgjøre om forskjellen mellom Xs akseptrate og Ys akseptrate er betydelig? Jeg er ikke brukt til binære data så ut av min dybde her.

Kommentarer

  • Du leter etter logistisk regresjon stats.stackexchange.com/questions/tagged/logistic+regression
  • Jeg får inntrykk av noen av svarene dine under mitt svar at du ' er i kommunikasjon med en tredjepart, kanskje en veileder eller noen slike, videreformidler svar og svar på dem. Er dette tilfelle?
  • Ikke helt – jeg ' Jeg jobber med et markedsundersøkelsesteam som av og til ber om eller foreslår ting, men ettersom analysen ikke er ' t deres primære kompetanse, gir de meg generelt delvis informasjon som trenger utfylling eller avklaring.

Svar

Det er flere alternativer.

( i) Du kan gjøre en toprøvestest av binomiale proporsjoner / to prøveforholdstester.

Med størrelsen på prøven din, skal den normale tilnærmingen d være greit, skjønt – du trenger ikke nødvendigvis å bekymre deg for den binomiale delen.

(ii) Du kan gjøre en chi-kvadrat-test av uavhengighet (som også tester likhetsgrad); dette tilsvarer i utgangspunktet det første alternativet hvis testen din er tosidig, eller lignende, kan du gjøre en $ G ^ 2 $ test.

(iii) Du kanskje gjør en Fisher-test, antar jeg.

(Du kan gjøre noe mer komplisert som en logistisk regresjon, men jeg ser ikke behovet her.)

Avhengig av ditt område er 2×2 chi-kvadrat-testen sannsynligvis mest sannsynlig å være kjent for andre som ser på den. Hvis du vil ha en ensidig test, er de to prøvene proporsjonstesten veien å gå.

Kommentarer

  • Problemet mitt med å gjøre en 2×2 chi-kvadrat er at det ' sannsynligvis vil fortelle meg at aksepten vs avvise tall er forskjellige; at ' er greit, men det jeg virkelig vil vite er om X mot Y aksepterer tall er forskjellige.
  • Du tar feil. Den 2×2 chi-firkanten forholder seg faktisk til margen og sammenligner proporsjonene (det vil si en av to ting det ikke ' t tester det aksept mot avvisningsmargin); det er fire forskjellige proporsjoner sammenligninger som alle tilsvarer nøyaktig den samme chi-kvadratverdien, inkludert den ene yo du vil. Hvis dette ikke er klart for deg, oppfordrer jeg deg til å gjøre det eksplisitt som en prøveeksempel på to eksempler og presentere det på den måten (og for din egen forståelse, gjør det som et chi-kvadrat og se at du får samme p-verdi så lenge du behandler andre hensyn det samme).
  • Jeg gjorde ikke ' t artikulert poenget mitt godt; problemet med en chi-squared test er at resultatene ikke ' skiller mellom Accept vs Reject som er forskjellig, og X vs Y er forskjellig. Å fortelle meg at samlet sett er en kombinasjon av de to forskjellige, ikke ' t svarer på spørsmålet, så jeg trenger en annen test.
  • Du er forvirret. Vil du være enig i at en rett forskjell i aksepteringsforholdene for X og Y måler forskjellen du vil teste?
  • For å teste det er det ' viktig å standardisere (dele med standardavviket). Du ' er enig i at slik skalering ikke ' ikke endrer hvilke tilfeller som er de mest ekstreme (de du vil avvise)? Hvis du ' gjør en tosidig test, svarer ytterpunktene til at aksepteringsandelen for X er mye større enn for Y, og omvendt. Alt i orden så langt?

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *