Verkkomotiivialgoritmeissa näyttää olevan melko yleistä palauttaa molemmat p-arvo ja Z-pisteet tilastolle: ”Syöttöverkko sisältää X kopiota alikaaviosta G”. Aligrafiikkaa pidetään motiivina, jos se täyttää
- p-arvo < A,
- Z-pisteet> B ja
- X> C, joillekin käyttäjän määrittelemille (tai yhteisön määrittelemille) A, B ja C.
Tämä motivoi kysymystä:
Kysymys : Mitä eroja p-arvo ja Z-pisteet ovat ?
Ja kysely:
Kysymys : Onko tilanteita, joissa saman tilaston p-arvo ja Z-pisteet voisivat viitata päinvastaisiin hypoteeseihin? Ovatko edellä mainitut ensimmäinen ja toinen ehto olennaisesti samat?
Vastaa
Sanoisin kysymyksesi perusteella, että kolmen testin välillä ei ole eroa. Tämä on siinä mielessä, että voit aina valita A, B ja C siten, että sama päätös tehdään riippumatta siitä, mitä kriteeriä käytät. Vaikka p-arvon on perustuttava samaan tilastoon (ts. Z-pisteet).
Z-pistemäärän käyttämiseksi sekä keskiarvo $ \ mu $ että varianssi $ \ sigma ^ 2 $ oletetaan olevan tiedossa, ja jakauman oletetaan olevan normaali (tai asymptoottisesti / suunnilleen normaali). Oletetaan, että p-arvon kriteeri on tavallinen 5%. Sitten meillä on:
$$ p = Pr (Z > z) < 0,05 \ oikealle nuoli Z > 1.645 \ rightarrow \ frac {X- \ mu} {\ sigma} > 1.645 \ rightarrow X > \ mu + 1.645 \ sigma $$
Joten meillä on kolminkertainen $ (0.05, 1.645, \ mu + 1.645 \ sigma) $, jotka kaikki edustavat samoja raja-arvoja.
Huomaa, että sama kirjeenvaihto pätee t-testiin, vaikka numerot ovatkin erilaiset. Molemmilla hännätesteillä on myös samanlainen kirjeenvaihto, mutta eri numeroilla.
Kommentit
- Kiitos siitä! (ja kiitos myös muille vastaajille).
Vastaa
A $ Z $ -pisteet kuvaavat poikkeamiasi. keskiarvosta keskihajonnan yksikköinä. Ei ole selvää, hyväksytkö vai hylkäätkö nullhypoteesisi.
$ p $ -arvo on todennäköisyys, että nollahypoteesin perusteella voimme havaita yhtä äärimmäisen pisteen kuin tilastosi. Tämä kertoo nimenomaisesti, hylkäätkö vai hylkäätkö nullhypoteesisi, kun testikoko on $ \ alpha $.
Harkitse esimerkkiä, jossa $ X \ sim \ mathcal {N} (\ mu, 1) $ ja nollahypoteesi on $ \ mu = 0 $. Sitten tarkkailet $ x_1 = 5 $. Sinun $ Z $ -pisteesi on 5 (mikä kertoo vain, kuinka kaukana poikkeavat nollahypoteesistasi $ \ sigma $: n suhteen) ja $ p $ -arvo on 5.733e-7. 95%: n varmuuden vuoksi sinulla on testikoko $ \ alpha = 0.05 $ ja koska $ p < \ alpha $, hylkäät nullhypoteesin. Mutta missä tahansa tilastossa on oltava jonkin verran vastaavia dollareita $ A $ ja $ B $, jotta testit ovat samat.
Kommentit
- @ Gary – p-arvo ei käske ' kertoa hylkäävän Z-pisteet tai korkeintaan. Ne ovat vain numeroita. Hyväksynnän tai hylkäämisen määrää vain päätössääntö. Tämä päätössääntö voitaisiin yhtä hyvin määritellä Z-pisteinä (esim. $ 2 \ sigma $ tai $ 3 \ sigma $ -sääntö)
- @probabilityislogic Olen kanssasi samaa mieltä. Todellakin, voit rakentaa jonkin testin $ Z $ -pistekynnyksen perusteella, mutta se ei salli sinun määrittää erikseen testin kokoa klassisessa mielessä (eli todennäköisyyden suhteen). Tällaiset kriteerit saattavat aiheuttaa ongelmia joillekin, jos jakelusi on paksut. Kun rakennat testiä, määrität testin koon nimenomaisesti, joten $ p $ -arvo kertoo heti, hyväksytkö vai hylkäätkö tämän, minkä yritin tehdä.
- @gary – ei oikeastaan, sillä p-arvo ei viittaa vaihtoehtoihin. Joten sitä ei ' voida käyttää vaihtoehtojen suoraan vertaamiseen. Otetaan esimerkiksi $ H_0: \ mu = 0 $ vs. $ H_A: \ mu = -1 $. $ H_0 $: n p-arvo pysyy samana $ 5 \ kertaa 10 ^ {- 7} $. Joten sanot " hylkääksesi null ", mikä tarkoittaa, että " hyväksy vaihtoehtoinen " ja julista $ \ mu = -1 $. Mutta tämä on järjetöntä, kukaan ei tekisi tätä, mutta täällä käyttämäsi p-arvon sääntö tekee tämän.Toisin sanoen, kuvaamasi p-arvon sääntö ei ole muuttumaton suhteessa ns. " nolla-hypoteesiin " (tulossa tarkkuus )
- (cont ' d) Ilmeisen järjettömyyden ratkaisu on huomata, että p-arvo ei ole " absoluuttinen " -testi, mutta suhteellinen, määritelty implisiittisellä vaihtoehtoisella hypoteesilla. Tällöin implisiittinen vaihtoehto on $ H_ {imp}: \ mu = 5 $. Voit nähdä tämän huomioimalla, että jos lasken $ H_A $: n p-arvon, saan $ 1 \ kertaa 10 ^ {- 9} $, joka on pienempi kuin $ H_0 $: n p-arvo. Tässä esimerkissä " implisiittinen vaihtoehto " on helppo löytää intuition avulla, mutta sitä on paljon vaikeampaa löytää monimutkaisemmista ongelmista , jossa häiriöparametrit tai riittämätön tilasto.
- @Gary – p-arvo ei ole tiukempi vain siksi, että se on todennäköisyys. Se on Z-pisteet yksitoikkoinen muutos 1: stä 1: een. kaikki " tiukkuus ", joilla on p-arvo, ovat myös Z-pisteet. Vaikka jos käytät kaksipuolista testiä, vastaavuus on Z-pistemäärän absoluuttinen arvo. Ja jotta voit verrata $ H_1: \ mu \ neq 0 $ -arvoa nollaan, sinun on käytettävä " minimax-lähestymistapaa: joka on valita terävä hypoteesi, jota tiedot tukevat eniten ja joka on yhdenmukainen $ H_1 $: n kanssa. Ellet pysty osoittamaan, kuinka lasketaan $ P (X | \ mu \ neq 1) $
Vastaus
$ p $ -arvo osoittaa tilastojen epätodennäköisyyden. $ z $ -pisteet osoittavat kuinka kaukana keskiarvosta se on. Niiden välillä voi olla ero näytteen koosta riippuen.
Suurille näytteille pienetkin poikkeamat keskiarvosta ovat epätodennäköisiä. Eli. $ p $ -arvo voi olla hyvin pieni myös matalalla $ z $ -pisteellä. Päinvastoin, pienillä näytteillä edes suuret poikkeamat eivät ole todennäköisiä. Eli. iso $ z $ -piste ei välttämättä tarkoita pientä $ p $ -arvoa.
Kommentit
- jos otoksen koko on suuri, niin keskihajonta on pieni, joten Z-pisteet ovat korkeat. Luulen, että saatat löytää tämän, jos kokeilet numeerista esimerkkiä.
- Ei oikeastaan. Oletetaan, että otat N: stä (0, 1). Tällöin vakiosi on noin 1 näytteen koosta riippumatta. Pienempi on keskiarvon keskivirhe, ei keskihajonta. p-arvot perustuvat SEM: ään, eivät vakioihin.
- Z-pisteet ovat (havaittu-keskiarvo) / (keskihajonta). Mutta keskiarvo ja keskihajonta ovat havaittua tilastoa, ei populaatiota, josta sen komponentit on vedetty. Löysä terminologiani on kiinni täällä. Jos kuitenkin testaat keskiarvoa, sopiva keskihajonta Z-pisteessä on standardivirhe, joka pienenee samalla nopeudella kuin p-arvo.