Jorisin ja Srikantin vaihto täällä sai minut miettimään (uudestaan) onko sisäinen Luottamusvälien ja uskottavien aikavälien erojen selitykset olivat oikeat. Kuinka selität eron?
Vastaa
I samaa mieltä täysin Srikantin selityksestä. Heuristisemman pyörähdyksen antaminen:
Klassiset lähestymistavat ovat yleensä sitä mieltä, että maailma on yksi tapa (esim. Parametrilla on yksi tietty todellinen arvo), ja yritä suorittaa kokeita, joiden johtopäätös – ei väliä parametrin todellinen arvo – on oikea ainakin pienimmällä todennäköisyydellä.
Tämän seurauksena, ilmaistaksemme epävarmuutta tietämyksessämme kokeilun jälkeen, gyakoristinen lähestymistapa käyttää ”luottamusväliä” – arvoalue, joka on suunniteltu sisällyttämään parametrin todellinen arvo pienimmällä todennäköisyydellä, esimerkiksi 95%. Yleinen asiantuntija suunnittelee kokeen ja 95%: n luottamusvälimenettelyn siten, että jokaisesta 100 suoritetusta kokeesta alkaa loppua, vähintään 95 tuloksena olevasta luottamusvälistä odotetaan sisältävän parametrin todellisen arvon. Viisi muuta saattavat olla hieman väärässä tai ne saattavat olla täydellisiä hölynpölyjä – muodollisesti puhuen, että ”lähestymistavan kannalta on ok, kunhan 95 päätelmää sadasta johtaa oikein. (Tietenkin haluaisimme niiden olevan hieman väärä, ei täydellinen hölynpöly.)
Bayesilaiset lähestymistavat muotoilevat ongelman eri tavalla. Sen sijaan, että sanottaisiin, että parametrilla on vain yksi (tuntematon) todellinen arvo, Bayesin menetelmä sanoo, että parametrin arvo on kiinteä, mutta se on valittu jostakin todennäköisyysjakaumasta – joka tunnetaan aikaisempana todennäköisyysjakaumana. (Toinen tapa sanoa, että ennen mittausten tekemistä Bayesin osallistuja määrittelee todennäköisyysjakauman, jota he kutsuvat vakaumustilaksi, parametrin todellisesta arvosta.) Tämä ”priori” saattaa olla tiedossa (kuvittele yrittävän kuorma-auton koon arvioimiseksi, jos tiedämme kuorma-autojen koon kokonaisjakauman DMV: stä) tai se voi olla tyhjästä lähtevä oletus. Bayesin johtopäätös on yksinkertaisempi – keräämme joitain tietoja ja laskemme sitten parametrin GIVEN data eri arvojen todennäköisyyden. Tätä uutta todennäköisyysjakaumaa kutsutaan ”posteriori-todennäköisyydeksi” tai yksinkertaisesti ”posterioriseksi”. Bayesilaiset lähestymistavat voivat tiivistää epävarmuutensa antamalla taka-alueelle todennäköisyysjakauman arvon, joka sisältää 95% todennäköisyydestä – tätä kutsutaan ”95%: n uskottavuusväliksi”.
Bayesilainen partisaani saattaa kritisoida tällainen usein esiintyvä luottamusväli: ”Entä jos 95 sadasta kokeesta tuottaa luottamusvälin, joka sisältää todellisen arvon? En välitä 99 kokeesta, joita en TEIN; Tärkeää tämä koe, tein. Sääntönne sallii viiden 100: sta olla täydellistä hölynpölyä [negatiiviset arvot, mahdottomat arvot], kunhan muut 95 ovat oikeita; se on ”naurettavaa”.
Usein toistuva ankaruus saattaa kritisoida Bayesin uskottavuusväliä näin: ”Entä jos 95% posteriorisesta todennäköisyydestä sisältyy tähän alueeseen? Entä jos todellinen arvo on esimerkiksi 0,37? Jos on, niin menetelmäsi, suorita alusta loppuun, on VÄÄRIN 75% ajasta. Vastauksesi on: ”No niin, se” on ok, koska priorin mukaan on hyvin harvinaista, että arvo on 0,37 ”, ja se voi olla niin, mutta haluan menetelmän, joka toimii KAIKKEN parametrin mahdollisen arvon kanssa. En välitä 99 parametrin arvosta, jota EI OLE; Välitän siitä ainoasta todellisesta arvosta, jolla sillä on. Voi, muuten, vastauksesi ovat oikeita vain, jos priori on oikea. Jos vedät sen vain tyhjästä, koska se tuntuu oikealta, voit olla kaukana. ”
Molemmissa partisaaneissa on tavallaan kritiikki toisiaan kohtaan”, mutta kehotan ajattele matemaattisesti eroa – kuten Srikant selittää.
Tässä on laajennettu esimerkki tästä puheesta, joka näyttää eron tarkasti erillisessä esimerkissä.
Milloin Olin lapsi, jonka äitini yllättää joskus satunnaisesti tilaamalla purkin suklaa-siru-evästeitä toimitettavaksi postitse.Kuljetusyhtiö varastoi neljä erilaista evästepurkkia – tyyppi A, tyyppi B, tyyppi C ja D , ja he kaikki olivat samalla kuorma-autolla, etkä ollut koskaan varma, minkä tyyppisen saat. Jokaisessa purkissa oli täsmälleen 100 evästettä, mutta ominaisuus, joka erottaa eri evästepurkit, oli niiden jakautuneet suklaalastut evästettä kohden. purkki ja otti yhden evästeen tasaisesti satunnaisesti, nämä ovat todennäköisyysjakaumat, jotka haluat ge t pelimerkkien lukumäärästä:
Esimerkiksi A-tyypin evästepurkissa on 70 evästettä kahdella siruja kukin, eikä evästeitä, joissa on vähintään neljä pelimerkkiä!D-tyypin evästepurkissa on 70 evästettä yhdellä sirulla. Huomaa, kuinka kukin pystysarakkeessa on todennäköisyysmassafunktio – ehdollisen todennäköisyyden saamasi pelimerkkien lukumäärästä, kun otetaan huomioon, että purkki = A tai B tai C tai D ja jokainen sarake on 100.
Minulla oli tapana rakastaa pelata peliä heti, kun toimittaja pudotti uuden evästepurkin. Vedän yhden yksittäisen evästeen satunnaisesti purkista, lasken sirut evästeelle ja yritän ilmaista epävarmuus – 70 prosentin tasolla – joista purkit se voisi olla. Siten se on purkin (A, B, C tai D) identiteetti, joka on -parametrin arvo arvioitu. Sirujen määrä (0, 1, 2, 3 tai 4) on tulos tai havainto tai näyte .
Pelasin tätä peliä alun perin 70%: n luottamusvälillä. Tällaisen aikavälin on varmistettava, että ei väliä parametrin todellinen arvo, eli riippumatta siitä, minkä evästepurkin sain, intervalli peittäisi todellisen arvon vähintään 70 prosentin todennäköisyydellä.
Väli on tietysti funktio, joka liittää tuloksen (rivi) parametrisarjan joukkoon (sarakejoukko). Mutta rakentamaan luottamusväli ja takaamaan 70 prosentin peitto, meidän on toimittava ”vertikaalisesti ”- tarkastelemalla kutakin saraketta vuorotellen ja varmistaen, että 70% todennäköisyysmassafunktiosta katetaan niin, että 70% ajasta, kyseisen sarakkeen identiteetti on osa tuloksena olevaa aikaväliä. Muista, että ne ovat pystysarakkeet, jotka muodostavat pmf: n.
Joten tämän toimenpiteen suorittamisen jälkeen päädyin näihin väleihin:
Jos esimerkiksi piirtämäni evästeen pelimerkkien lukumäärä on 1, luottamusvälini on {B, C, D}. Jos luku on 4, luottamusvälini on {B, C}. Huomaa, että koska jokainen sarake on vähintään 70%, riippumatta siitä, missä sarakkeessa olemme todella (riippumatta siitä, missä purkissa toimittaja pudonnut), tämän menettelyn mukainen väli sisältää oikean purkilla vähintään 70 prosentin todennäköisyydellä.
Huomaa myös, että menettelyllä, jota noudatin välien muodostamisessa, oli jonkin verran harkintaa. Tyypin B sarakkeessa olisin voinut yhtä helposti varmistaa, että B olisi 0,1,2,3 1,2,3,4: n sijasta. Se olisi johtanut 75%: n peitteeseen B-tyypin purkkeissa (12 + 19 + 24 + 20), joka vastaisi edelleen 70%.
Siskoni Bayesia ajatteli tätä sovellusta särki oli kuitenkin hullu. ”Sinun on pidettävä jakelijaa osana järjestelmää”, hän sanoi. Käsitellään purkin identiteettiä itse satunnaismuuttujana ja olkoon oletetaan , että jakelija valitsee joukon yhtenäisesti – mikä tarkoittaa, että hänellä on kaikki neljä rekassaan ja kun hän saa talollemme hän valitsee yhden sattumanvaraisesti, kullakin yhtenäisen todennäköisyyden. ”
” Tarkastellaan tällä oletuksella nyt koko tapahtuman yhteisiä todennäköisyyksiä – purkityyppi ja ensimmäisestä evästeestä piirtämiesi pelimerkkien määrä”, hän sanoi piirtäen seuraavan taulukon:
Huomaa, että koko taulukko on nyt todennäköisyysmassafunktio – eli koko taulukon summa on 100%.
” Okei, ”sanoin,” mihin olet menossa tämän kanssa? ”
” Olet tarkastellut pelimerkkien ehdollista todennäköisyyttä, ”kertoi Bayesia. ”Se on kaikki väärin! Se, mitä todella välität, on ehdollinen todennäköisyys purkista, kun otetaan huomioon evästeessä olevien pelimerkkien määrä! 70%: n välein tulisi olla vain luettelopurkit, joiden todennäköisyys olla 70% on todellinen purkki. Eikö se ole paljon yksinkertaisempaa ja intuitiivisempaa? ”
” Toki, mutta miten se lasketaan? ” Kysyin.
”Sanotaan”, sanomme tietävän , että sinulla on 3 pelimerkkiä. Sitten voimme jättää huomiotta kaikki muut taulukon rivit ja yksinkertaisesti käsitellä kyseistä riviä todennäköisyysmassafunktiona. Meidän on suurennettava todennäköisyyksiä suhteellisesti, joten jokainen rivi on kuitenkin 100. Hän teki:
”Huomaa, kuinka kukin rivi on nyt pmf, ja summa on 100%. Me ”olemme kääntäneet ehdollisen todennäköisyyden siitä, mistä aloitit – nyt on todennäköisyys, että mies pudottaa tietyn purkin, kun otetaan huomioon ensimmäisen evästeen pelimerkkien määrä.”
”Mielenkiintoista, ” Sanoin. ”Joten nyt ympyröimme vain tarpeeksi purkkeja kullekin riville, jotta saisimme jopa 70%: n todennäköisyyden?” Teimme juuri niin, tekemällä nämä uskottavuusvälit:
Jokainen väli sisältää joukon purkkeja, a posteriori , summa 70 prosentin todennäköisyydellä olla todellinen purkki.
”No, pidä kiinni”, sanoin. ”En ole vakuuttunut.Laittakaamme ”laitetaan kahden tyyppiset intervallit vierekkäin ja verrataan niiden kattavuutta ja olettaen, että toimittaja poimii jokaisen purkin saman todennäköisyyden ja uskottavuuden kanssa.”
Tässä ne ovat:
Luottamusvälit:
Luotettavuusvälit:
”Katso kuinka hulluja luottamusvälisi ovat?” sanoi Bayesia. ”Sinulla ei ole edes järkevää vastausta, kun piirrät evästeen, jossa ei ole pelimerkkejä! Sanot vain, että se on tyhjä väli. Mutta se on ilmeisesti väärä – sen on oltava yksi neljästä purkkityypistä. Kuinka voit elää itsesi kanssa ja ilmoittaa aikavälin päivän lopussa, kun tiedät, että aikaväli on väärä? Ja sama kun vedät evästeen 3 sirulla – väli on oikea vain 41% ajasta. Tämän kutsuminen ”70%” luottamusväliksi on paskaa. ”
” No, hei ”, vastasin.” Se on oikein 70% ajasta, riippumatta siitä, minkä purkin toimittaja pudotti. ”on paljon enemmän kuin voit sanoa uskottavuusvälistäsi. Entä jos purkki on tyyppiä B? Silloin aikaväli on väärä 80% ajasta ja vain 20% ajasta! ”
” Tämä näyttää suurelta ongelmalta, ”jatkoin,” koska virheesi korreloivat purkin tyyppi. Jos lähetät 100 ”Bayesin” robottia arvioidaksesi, minkä tyyppinen purkki sinulla on, kukin robotti ottaa näytteeksi yhden evästeen, kerrot minulle, että tyypin B päivinä odotat, että 80 robotista saa väärän vastauksen, kukin uskomme> 73% sen virheelliseen johtopäätökseen! Se on hankalaa, varsinkin jos haluat useimpien robottien sopivan oikeasta vastauksesta. ”
” PLUS meidän oli tehtävä tämä oletus, että toimittaja käyttäytyy ja valitsee jokaisen purkityypin satunnaisesti, ”sanoin.” Mistä se tuli? Entä jos se on väärin? Et ole puhunut hänen kanssaan; et ole haastatellut häntä. Silti kaikki lausumasi a posteriori todennäköisyydestä perustuvat hänen käyttäytymistään koskevaan lausuntoon. Minun ei tarvitse tehdä mitään tällaisia oletuksia, ja intervallini täyttää sen kriteerin edes pahimmassa tapauksessa. ”
” On totta, että uskottavuusvälini toimii huonosti tyypin B purkkeilla ”, Bayesia sanoi. ”Mutta mitä sitten? Tyypin B purkkeja tapahtuu vain 25% ajasta. Sitä tasapainottaa hyvä kattavuusni tyypin A, C ja D purkkeihin. Enkä koskaan julkaise hölynpölyä. ”
” On totta, että luottamusvälini toimii huonosti, kun olen piirtänyt evästeen, jolla ei ole pelimerkkejä ”, sanoin.” Mutta mitä sitten? Siruttomia evästeitä tapahtuu korkeintaan 27% ajasta pahimmassa tapauksessa (tyypin D purkki). Minulla on varaa antaa hölynpölyä tästä lopputuloksesta, koska YKSI purkki ei tuota väärää vastausta yli 30% ajasta. ”
” Sarakkeen summilla on merkitystä ”, sanoin.
”Rivin summilla on merkitystä”, Bayesia sanoi.
”Näen, että olemme umpikujassa”, sanoin. ”Olemme molemmat oikeassa tekemissämme matemaattisissa lauseissa, mutta olemme eri mieltä sopivasta tavasta epävarmuuden kvantifioimiseksi.”
”Se on totta”, sisareni sanoi. ”Haluatko evästeen? ”
kommentit
- hyvä vastaus – vain yksi pieni piste, sanot ” …. Sen sijaan, että sanotaan, että parametrilla on yksi tosi arvo, Bayesin menetelmä sanoo, että arvo valitaan jostakin todennäköisyysjakaumasta ….. ” Tämä ei ole totta. Bayesilainen sopii todennäköisyysjakaumaan. ilmaisemaan epävarmuutta tosi, tuntematon, kiinteä arvo. Tämä kertoo mitkä arvot ovat uskottavia, kun otetaan huomioon se, mikä tiedettiin ennen tietojen tarkkailua. Todellinen todennäköisyyslauseke on $ Pr [\ theta_0 \ in (\ theta, \ theta + d \ theta) | I] $, jossa $ \ theta_0 $ on todellinen arvo, ja $ \ theta $ oletettu arvo tietojen $ I $ perusteella.
- … cont ’ d … mutta on paljon helpompaa kirjoittaa vain $ p (\ theta) $, ymmärtämällä wha t se tarkoittaa ” taustalla ”. Tämä voi tietysti aiheuttaa paljon hämmennystä.
- anteeksi tämän super vanhan viestin elvyttäminen, mutta nopea kysymys, viestissäsi osiossa, jossa yleinen arvostelija kritisoi Bayesin lähestymistapaa: ” Entä jos todellinen arvo on esimerkiksi 0,37? Jos on, menetelmäsi, ajaa alusta loppuun, on VÄÄRIN 75% ajasta. ” Kuinka sait nämä numerot? miten 0,37 vastaa 75% väärää? Onko tämä pois jonkin tyyppisestä todennäköisyyskäyrästä? Kiitos
- @ BYS2, kun kirjoittaja sanoo, että
"What if the true value is, say, 0.37? If it is, then your method, run start to finish, will be WRONG 75% of the time"
, he antavat vain heidän tekemänsä esimerkkiluvut. Tässä nimenomaisessa tapauksessa ne viittaavat johonkin aikaisempaan jakaumaan, jonka arvo oli erittäin matala, 0,37, suurimman osan todennäköisyystiheydestä muualla. Oletamme, että esimerkkijakaumamme toimisi hyvin huonosti, kun parametrin todellinen arvo sattuu olemaan 0.37, samalla tavalla kuin Bayesian ’ uskottavuusvälit epäonnistuivat surkeasti, kun purkki sattui olemaan tyyppi B. - Kirjoittaja sanoo
"you will expect 80 of the robots to get the wrong answer, each having >73% belief in its incorrect conclusion!"
, mutta tämän olisi pitänyt olla>72%
vakaumusta, koska 72% on vähimmäisluottamus uskottavuusvälitaulukossa.
Vastaus
Käsitykseni on seuraava:
Tausta
Oletetaan, että sinulla on tietoja $ x $ ja yrität arvioida $ \ theta $. Sinulla on tiedonluontiprosessi, joka kuvaa, kuinka $ x $ luodaan ehdolla $ \ theta $. Toisin sanoen tiedät $ x $: n (esimerkiksi $ f (x | \ theta) $) jakauman.
Päätösongelma
Päätösongelmasi on: Mitkä $ \ theta $ -arvot ovat kohtuullisia, kun otetaan huomioon havaitut tiedot $ x $?
Luottamusvälit
Luottamusvälit ovat klassinen vastaus yllä olevaan ongelmaan. Tässä lähestymistavassa oletetaan, että tosi , kiinteä arvo $ \ theta $. Kun otetaan huomioon tämä oletus, käytät dataa $ x $ saadaksesi arvion $ \ theta $ (sanokaa, $ \ hat {\ theta} $). Kun olet arviosi, jonka haluat arvioida, missä todellinen arvo on suhteessa arvioosi.
Huomaa, että tässä lähestymistavassa todellinen arvo ei ole satunnaismuuttuja. Se on kiinteä, mutta tuntematon määrä. Sitä vastoin arviosi on satunnaismuuttuja, koska se riippuu tiedoistasi $ x $, jotka luotiin tietojesi luomisprosessista. Täten huomaat, että saat erilaisia arviot joka kerta, kun toistat tutkimuksen.
Yllä oleva käsitys johtaa seuraavaan metodologiaan arvioidaksesi, missä todellinen parametri on suhteessa arvioosi. Määritä intervalli $ I \ equiv [lb (x), ub (x)] $ seuraavalla ominaisuudella:
$ P (\ theta \ in I) = 0,95 $
Edellä mainitulla tavalla muodostettua väliä kutsutaan luottamusväliksi. Koska todellinen arvo on tuntematon, mutta kiinteä, todellinen arvo on joko aikavälillä tai sen ulkopuolella. Luottamusväli on tällöin lausunto todennäköisyydestä, että saamallamme aikavälillä on todellinen parametriarvo. Todennäköisyyslauseke koskee siis intervallia (ts. Todennäköisyyttä, jolla intervallilla on todellinen arvo tai ei) eikä todellisen parametriarvon sijaintia.
Tässä paradigmassa ei ole merkitystä puhu todennäköisyydestä, että todellinen arvo on pienempi tai suurempi kuin jokin arvo, koska todellinen arvo ei ole satunnainen muuttuja.
Luotettavat intervallit
Päinvastoin kuin perinteisessä lähestymistavassa, oletetaan bayesilaisessa lähestymistavassa, että todellinen arvo on satunnaismuuttuja. Siksi sieppaamme epävarmuutemme todellisen parametriarvon suhteen asettamalla ennakkojakauman tosi parametrivektorille (sanotaan $ f (\ theta) $).
Rakennamme takaosajakauman Baye-lauseella. parametrivektorille sekoittamalla priori ja meillä olevat tiedot (lyhyesti takana on $ f (\ theta | -) \ propto f (\ theta) f (x | \ theta) $).
Sitten saavutetaan pisteestimaatti käyttämällä takajakaumaa (esim. Käytä takajakauman keskiarvoa). Koska tässä paradigmassa todellinen parametrivektori on satunnainen muuttuja, haluamme myös tietää, kuinka epävarmuus meillä on piste-estimaatissamme. Siksi rakennetaan väli, jolla on seuraava:
$ P (l (\ theta) \ le {\ theta} \ le ub (\ theta)) = 0,95 $
Yllä oleva on uskottava väli.
Yhteenveto
Luotettavat välit kaappaavat nykyisen epävarmuutemme parametriarvot ja voidaan siten tulkita todennäköisyyslausekkeeksi parametrista.
Sen sijaan luottamusvälit kaappaavat epävarmuuden saamastamme intervallista (ts. sisältääkö se todellisen arvon vai ei). Siksi niitä ei voida tulkita todennäköisyyslausekkeena todellisista parametriarvoista.
Kommentit
- 95%: n luottamusväli määritelmän mukaan kattaa todellisen parametrin arvo 95 prosentissa tapauksista, kuten oikein ilmoitit. Siten mahdollisuus, että aikaväli kattaa todellisen parametriarvon, on 95%. Voit joskus sanoa jotain mahdollisuudesta, että parametri on suurempi tai pienempi kuin mikä tahansa raja, perustuen oletuksiin, jotka teet aikaväliä muodostettaessa (melko usein arvion normaalijakauma). Voit laskea P (theta > ub) tai P (ub < theta). Lausunto koskee todellakin rajaa, mutta voit tehdä sen.
- Joris, en voi ’ olla samaa mieltä. Kyllä, parametrin mille tahansa arvolle > on 95% todennäköisyys, että tuloksena oleva intervalli peittää todellisen arvon.Tämä ei tarkoita, että tietyn havainnon tekemisen ja aikavälin laskemisen jälkeen on edelleen 95% ehdollista todennäköisyyttä, kun otetaan huomioon tiedot siitä, että THAT-väli kattaa todellisen arvon. Kuten sanoin alla, muodollisesti olisi täysin hyväksyttävää, että luottamusväli sylkii [0, 1] 95% ajasta ja tyhjä joukko loput 5%. Jos sinulla on tyhjä joukko välinä, ei ole ’ t 95% todennäköisyyttä, että todellinen arvo on sisällä!
- Joris, käytin ” data ” synonyyminä ” -näytteelle, ” joten luulen, että olemme samaa mieltä. Huomautukseni on, että ’ on mahdollista olla tilanteissa otoksen ottamisen jälkeen, jossa voit todistaa ehdottomasti, että aikaväli on väärä – että se ei kata todellinen arvo. Tämä ei tarkoita, että se ei ole kelvollinen 95%: n luottamusväli. Joten et voi ’ sanoa, että luotettavuusparametri (95%) kertoo sinulle kaiken tietyn aikavälin kattavuuden todennäköisyydestä sen jälkeen, kun ’ ve tehnyt kokeen ja sai välin. Vain a posteriori -todennäköisyys, josta tieto on aikaisemman tiedossa, voi puhua siitä.
- Yhdessä Jaynesin julkaisuista bayes.wustl.edu/etj/articles/ luottamus.pdf Hän rakentaa luottamusvälin ja osoittaa sitten, että tietylle näytteelle voit olla 100% varma, että todellinen arvo ei ole ” luottamusvälissä ”. Tämä ei tarkoita ’ t, että CI on ” väärä ”, se on juuri sitä taajuusmuuttajan luottamusväli ei ole vastaus kysymykseen ” mikä on väli, joka sisältää tilastojen todellisen arvon todennäköisyydellä 95% ”. Valitettavasti tämä on kysymys, jonka haluaisimme kysyä, minkä vuoksi CI tulkitaan usein ikään kuin se olisi vastaus kysymykseen. 🙁
- @svadalli – Bayesiläinen lähestymistapa ei katso, että $ \ theta $ on satunnainen . Jaettu ei ole $ \ theta $ ($ \ theta $ on kiinteä, mutta tuntematon), se on epävarmuus $ \ theta $ : sta, joka on jaettu, riippuen tietämyksestä $ \ theta $. että $ f (\ theta) $ sieppaa on $ Pr (\ theta \ text {on aikavälillä} (\ theta, \ theta + d \ theta) | I) = f (\ theta) d \ theta $. Itse asiassa sama argumentti pätee dollariin $ X, myös sitä voidaan pitää kiinteänä, mutta tuntemattomana.
Vastaa
En ole samaa mieltä Srikantin vastauksen kanssa yhdestä perustavanlaatuisesta seikasta. Srikant totesi tämän:
”Päätösongelma: Päätösongelmasi on: Mitkä values: n arvot ovat kohtuullisia, kun otetaan huomioon havaitut tiedot x?”
Itse asiassa tämä on BAYESIAN INFERENCE-ONGELMA. Bayesin tilastoissa pyrimme laskemaan P (θ | x) eli todennäköisyyden parametriarvolle, joka annetaan havaituille tiedoille (näyte). on väli interval, jolla on 95% mahdollisuus (tai muu) sisältää todellisen arvon true, kun otetaan huomioon monet ongelman taustalla olevat oletukset.
FREQUENTIST INFERENCE ONGELMA on tämä:
Ovatko havaitut tiedot x kohtuulliset, kun otetaan huomioon oletetut values-arvot?
Julkistamistilastoissa pyrimme laskemaan P (x | θ), ts. todennäköisyyden tarkkailla tietoja (otos) oletettujen parametrien arvojen perusteella. LUOTTAMUKSEN INTERVALTI (ehkä väärä nimi) tulkitaan seuraavasti: jos satunnaisotoksen x tuottanut koe toistettaisiin monta kertaa, 95% (tai muu) näistä satunnaisotoksista muodostetuista väleistä sisältäisi parametrin todellisen arvon.
sotkea päätäsi? Tämä on ongelma toistuvissa tilastoissa ja tärkein asia Bayesin tilastoissa.
Kuten Sikrant huomauttaa, P (θ | x) ja P (x | θ) liittyvät toisiinsa seuraavasti:
P (θ | x) = P (θ) P (x | θ)
Missä P (θ) on aikaisempi todennäköisyytemme; P (x | θ) on todennäköisyys tälle priorille ja P (θ | x): lle ehdollinen data on posteriorinen todennäköisyys. Aikaisempi P (θ) on luonnostaan subjektiivinen, mutta se on maailmankaikkeutta koskevan tiedon hinta – hyvin syvällisessä mielessä.
Muut osat sekä Sikrantin että Keithin vastauksista ovat erinomaisia.
Kommentit
- Teknisesti olet oikeassa, mutta huomioi se Luottamusväli antaa joukon parametriarvoja, joille nollahypoteesi on totta. Siten ” ovat havaitut tiedot x kohtuulliset, kun otetaan huomioon hypoteesi teetasta? ” voidaan muotoilla uudelleen seuraavasti: ” Mitkä todelliset teeta-arvot olisivat yhteensopiva hypoteesi huomioiden muokattu data x? ” Huomaa, että uudelleen muotoiltu kysymys ei välttämättä tarkoita, että teeta oletetaan olevan satunnaismuuttuja.Uudelleen muotoiltu kysymys hyödyntää sitä, että teemme nollahypoteesitestejä tarkistamalla, putkiko oletettu arvo luottamusväliin.
- @svadali – luottamusvälit arvioivat dataa kiinteälle hypoteesi. Jos siis muutat yhtälön ” kiinteää ” -osaa, jos et ota huomioon hypoteesin todennäköisyyttä ennen kuin havaitset tietoja, sinun on ehdottomasti löydettävä epäjohdonmukaisuuksia ja epäyhtenäisiä tuloksia. Ehdollinen todennäköisyys ei ole ” rajoitettu ” ehtoja muutettaessa (esim. Muuttamalla ehtoja voit muuttaa ehdollisen todennäköisyyden 0: sta 1: een) . Aikaisempi todennäköisyys ottaa huomioon tämän mielivaltaisuuden. X: n ehdollistaminen tapahtuu, koska olemme varmoja, että X on tapahtunut – havaitsimme X: n!
Vastaa
aiemmin annetut vastaukset ovat erittäin hyödyllisiä ja yksityiskohtaisia. Tässä on 0,25 dollaria.
Luottamusväli (CI) on käsite, joka perustuu todennäköisyyden klassiseen määritelmään (jota kutsutaan myös ”Frequentist-määritelmäksi”), että todennäköisyys on kuin suhde ja perustuu Kolmogrovin aksiomaattiseen järjestelmään. (ja muut).
Uskottavien intervallien (korkein takimmainen tiheys, HPD) voidaan katsoa johtuvan päätöksenteoriasta, joka perustuu Waldin ja de Finettin teoksiin (ja joita muut ovat laajentaneet paljon).
Koska tämän säikeen ihmiset ovat tehneet hienoa työtä esimerkkien ja hypoteesien erojen esittämisessä Bayesin ja usein esiintyvässä tapauksessa, korostan vain muutamia tärkeitä seikkoja.
-
CI: t perustuvat siihen, että päätelmät on tehtävä kaikista kokeiden mahdollisista toistoista, jotka voidaan nähdä, ja EI vain havaituista tiedoista, jos HPD: t perustuvat HAVAITTUI havaittuihin tietoihin (ja päinvastoin aikaisempiin oletuksiimme).
-
Yleensä luottamusinfrastruktuurit eivät ole koherentteja (selitetään myöhemmin), missä HPD: t ovat johdonmukaisia (johtuen juurista päätöksentekoteoriassa). Johdonmukaisuus (kuten selitän isoäidilleni) tarkoittaa: jos parametriarvolle on annettu vedonlyöntiongelma, jos klassinen tilastotieteilijä (taajuusmies) lyö vetoa CI: stä ja Bayesin panostaa HPD: hin, taajuusmies ON KIINNITETTÄVÄ menettää (lukuun ottamatta triviaalia tapausta) kun HPD = CI). Lyhyesti sanottuna, jos haluat tiivistää kokeesi havainnot todennäköisyydeksi tietojen perusteella, todennäköisyyden PITÄÄ olla posteriorinen todennäköisyys (perustuu aikaisempaan). On olemassa lause (vrt. Heath and Sudderth, Annals of Statistics, 1978), joka (karkeasti) toteaa: Todennäköisyyden määrittäminen tietojen perusteella $ \ theta $ ei tee varma häviäjä vain ja vain, jos se saadaan bayesiläisellä tavalla.
-
Koska luottoluokituslaitokset eivät ehdollista havaittuja tietoja (kutsutaan myös ehdollisuuden periaatteeksi) Fisher oli CP: n suuri kannattaja ja löysi myös paljon paradoksaalisia esimerkkejä, kun tätä EI noudatettu (kuten CI: n tapauksessa) .Siksi hän käytti p-arvoja päättelyyn toisin kuin CI. Hänen mielestään p-arvot perustuivat havaittuihin tietoihin (paljon voidaan sanoa p-arvoista, mutta tässä ei ole kyse painopisteestä) .Kaksi erittäin tunnettua paradoksaalista esimerkkiä ovat: (4 ja 5)
-
Coxin esimerkki (Annals of Math. Stat., 1958): $ X_i \ sim \ mathcal {N} (\ mu, \ sigma ^ 2) $ (iid) kohteelle $ i \ in \ {1, \ dots, n \} $ ja haluamme arvioida kaveri $ \ mu $ . $ n $ EI OLE kiinteä ja valitaan heittämällä kolikkoa. Jos kolikonheiton tuloksena on H, valitaan 2, muuten valitaan 1000. ”Terveen järjen” estimaatti – otoskeskiarvo on puolueeton estimaatti, jonka varianssi on $ 0,5 \ sigma ^ 2 + 0,0005 \ sigma ^ 2 $ . Mitä käytämme otoksen varianssina, kun $ n = 1000 $ ? Eikä ole parempi (tai järkevämpää) käyttää otoskeskiarvon estimaattorin varianssia 0,001 dollaria \ sigma ^ 2 $ (ehdollinen varianssi) estimaattorin todellisen varianssin sijaan , joka on VALTAVA !! ( $ 0.5 \ sigma ^ 2 + 0.0005 \ sigma ^ 2 $ ). Tämä on yksinkertainen esimerkki CP: stä, kun käytämme varianssia $ 0.001 \ sigma ^ 2 $ kun $ n = 1000 $ . $ n $ itsenäisellä ei ole merkitystä tai ei ole tietoja $ \ mu $ ja $ \ sigma $ (ts. $ n $ on heille liitännäinen), mutta ANTI arvon, tiedät paljon ”tietojen laadusta”. Tämä liittyy suoraan CI: hen, koska ne sisältää varianssin, jota ei pitäisi ehdollistaa $ n $ : lla, eli käytämme suurempaa varianssia, joten liian konservatiivista.
-
Welchin esimerkki: Tämä esimerkki toimii kaikilla $ n $ -malleilla, mutta otamme $ n = 2 $ yksinkertaisuuden vuoksi. $ X_1, X_2 \ sim \ mathcal {U} (\ theta – 1/2, \ theta + 1/2) $ (iid), $ \ theta $ kuuluu Real-riviin. Tämä tarkoittaa $ X_1 – \ theta \ sim \ mathcal {U} (- 1/2, 1/2) $ (iid). $ \ frac {1} {2} ( X_1 + X_2) {\ bar x} – \ theta $ (huomaa, että tämä EI ole tilasto) jakelu on riippumaton $ \ theta $ : sta. Voimme valita $ c > 0 $ st $ \ text {Prob} _ \ theta (-c < = {\ bar x} – \ theta < = c) = 1- \ alfa (\ noin 99 \%) $ , mikä tarkoittaa, että $ ({\ bar x} – c, {\ bar x} + c) $ on 99%: n CI $ \ theta $ . Tämän CI: n tulkinta on: jos otamme toistuvasti näytteitä, saamme eri $ {\ bar x} $ ja 99% (ainakin) kertaa sen sisältävän true $ \ theta $ , MUTTA (huoneessa oleva norsu) GIVEN-tiedoille, TUNNEMME ”TUNNUSTEITA todennäköisyydestä, että CI sisältää tosi $ \ theta $ . Harkitse nyt seuraavia tietoja: $ X_1 = 0 $ ja $ X_2 = 1 $ , koska $ | X_1 – X_2 | = 1 $ , tiedämme TODELLA, että väli $ (X_1, X_2) $ sisältää $ \ theta $ (yksi mahdollinen kritiikki, $ \ text { Prob} (| X_1 – X_2 | = 1) = 0 $ , mutta voimme hoitaa sen matemaattisesti, enkä keskustele siitä). Tämä esimerkki kuvaa myös koherenssin käsitettä kauniisti. Jos olet klassinen tilastotieteilijä, lyöt varmasti vetoa 99%: n luottamusvälistä tarkastelematta $ | X_1 – X_2 | $ arvoa (olettaen, että olet uskollinen ammatti). Bayesilainen lyö vetoa CI: stä vain, jos $ | X_1 – X_2 | $ arvo on lähellä arvoa 1. Jos ehtona on $ | X_1 – X_2 | $ , intervalli on johdonmukainen ja pelaaja ei enää ole varma häviäjä (samanlainen kuin Heathin ja Sudderthin lause).
-
Fisherilla oli suositus tällaisiin ongelmiin – käytä CP: tä. Welchin esimerkissä Fisher ehdotti ehdoksi $ X_2-X_1 $ . Kuten näemme, $ X_2-X_1 $ on liitännäinen $ \ theta $ : lle, mutta se antaa tietoja teeta. Jos $ X_2-X_1 $ on Pieni, $ \ theta $ : sta ei ole paljon tietoa tiedot. Jos $ X_2-X_1 $ on SUURI, kohdassa $ \ theta $ on paljon tietoa tiedot. Fisher laajensi aputilastojen ehdollistamisstrategiaa yleiseen teoriaan nimeltä Fiducial Inference (kutsutaan myös hänen suurimmaksi epäonnistumiseksi, vrt. Zabell, Stat. Sci. 1992), mutta siitä ei tullut suosiota Fisher yritti löytää tavan, joka poikkeaa sekä klassisesta tilastosta (Neymanin koulusta) että Bayesian koulusta (tästä kuuluisa Savage-sanonta: ”Fisher halusi tehdä Bayesin munakas (eli käyttää CP: tä) ilman murtavat Bayesin munat ”). Kansanperinne (ei todisteita) sanoo: Fisher hyökkäsi keskusteluissa Neymaniin (tyypin I ja II virheiden ja CI: n vuoksi) kutsumalla häntä laadunvalvontamieheksi eikä > Tutkija , koska Neymanin menetelmät eivät ehdollineet havaittua tietoa, tarkasteli sen sijaan kaikkia mahdollisia toistoja.
-
Tilastotieteilijät haluavat myös käyttää riittävyysperiaatetta ( SP), mutta SP ja CP yhdessä tarkoittavat todennäköisyyden periaatetta (vrt. Birnbaum, JASA, 1962), ts. Annettu CP ja SP , on jätettävä huomiotta näytetila ja tarkasteltava vain todennäköisyysfunktiota. Siksi meidän on tarkasteltava vain annettuja tietoja ja EI koko näytetilaa (koko näytetilan tarkastelu on tavallaan samanlainen kuin toistuva näytteenotto). Tämä on johtanut sellaiseen käsitteeseen kuin Observed Fisher Information (vrt. Efron ja Hinkley, AS, 1978), jotka mittaavat dataa koskevia tietoja gyakorismin näkökulmasta. Tietojen tietomäärä on Bayesin käsite (ja liittyy siten HPD: hen) CI: n sijaan.
-
Kiefer teki jonkin verran perustyötä CI: n suhteen 1970-luvun lopulla, mutta hänen laajennuksistaan ei ole tullut suosittuja. Hyvä lähde on Berger (”Voisiko Fisher, Neyman ja Jeffreys sopia hypoteesien testaamisesta”, Stat Sci, 2003).
Yhteenveto:
(Srikant ja muut huomauttavat)
CI: itä ei voida tulkita todennäköisyydeksi ja ne eivät ”t kerro mitään tuntemattomasta parametrista ANNA havaitut tiedot. CI: t ovat lausuntoja toistuvista kokeista.
HPD ovat todennäköisyyksien välejä, jotka perustuvat tuntemattoman parametrin takajakaumaan, ja niillä on todennäköisyyksiin perustuva tulkinta annettujen tietojen perusteella.
Frequentist-ominaisuus (toistuva näytteenotto) on toivottava ominaisuus, ja molemmilla on myös HPD: t (sopivilla prioreilla) ja CI: llä. HPD: t ehtovat annettuja tietoja vastaamalla tuntemattomia parametreja koskeviin kysymyksiin
(Tavoite EI ole subjektiivinen) Bayesilaiset ovat yhtä mieltä klassisten tilastojen kanssa siitä, että parametrilla on yksi TOSI-arvo. Ne molemmat eroavat toisistaan siinä, miten he päättelevät tästä todellisesta parametrista.
Bayesilaiset HPD: t tarjoavat meille hyvän tavan hoitaa tietoja, mutta jos he eivät onnistu sopimaan taajuusmuuttajan kanssa CI: n ominaisuudet eivät ole kovin hyödyllisiä (analogia: henkilö, joka käyttää HPD: tä (joillakin aikaisemmilla) ilman hyvää usein esiintyvää omaisuutta, on varmasti tuomittu kuin puuseppä, joka välittää vain vasarasta ja unohtaa ruuvimeisselin)
tiedon puute siitä, että todellinen parametri vastaa diffuusin priorin käyttöä. En tiedä voinko hyväksyä väitteen (tohtori Keith on samaa mieltä kanssani). Esimerkiksi lineaaristen perusmallien tapauksessa joitain jakaumia voidaan saada käyttämällä yhtenäistä prioria (jota jotkut ihmiset kutsuvat diffuusiksi), MUTTA se EI tarkoita, että tasaista jakelua voidaan pitää MATALAN TIEDON ENNEN. Yleensä ei-informatiivinen (tavoite) priori ei tarkoita, että sillä on vähän tietoa parametrista.
Huomaa: Monet näistä pisteistä perustuvat yhden merkittävän bayesilaisen luennoista. Olen edelleen opiskelija ja voisin ymmärtää häntä jollakin tavalla väärin. Hyväksy anteeksipyyntönsä etukäteen.
Kommentit
- ” Yleinen taiteilija ON HÄVITETTÄVÄ ” Eniten äänestettyä vastausta tarkastellen en ’ d oletetaan, että tämä riippuu apuohjelmatoiminnosta (esim. ei, jos valitettavasti optimointi on käynnissä). Intuitiivisesti se voi riippua myös kyvystä määrittää edellinen funktio …
- ” Yleisöntekijä ON KÄYTÖSSÄ menettää ” … * edellyttäen, että hänellä on asianmukainen etukäteen * (mikä ei yleensä ole niin helppoa) Täydellinen esimerkki: uhkapeliriippuvaiset ovat 99% varmoja, että heidän onnensa muuttuu tällä kertaa. Ne, jotka sisällyttävät tämän ennen heidän päätöksentekonsa analyysi ei yleensä onnistu pitkällä aikavälillä.
- En mielestäni sinun tulisi lyhentää luottamusvälejä luottoluokituksina vastauksessa uskottavien ja luottamusvälien erottamiseen.
Vastaa
Aina hauska osallistua vähän filosofiaa. Pidän aivan Keithin vastauksesta, mutta sanoisin, että hän on ottamassa kantaa ”unohdettu Bayesia”. Huono kattavuus, kun tyypit B ja C voivat syntyä vain, jos hän käyttää samaa todennäköisyysjakaumaa jokaisessa oikeudenkäyntiä ja kieltäytyy päivittämästä aikaisempaa.
Voit nähdä tämän melko selvästi, sillä tyypin A ja D purkit tekevät niin sanotusti ”ennustuksia” (0-1 ja 2 3 sirua vastaavasti), kun taas tyypin B ja C purkit jakavat periaatteessa yhdenmukaisen sirujen jakautumisen. Joten toistettaessa kokeita kiinteällä ”todellisella purkilla” (tai jos otamme näytteen toisesta keksistä), sirujen tasainen jakautuminen antaa todisteita tyypin B tai C purkkeille.
Ja ”käytännöllisestä” näkökulmasta, tyypit B ja C vaativat valtavan otoksen voidakseen erottaa ne toisistaan. Kahden jakauman KL-erot ovat $ KL B || C) \ noin 0,006 \ noin KL (C || B) $. Tämä on divergenssi, joka vastaa kahta normaalijakaumaa, joiden varianssi on $ 1 $ ja ero tarkoittaa $ \ sqrt {2 \ kertaa 0,006} = 0,11 $. Joten meidän ei voida odottaa pystyvän erottamaan yhden otoksen perusteella (normaalissa tapauksessa tarvitsemme noin 320 otoskokoa tämän eron havaitsemiseksi 5%: n merkitsevyystasolla). Joten voimme perustellusti romahtaa tyypin B ja kirjoita C yhdessä, kunnes meillä on tarpeeksi iso näyte.
Mitä tapahtuu näille uskottaville aikaväleille? Meillä on nyt 100%: n kattavuus ”B” tai ”C”! Entä usein esiintyvät intervallit ? Kattavuus on muuttumaton, koska kaikki välit sisälsivät sekä B: n että C: n tai kumpaakaan, joten sitä kritisoidaan edelleen Keithin vastauksessa – 59% ja 0% havaituista 3 ja 0 pelimerkistä.
Mutta antaa olla käytännöllinen täällä.Jos optimoit jotain yhden toiminnon suhteen, sen ei voida odottaa toimivan hyvin eri toiminnossa. Sekä taajuus- että bayesialaiset intervallit saavuttavat keskimäärin halutun uskottavuus- ja luotettavuustason. Meillä on $ (0+ 99 + 99 + 59 + 99) /5=71.2$ – joten taajuusmuuttajalla on asianmukainen keskimääräinen uskottavuus. Meillä on myös $ (98 + 60 + 66 + 97) /4 = 80.3 $ – bayesilaisella on asianmukainen keskimääräinen kattavuus.
Toinen asia, jonka haluan painottaa, on se, että Bayesilainen ei sano ”parametri satunnaiseksi” määrittelemällä todennäköisyysjakauman. Bayesilaisille (hyvin, ainakin minulle joka tapauksessa) todennäköisyysjakauma on kuvaus ”Satunnaisuuden” käsitettä ei todellakaan ole Bayesin teoriassa, vain käsitteet ”tiedä” ja ”ei tiedä”. ”Tunnetut” menevät olosuhteisiin ja ”tuntemattomat” ovat mihin laskemme todennäköisyydet, jos kiinnostavat, ja syrjäytymme, jos haittaa. Joten uskottava väli kuvaa mikä tiedetään kiinteästä parametrista, keskiarvo siitä, mitä ei tiedetä siitä. Joten jos otamme evästepakkauksen pakanneen henkilön kannan ja tiesimme, että se on tyyppiä A, heidän uskottavuusväli olisi vain [A] näytteestä riippumatta riippumatta siitä, kuinka monta näytettä otettiin. Ja ne olisivat 100% tarkkoja!
Luottamusväli perustuu ”satunnaisuuteen” tai vaihteluun, joka esiintyy eri mahdollisissa näytteissä. Sellaisenaan ainoa vaihtelu, jonka he ottavat huomioon, on näytteessä oleva muunnelma. Joten luottamusväli ei ole muuttunut henkilölle, joka on pakannut evästepurkin ja uudeksi, että se on tyyppiä A. Joten jos piirrät keksi yhdellä sirulla A-tyypin purkista, taajuusmies väittää 70 prosentin varmuudella, että tyyppi oli ei A, vaikka he tietävätkin, että purkki on tyyppiä A! (jos he säilyttivät ideologiansa ja jättivät huomiotta terveen järjen). Huomaa, että näin on, huomaa, että mikään tässä tilanteessa ei ole muuttanut otosjakaumaa – olemme yksinkertaisesti ottaneet toisen henkilön näkökulman, jolla on ”ei-tietoihin” perustuvia tietoja parametrista.
Luottamus aikavälit muuttuvat vain, kun tiedot muuttuvat tai malli / otosjakauma muuttuu. uskottavuusvälit voivat muuttua, jos muu asiaankuuluva tieto otetaan huomioon.
Huomaa, että tämä hullu käyttäytyminen ei todellakaan ole sitä, mitä luottamusvälien kannattaja todella tekisi; mutta se osoittaa heikkouden menetelmän taustalla olevassa filosofiassa tietyssä tapauksessa. Luottamusvälit toimivat parhaiten, kun et tiedä paljoakaan parametrista tietojoukon sisältämien tietojen lisäksi. Ja lisäksi uskottavuusvälit eivät pysty parantamaan paljon luottamusväleillä, ellei ole olemassa ennakkotietoa, jonka luottamusväli voi ”Ei oteta huomioon tai riittävien ja liitännäistilastojen löytäminen on vaikeaa.
Kommentit
- Voin ’ t sanon ymmärtäväni Keith ’ selityksen purkkiesimerkistä, nopea kysymys: Toistan kokeen $ m $ kertaa, keräsin $ m $ erilaisia näytteitä, joten nyt minä ’ olet laskenut $ m $: n eri luottoluokitukset (kullakin 95%: n luottamustaso), mikä nyt on CI? Tarkoittaako se, että 95% $ m $: n luottoluokituksista kattaa todellisen arvon?
- @loganecolss – tämä on totta, mutta vain rajana muodossa $ m \ to \ infty $. Tämä on vakio ” -todennäköisyys ” = ” pitkän aikavälin taajuus ” CI: n taustalla oleva tulkinta.
- Kyllä, rajalla. Sitten yhdelle tai vain parille näytteelle CI: t eivät ’ tarkoita mitään, eikö? Mikä sitten ’ on laskennallinen luottamusväli, jos minulla ei ole ’ tonnia näytteitä?
- @loganecolss – että ’ s miksi ’ ma Bayesian.
- @nazka – tavallaan. Sanoisin, että on aina parasta käyttää Bayesin lähestymistapaa riippumatta siitä, kuinka paljon tietoa sinulla on. Jos tämä voidaan hyvin arvioida commonist-menettelyllä, käytä sitä. Bayesian ei ole synonyymi hitaalle.
Vastaus
Kuten ymmärrän: Luotettava väli on lausunto mielenkiinnon kohteena olevan tilaston arvojen alue, joka pysyy uskottavana tietyn otosdatan perusteella, jonka olemme todellisuudessa havainneet. Luottamusväli on lausunto tiheydestä, jolla todellinen arvo on luottamusvälillä, kun koe toistetaan useita kertoja, joka kerta eri otoksella tiedoista samasta perusjoukosta. > Tavallisesti kysymys, johon haluamme vastata, on ”mitkä tilastojen arvot ovat yhdenmukaisia havaitun datan kanssa”, ja uskottava väli antaa suoran vastauksen kysymykseen – tilastojen todellinen arvo on 95 prosentin uskottava väli todennäköisyydellä 95%.Luottamusväli ei anna suoraa vastausta tähän kysymykseen; ei ole oikein väittää, että todennäköisyys sille, että tilastojen todellinen arvo on 95%: n luottamusvälillä, on 95% (ellei se sattuu osumaan uskottavan aikavälin kanssa). Tämä on kuitenkin hyvin yleinen väärinkäsitys frekvensistisen luottamusvälin suhteen, koska tulkinta olisi suora vastaus kysymykseen.
Jaynen paperissa, josta keskustelen toisessa kysymyksessä, annetaan hyvä esimerkki tämä (esimerkki # 5), on luotu täysin oikea luottamusväli, jossa tietyn otoksen tietoihin, joihin se perustuu, sulkee pois mahdollisuuden tilastojen todellisen arvon olevan 95%: n luottamusvälillä! Tämä on vain ongelma, jos luottamusväli tulkitaan väärin tilastojen uskottavien arvojen lausekkeeksi havaitun otoksen perusteella.
Päivän lopussa kyse on ”hevosista kurssit ”, ja mikä intervalli on paras, riippuu kysymyksestä, johon haluat vastata – valitse vain menetelmä, joka vastaa suoraan kysymykseen.
Epäilen, että luottamusvälit ovat hyödyllisiä analysoitaessa [suunniteltuja] toistettavia kokeita (kuten on vain oletus luottamusvälin taustalla), ja uskottavat intervallit paremmin analysoitaessa havainnointitietoja, mutta se on vain mielipide (käytän molempia erilaisia intervalleja omassa työssäni, mutta en kuvaile itseäni kummassakaan asiantuntijana).
Kommentit
- Toistuvien kokeiden luottamusväleillä on kysymys siitä, että toistettavan kokeen ehtojen on pysyttävä ennallaan (ja jotta ne toimisivat, jotta ne toimisivat). kuka uskoisi niin?), kun taas Bayesin väli (jos sitä käytetään oikein) riippuu havaituista tiedoista ja antaa siten mahdollisuuden reaalimaailmassa tapahtuviin muutoksiin (tietojen kautta). Luulen, että Bayesin tilastojen ehtosäännöt tekevät siitä niin vaikean ylittävän (mielestäni se on mahdotonta: vain vastaavuus voidaan saavuttaa), ja automaattinen koneisto, jonka se saavuttaa, saavat sen näyttämään niin liukas.
vastaus
Löysin paljon tulkintoja luottamusvälistä ja uskottavasta joukosta. Esimerkiksi luottamusväliä ei voida ilmaista tässä muodossa $ P (\ theta \ in CI) $. Jos tarkastelet tarkasti ”jakelut” frekvenssin ja Bayesian päätelmissä, näet Frequentistin teokset näytteiden jakamisesta tiedoissa, kun taas Bayesian työskentelee parametrin (taka) jakeluun. Ne on määritelty täysin erilaisessa näytetilassa ja Sigma Algebrassa.
Joten kyllä, voit sanoa ”Jos toistat kokeen monta kertaa, noin 95% 95%: n luottamusvälineistä peittää todellisen parametrin”. Vaikka Bayesin kielellä saat sanoa ”tilastojen todellinen arvo on 95%: n uskottavalla aikavälillä todennäköisyydellä 95%”, tämä 95%: n todennäköisyys (Bayesin kielellä) itsessään on vain arvio. (Muista, että se perustuu ehtojakaumaan, joka on annettu näille tiedoille, ei otosjakaumalle). Tämän estimaattorin tulisi sisältää satunnaisotoksen aiheuttama satunnaisvirhe.
Bayesilaiset yrittävät välttää tyypin I virheitä. Bayesilaiset sanovat aina, ettei ole järkevää puhua tyypin I virheistä Bayesianissa. Tämä ei ole täysin totta. Tilastotieteilijät haluavat aina mitata mahdollisuutta tai virhettä, jonka mukaan ”tietosi suosittelevat sinua tekemään päätöksen, mutta väestö ehdottaa toisin”. Tähän Bayesian ei voi vastata (yksityiskohdat jätetään pois tästä). Valitettavasti tämä voi olla tärkein asia, jonka tilastotieteilijän tulisi vastata. Tilastotieteilijät eivät vain ehdota päätöstä. Tilastotieteilijöiden tulisi myös pystyä käsittelemään, kuinka paljon päätös voi mennä pieleen.
Minun on keksittävä seuraava taulukko ja termit käsitteen selittämiseksi. Toivottavasti tämä voi auttaa selittämään luottamusvälin ja uskottavan joukon eron.
Huomaa, että takajakauma on $ P (\ theta_0 | Data_n) $, jossa $ \ theta_0 $ määritetään aiemmasta $ P: stä. (\ theta_0) $. Usein esiintyvässä näytteenottojakauma on $ P (Data_n; \ theta) $. $ \ Hat {\ theta} $: n otosjakauma on $ P (\ hat {\ theta} _n; \ theta) $. Alaindeksi $ n $ on otoksen koko. Älä käytä notaatiota $ P (Data_n | \ theta) $ esitellessäsi näytteenottojakaumaa kanta-asiakasryhmässä. Voit puhua satunnaisista tiedoista $ P (Data_n; \ theta) $ ja $ P (\ hat {\ theta} _n; \ theta) $, mutta et voi puhua satunnaisista tiedoista muodossa $ P (\ theta_0 | Data_n) $.
”???????” selittää, miksi emme pysty arvioimaan tyypin I virhettä (tai vastaavaa) Bayesin kielellä.
Huomaa myös, että luotettavia sarjoja voidaan käyttää luotettavuusvälien arvioimiseksi joissakin olosuhteissa. Tämä on kuitenkin vain matemaattinen lähentäminen. Tulkinnan tulisi mennä taiteilijan kanssa. Tässä tapauksessa Bayesin tulkinta ei enää toimi.
Thylacoleo ”$ P (x | \ theta) $ -merkinnät eivät ole usein esiintyviä. Tämä on edelleen Bayesin kieli. Tämä merkinnät aiheuttavat perustavanlaatuisen ongelman mittausteoriassa puhuessaan usein esiintyvistä.
Olen samaa mieltä Dikran Marsupialin tekemän johtopäätöksen kanssa. Jos olet FDA: n arvostelija, haluat aina tietää mahdollisuuden hyväksyä lääkehakemus, mutta lääke ei todellakaan ole tehokas. Tätä vastausta Bayesian ei voi antaa ainakaan klassisella / tyypillisellä Bayesin kielellä.
Vastaa
Yleinen ja johdonmukainen luottamus ja luotettavat alueet. http://dx.doi.org/10.6084/m9.figshare.1528163 koodilla osoitteessa http://dx.doi.org/10.6084/m9.figshare.1528187
Kuvaus luotettavista aikaväleistä ja luotettavuudesta joukot valinnan välein yhdessä yleisen R-koodin kanssa sekä todennäköisyysfunktion että joidenkin havaittujen tietojen laskemiseksi. testitilastot, jotka antavat uskottavia ja luotettavia optimaalisen kokoisia välejä, jotka ovat keskenään yhdenmukaisia. Bayesin uskottava väli perustuu parametrien todennäköisyyteen , koska data . Se kerää parametrit, joilla on suuri todennäköisyys, uskottavaan joukkoon / intervalliin. 95 prosentin uskottava väli sisältää parametreja, joiden todennäköisyys yhdessä on 0,95 tietojen perusteella.
Yleisön luottamusväli perustuu tietyille parametreille annettujen tietojen todennäköisyys . Kullekin (mahdollisesti äärettömän monelle) parametrille se luo ensin joukon tietoja, jotka todennäköisesti otetaan huomioon parametrin perusteella. Sitten se tarkistaa jokaisen parametrin, sisältääkö valitut suuren todennäköisyyden tiedot havaitut tiedot. Jos suuren todennäköisyyden data sisältää havaitut tiedot, vastaava parametri lisätään luottamusväliin. Luottamusväli on siis niiden parametrien kokoelma, joille emme voi sulkea pois mahdollisuutta, että parametri on tuottanut tiedot. Tämä antaa sellaisen säännön, että jos sitä käytetään toistuvasti vastaaviin ongelmiin, 95%: n luottamusväli sisältää todellisen parametriarvon 95%: ssa tapauksista.
95%: n luotettava joukko ja 95%: n luotettavuusjoukko esimerkki negatiivisesta binomijakaumasta
Kommentit
- Luottamusvälien kuvaus ei ole oikea. ” 95% ” tulee todennäköisyydestä, että populaation näyte tuottaa välin, joka sisältää parametrin todellisen arvon.
- @jlimahaverford – kuvaus on oikea samoin kuin sinun. Linkin luomiseksi kuvailemallesi, olen lisännyt ”. Tämä antaa säännön, jonka 95 prosentin uskottava väli sisältää todellisen parametriarvon 95: ssä, jos sitä käytetään toistuvasti vastaaviin ongelmiin. % tapauksista. ”
- En puhu kuvauksestasi uskottavista aikaväleistä, vaan puhuin luottamusvälistä. ’ Huomaan nyt, että luottamusvälejä koskevan kappaleen keskellä aloitat jälleen puhumisen uskottavuudesta, ja mielestäni tämä on virhe. Tärkeä ajatus on tämä ” Jos tämä olisi parametrin todellinen arvo, mikä on todennäköisyys, että otan tämän äärimmäisen tai enemmän otoksen. Jos vastaus on yli 5%, se ’ s luottamusvälillä. ”
- @jlimahaverford – huolissaan ja korjattu – kiitos.
- hmm, en näe sen korjatun.
Vastaa
Tämä on enemmän kommentti, mutta liian pitkä. Seuraavassa artikkelissa: Stokastisuuden aikakauden aamunkoitto (David Mumford) Mumfordilla on seuraava mielenkiintoinen kommentti:
Vaikka kaikkia näitä todella jännittäviä käyttötapoja käytettiin tilastoihin, suurin osa tilastotieteilijöistä itse, Sir RA: n johdolla Fisher sitoi kätensä selän taakse ja vaati, että tilastoja ei voida käyttää missään, mutta täysin toistettavissa tilanteissa, ja sitten käyttää vain empiirisiä tietoja. Tämä on niin kutsuttu ”usein” koulu, joka taisteli Bayesin koulun kanssa, joka uskoi Tämä lähestymistapa kiistää sen, että tilastollisella päättelyllä voi olla mitään tekemistä todellisen ajattelun kanssa, koska tosielämän tilanteet on aina haudattu asiayhteyteen muuttujiin eikä niitä voida toistaa.Onneksi Bayesin koulu ei kuollut kokonaan, ja sitä jatkoi DeFinetti, E.T. Jaynes, arid muut.