Mi a ' különbség a konfidencia intervallum és a hiteles intervallum között?

Joris és Srikant cseréje itt arra késztetett (ismét), hogy a belső a konfidencia intervallumok és a hiteles intervallumok közötti különbség magyarázata a helyes volt. Hogyan magyaráznád a különbséget?

Válasz

I teljesen egyetért Srikant magyarázatával. Heurisztikusabb pörgés:

A klasszikus megközelítések általában azt állítják, hogy a világ egyirányú (pl. Egy paraméternek van egy bizonyos igaz értéke), és próbáljon olyan kísérleteket végezni, amelyek következtetése – nem számít a paraméter valódi értéke – legalább bizonyos minimális valószínűséggel helyes lesz.

Ennek eredményeként, hogy egy kísérlet után a bizonytalanságot kifejezzük tudásunkban, a gyakorta megközelítés “konfidencia intervallumot” használ – olyan értéktartomány, amelyet úgy terveztek, hogy a paraméter valódi értékét minimális valószínűséggel, mondjuk 95% -kal tartalmazza. A gyakori szakember megtervezi a kísérletet és a 95% -os konfidenciaintervallum-eljárást úgy, hogy minden 100 futtatott kísérlet befejezése után várhatóan a kapott konfidencia-intervallumok közül legalább 95 tartalmazza a paraméter valódi értékét. A másik 5 lehet, hogy kissé téved, vagy teljesen hülyeség – formailag ezt tekintve “rendben van, ami a megközelítést illeti, mindaddig, amíg 100 következtetésből 95 helyes. (Természetesen azt szeretnénk, ha kissé téves, nem totális hülyeség.)

A Bayes-i megközelítések másként fogalmazzák meg a problémát. Ahelyett, hogy azt mondaná, hogy a paraméternek csak egy (ismeretlen) valódi értéke van, a Bayes-i módszer szerint a paraméter értéke fix, de valamilyen valószínűségi eloszlás közül választhatunk, amelyet előzetes valószínűség-eloszlásnak nevezünk. (Egy másik módja annak mondani, hogy a mérések elvégzése előtt a Bayes-féle valószínűségi eloszlást rendel, amelyet úgy hívnak, hogy meggyőződési állapot, hogy mi a paraméter valós értéke.) Ez a “prior” ismeretes lehet (képzelje el, hogy megpróbálja a teherautó méretének becsléséhez, ha a teherautó-méretek általános eloszlását ismerjük a DMV-ből), vagy ez lehet egy légből vett feltételezés. A Bayes-i következtetés egyszerűbb – összegyűjtünk néhány adatot, majd kiszámoljuk a GIVEN the data paraméter különböző értékeinek valószínűségét. Ezt az új valószínűségeloszlást “a posteriori valószínűségnek” vagy egyszerűen “posteriornak” nevezik. A Bayes-i megközelítések összefoglalhatják bizonytalanságukat azáltal, hogy olyan értéktartományt adnak a hátsó valószínűségeloszláshoz, amely a valószínűség 95% -át tartalmazza – ezt “95% -os hitelességi intervallumnak” hívják. Ilyen gyakorisági konfidenciaintervallum: “És mi van, ha 100 kísérletből 95 olyan megbízhatósági intervallumot eredményez, amely tartalmazza a valódi értéket? Nem érdekel 99 kísérlet, NEM TETTEM; érdekel ez a kísérlet, NEM Tettem. megengedi, hogy a 100-ból 5 teljes hülyeség legyen [negatív értékek, lehetetlen értékek], amíg a többi 95 helyes; ez “nevetséges”.

A gyakori kritikus kritizálhatja a bayesi hitelességi intervallumot így: “Mi van akkor, ha a hátsó valószínűség 95% -a beletartozik ebbe a tartományba? Mi van, ha a valódi érték mondjuk 0,37? Ha igen, akkor a módszer, futtassa az elejétől a végéig, az idő 75% -ában Rossz lesz. Az Ön válasza: “Na jó, ez rendben van, mert a prior szerint nagyon ritka, hogy az érték 0,37”, és ez így is lehet, de szeretnék egy olyan módszert, amely a paraméter MINDEN lehetséges értékéhez használható. Nem érdekel a paraméter 99 értéke, amely NINCS; Érdekel az egyetlen igazi érték, amivel VAN. Ja, mellesleg a válaszaid csak akkor helyesek, ha az előbbi helyes. Ha csak kihúzza a levegőből, mert megfelelőnek érzi magát, akkor távol lehet. “

Bizonyos értelemben mindkét partizán helyesen kritizálja egymás módszereit, de én arra kérem matematikailag gondolkodjon a megkülönböztetésről – ahogy Srikant megmagyarázza.


Itt egy kibővített példa a beszélgetésből, amely pontosan egy diszkrét példában mutatja be a különbséget.

Amikor Gyerek voltam, anyám időnként meglepett, amikor megrendelt egy üveg csokoládé chips-et postai úton. A szállítmányozó cég négyféle sütitartályt tárolt – A típusú, B típusú, C típusú és D típusú , és mind ugyanazon a teherautón voltak, és soha nem voltál biztos abban, hogy milyen típust fogsz kapni. Mindegyik korsóban pontosan 100 süti volt, de az a különbség, amely megkülönböztette a különböző süti tégelyeket, az a csokoládé chips-ek megoszlása volt sütinként. egy tégelyt, és egyetlen sütit vett ki véletlenszerűen, ezek a valószínűségi eloszlások, amelyeket ge t a chipek számára:

alt szöveg

Egy A típusú cookie-ban például 70 süti található kettővel egyenként chips, és nincs négy vagy annál több chips!A D típusú süteményes edényben 70 darab sütemény található, egy-egy zsetonnal. Figyelje meg, hogy az egyes függőleges oszlopok mennyire valószínűségi tömegfüggvények – a megszerzett zsetonok számának feltételes valószínűsége, tekintettel arra, hogy a jar = A, vagy B, vagy C, vagy D, és minden oszlop összege 100.

Szerettem egy játékot játszani, amint a kézbesítő ledobta az új sütiedényemet. Egyetlen sütit véletlenszerűen kihúznék az üvegből, megszámolnám a chipeket a sütin, és megpróbálnám kifejezni bizonytalanság – 70% -os szinten – melyik üveg lehet. Így a jar (A, B, C vagy D) azonossága, amely a értéke a paraméternek becsült érték. A chipek száma (0, 1, 2, 3 vagy 4) a kimenet vagy a megfigyelés vagy a minta .

Eredetileg ezt a játékot gyakorló, 70% -os konfidencia intervallummal játszottam. Ilyen intervallumnak meg kell győződnie arról, hogy nem számít, hogy a paraméter valódi értéke, vagyis nem számít, melyik cookie-t kaptam, az intervallum legalább 70% -os valószínűséggel lefedi ezt a valódi értéket.

Természetesen intervallum egy olyan függvény, amely egy kimenetet (egy sort) és a paraméter értékkészletét (oszlopok csoportját) kapcsolja össze. De a konfidencia intervallum felépítéséhez és a 70% -os lefedettség garantálásához “függőlegesen” kell dolgoznunk “- az egyes oszlopokat sorra nézve, és megbizonyosodva arról, hogy a valószínűségi tömegfüggvény 70% -a lefedett, így az idő 70% -a, az oszlop azonossága része lesz az eredménynek. Ne feledje, hogy azok a függőleges oszlopok alkotják a pmf

Tehát az eljárás elvégzése után ezekre az intervallumokra jutottam:

írja be a kép leírását itt

Például, ha az általam kisorsolt cookie-k száma 1, akkor a konfidencia intervallum {B, C, D} lesz. Ha a szám 4, akkor a konfidencia intervallum lesz {B, C}. Vegye figyelembe, hogy mivel minden oszlop összege 70% vagy annál nagyobb, akkor függetlenül attól, hogy melyik oszlopban vagyunk valóban (függetlenül attól, hogy melyik korsóba esett a kézbesítő), az eljárás eredményeként kapott intervallum tartalmazza a helyes jar legalább 70% -os valószínűséggel.

Vegye figyelembe azt is, hogy az intervallumok összeállításakor követett eljárásomnak volt némi mozgástere. A B típusú oszlopban ugyanolyan könnyen meggyőződhettem volna arról, hogy az intervallumok, amelyek A B-érték 0,1,2,3 lenne 1,2,3,4 helyett. Ez a B típusú üvegek 75% -os fedettségét eredményezte volna (12 + 19 + 24 + 20), még mindig teljesítve a 70%.

Bayesia húgom ezt az alkalmazást gondolta a csótány mégis őrült volt. “A szállítás részét a rendszer részének kell tekintenie” – mondta a nő. “Nézzük” a korsó azonosságát mint véletlen változót, és tegyük fel azt, hogy a kézbesítő egységesen válasszon közülük – vagyis mind a négy van a teherautóján, és amikor megkapja házunkhoz egyet véletlenszerűen választ ki, mindegyiket egységes valószínűséggel. “

” Ezzel a feltételezéssel most nézzük meg az egész esemény együttes valószínűségét – a korsó típusa és az első cookie-ból lehívott chipek száma” – mondta a következő táblázatot rajzolva:

ide írja be a kép leírását

Figyelje meg, hogy az egész táblázat most egy valószínűségi tömegfüggvény – vagyis az egész tábla 100% -ot tesz ki.

” Ok, “mondtam”, merre tartasz ezzel? “

” Megnézted a chipek számának feltételes valószínűségét, tekintettel az edényre “- mondta Bayesia. “Ez mind rossz! Amit igazán érdekel, az a feltételes valószínűsége annak, hogy melyik tégelyről van szó, tekintettel a cookie-n lévő chipek számára! A 70% -os intervallumnak egyszerűen tartalmaznia kell a listás edényeket, amelyek összességében 70% -os valószínűséggel lesznek az igazi edények. Ez nem sokkal egyszerűbb és intuitívabb? “

” Persze, de hogyan tudjuk ezt kiszámolni? ” Megkérdeztem.

“Mondjuk”, mondjuk , hogy tudjuk, hogy 3 chiped van. Ezután figyelmen kívül hagyhatjuk a táblázat összes többi sorát, és egyszerűen ezt a sort valószínűségi tömegfüggvényként kezeljük. A valószínűségeket arányosan kell felnövekednünk, így minden sor összege 100-ra nő. Megtette:

ide írta a kép leírását

“Figyelje meg, hogy az egyes sorok most pmf értékűek, és 100% -ig összegeznek. “Megfordítottuk a feltételes valószínűséget abból, amivel kezdtétek – most annak a valószínűsége, hogy az ember ledob egy bizonyos korsót, tekintve az első cookie-ban lévő chipek számát.”

“Érdekes, ” Mondtam. “Tehát most csak annyi üveget karikázunk be minden sorban, hogy akár 70% -os valószínűséggel is megkapjuk? Éppen ezt tettük, megadva ezeket a hitelességi intervallumokat:

ide írja be a kép leírását

Minden intervallum tartalmaz egy sor tégelyt, amelyek a posteriori , 70% -os valószínűséggel összegezve, hogy az igazi korsó legyél. “Nem vagyok meggyőződve róla.Tegyük egymás mellé a kétféle intervallumot, és hasonlítsuk össze őket a lefedettség szempontjából, és feltételezzük, hogy a kézbesítő minden valószínűségű korsót azonos valószínűséggel, hitelességgel választ. “

Itt vannak:

Bizalmi intervallumok:

írja be a kép leírását itt

Hitelességi intervallumok:

írja ide a kép leírását

“Látja, mennyire őrültek a bizalmi intervallumok?” – mondta Bayesia. “Nincs is értelmes válaszod, amikor nulla zsetonnal rajzolsz egy sütit! Csak azt mondod, hogy ez az üres intervallum. De ez nyilvánvalóan helytelen – a négyféle üveg egyikének kell lennie. Hogyan tudsz élni magaddal, megadva egy intervallumot a nap végén, amikor tudod, hogy az intervall téves? És ugyanaz amikor 3 zsetonnal sütiket húz – az időintervallum csak az idő 41% -ában helyes. Ezt “70% -os” megbízhatósági intervallumnak nevezni baromság. “

” Nos, hé “- válaszoltam.” Ez az idő 70% -ának megfelelő, függetlenül attól, hogy melyik korsót ejtette a kézbesítő. ” “sokkal többet tud mondani a hitelességi időközökről. Mi van, ha az edény B típusú? Akkor az intervallumod az idő 80% -ában téves lesz, és csak az idő 20% -át korrigálja! “

” Ez nagy problémának tűnik – folytattam -, mert a hibáid összefüggésben lesznek a típusú korsó. Ha 100 “Bayes-i” robotot küld el, hogy felmérje, milyen típusú edénye van, minden robot egy cookie-t vesz fel, akkor azt mondja nekem, hogy a B típusú napokon 80-tól azt várja, hogy a robotok mindegyike rossz választ kap > 73% -ban hisz a helytelen következtetésében! Ez zavaró, különösen, ha azt akarja, hogy a robotok többsége megegyezzen a helyes válaszban. “

” PLUSZ azt a feltételezést kellett tennünk, hogy a kézbesítő viselkedik egységesen, és véletlenszerűen választja ki az egyes edénytípusokat – mondtam. – Ez honnan jött? Mi van, ha baj van? Még nem beszéltél vele; még nem készítettél interjút vele. Mégis minden a posteriori valószínűségű állításod ezen a viselkedésén alapuló kijelentésen nyugszik. Nem kellett ilyen feltételezéseket tennem, és intervallumom még a legrosszabb esetben. “

” Igaz, hogy a hitelességi intervallumom rosszul teljesít a B típusú edényeken “- mondta Bayesia. “De mi van? A B típusú edények csak az esetek 25% -ában fordulnak elő. Ezt kiegyenlíti az A, C és D típusú üvegek jó lefedettsége. És soha nem publikálok hülyeségeket. “

” Igaz, hogy a konfidenciaintervallumom rosszul teljesít, amikor “egy zseton nélküli sütit rajzoltam”. Chip nélküli sütik a legrosszabb esetben legfeljebb az esetek 27% -ában fordulnak elő (D típusú tégely). Megengedhetem magamnak, hogy hülyeségeket adjak ezért az eredményért, mert a NO jar nem ad hibás választ az esetek több mint 30% -ában. “

” Az oszlop összegei számítanak “- mondtam.

“A sor összegei számítanak” – mondta Bayesia.

“Látom, hogy zsákutcában vagyunk” – mondtam. “Mindkettőnknek igaza van az általunk készített matematikai állításokban, de nem értünk egyet a bizonytalanság számszerűsítésének megfelelő módjával kapcsolatban.”

“Ez igaz” – mondta a nővérem. “Szeretne egy sütit? “

megjegyzések

  • jó válasz – csak egy apróbb pont, azt mondod, hogy ” …. Ahelyett, hogy azt mondaná, hogy a paraméternek egyetlen igaz értéke van, egy Bayes-i módszer szerint az értéket valamilyen valószínűségi eloszlásból választják ki ….. ” Ez nem igaz. kifejezni a bizonytalanságot a valódi, ismeretlen, rögzített értékkel kapcsolatban. Ez megmondja, hogy mely értékek hihetőek, figyelembe véve azt, ami az adatok megfigyelése előtt ismert volt. A tényleges valószínűségi állítás $ Pr theta) | I] $, ahol $ \ theta_0 $ az igazi érték, és $ \ theta $ a feltételezett, a $ I $ információ alapján.
  • … cont ‘ d … de sokkal kényelmesebb, ha csak $ p (\ theta) $ -ot írsz, wha megértésével t ez azt jelenti, hogy ” a háttérben “. Ez nyilvánvalóan sok zavart okozhat.
  • sajnálom, hogy újjáélesztettem ezt a szuper régi bejegyzést, de egy gyors kérdés, abban a szakaszban, amelyben a gyakori szakember kritizálja a Bayes-i megközelítést:

Mi van, ha a valódi érték mondjuk 0,37? Ha igen, akkor az ön módszere, futtassa az elejétől a végéig, az idő 75% -ában Rossz lesz. ” Hogyan szerezte meg ezeket a számokat? hogy a 0,37 megfelel a 75% -os hibának? Ez valamilyen valószínűségi görbén kívül esik? Köszönet

  • @ BYS2, amikor a szerző azt mondja, hogy "What if the true value is, say, 0.37? If it is, then your method, run start to finish, will be WRONG 75% of the time", csak példaszámokat adnak meg. Ebben a konkrét esetben valamilyen korábbi eloszlásra utalnának, amelynek 0,37-es értéke nagyon alacsony volt, valószínűségi sűrűségének nagy részével másutt. Feltételezzük, hogy a példamegoszlásunk nagyon gyengén teljesít, ha a paraméter valós értéke véletlenül 0.37, hasonlóan ahhoz, ahogy a Bayesia ‘ hitelességi intervallumai csúnyán kudarcot vallottak, amikor a korsó B típusú volt.
  • A szerző szerint "you will expect 80 of the robots to get the wrong answer, each having >73% belief in its incorrect conclusion!", de ennek >72% hiedelemnek kellett volna lennie, mivel a hitelességi intervallumok táblázatában a minimális hitelesség a 72%.
  • Válasz

    Megértésem a következő:

    Háttér

    Tegyük fel, hogy van néhány $ x $ adata, és megpróbálja megbecsülni a $ \ theta $ értéket. Van egy adatgenerálási folyamata, amely leírja, hogyan keletkezik a $ x $ a $ \ theta $ feltételhez kötve. Más szavakkal, ismeri a $ x $ (mondjuk, $ f (x | \ theta) $ eloszlását.

    Következtetési probléma

    A következtetési problémád a következő: Milyen $ \ theta $ értékek vannak ésszerűek a megfigyelt $ x $ adatokra való tekintettel?

    Bizalmi intervallumok

    A bizalmi intervallumok klasszikus válasz a fenti problémára. Ebben a megközelítésben feltételezzük, hogy van igaz , fix értéke $ \ theta $. Ezt a feltételezést figyelembe véve a $ x $ adatokat használja a $ \ theta $ becsléséhez (mondjuk: $ \ hat {\ theta} $). Ha megvan a becsléseddel azt akarod felmérni, hogy a valódi érték hol áll a becslésedhez képest.

    Vegye figyelembe, hogy ebben a megközelítésben az igazi érték nem véletlen változó. Ez egy fix, de ismeretlen mennyiség. Ezzel szemben a becslés egy véletlen változó, mivel az az adatgenerálási folyamat során keletkezett $ x $ adataitól függ. Így rájössz, hogy más becslések minden alkalommal, amikor megismétli a tanulmányt.

    A fenti megértés a következő módszertant eredményezi annak felmérésére, hogy az igaz paraméter hol áll a becsléséhez képest. Adjon meg egy intervallumot, $ I \ equiv [lb (x), ub (x)] $ a következő tulajdonsággal:

    $ P (\ theta \ in I) = 0,95 $

    A fentiekhez hasonlóan felépített intervallum az úgynevezett konfidencia intervallum. Mivel a valódi érték ismeretlen, de rögzített, a valódi érték vagy az intervallumban van, vagy az intervallumon kívül van. A konfidencia-intervallum tehát annak a valószínűségére vonatkozó állítás, hogy az általunk kapott intervallum valóban a valós paraméterértékkel rendelkezik. Így a valószínűség-kijelentés inkább az intervallumról szól (azaz annak az esélynek az esélye, amelynek az intervalluma megvan a valódi értékkel vagy sem), nem pedig a valódi paraméterérték helyéről szól.

    Ebben a paradigmában értelmetlen beszéljen annak valószínűségéről, hogy a valódi érték kisebb vagy nagyobb, mint valamilyen érték, mivel a valódi érték nem véletlenszerű változó.

    Hiteles intervallumok

    A klasszikus megközelítéssel ellentétben a bayesi megközelítésben feltételezzük, hogy a valódi érték véletlen változó. Így a valódi paraméterértékkel kapcsolatos bizonytalanságunkat rögzítjük egy előzetes eloszlás előírásával a valódi paramétervektorra (mondjuk $ f (\ theta) $).

    Bayes-tétel felhasználásával megalkotjuk a posterior eloszlást. a paramétervektorhoz úgy, hogy összekeverjük a priorot és a rendelkezésünkre álló adatokat (röviden a hátsó rész $ f (\ theta | -) \ propto f (\ theta) f (x | \ theta) $).

    Ezután a hátsó eloszlás felhasználásával eljutunk egy pontbecsléshez (pl. Használjuk a hátsó eloszlás átlagát). Mivel azonban ebben a paradigmában az igazi paramétervektor véletlen változó, ezért azt is szeretnénk megismerni, hogy mekkora a bizonytalanság a pontbecslésünkben. Így olyan intervallumot készítünk, amely a következőket teljesíti:

    $ P (l (\ theta) \ le {\ theta} \ le ub (\ theta)) = 0,95 $

    A fenti hiteles intervallum.

    Összegzés

    A hiteles intervallumok rögzítik a jelenlegi bizonytalanságunkat a paraméterértékeket, és így valószínűségi állításként értelmezhető a paraméterről.

    Ezzel szemben a konfidencia intervallumok rögzítik a bizonytalanságot az általunk kapott intervallummal kapcsolatban (vagyis hogy tartalmazza-e a valódi értéket vagy sem). Így nem értelmezhetők valószínűségi állításként a valódi paraméterértékekről.

    Megjegyzések

    • A definíció szerint 95% -os megbízhatósági intervallum fedi az igaz paramétert érték az esetek 95% -ában, ahogy helyesen jelezte. Így annak az esélye, hogy az intervallum lefedi a valódi paraméterértéket, 95%. Néha mondhat valamit arról az esélyről, hogy a paraméter nagyobb vagy kisebb, mint bármelyik határ, az intervallum összeállításakor tett feltételezések alapján (elég gyakran a becslés normális eloszlása). Kiszámíthatja a P (theta > ub) vagy a P (ub < theta) értéket. Az állítás valóban a határról szól, de megteheti.
    • Joris, nem tudok ‘ egyetérteni. Igen, a paraméter bármely értéke esetén > 95% a valószínűsége annak, hogy az így kapott intervallum lefedi a valódi értéket.Ez nem ‘ nem azt jelenti, hogy egy adott megfigyelés elvégzése és az intervallum kiszámítása után még mindig 95% -os feltételes valószínűség van, tekintettel arra az adatra, hogy a THAT intervallum lefedi a valódi értéket. Mint az alábbiakban mondtam, formailag teljesen elfogadható lenne, ha egy konfidenciaintervallum az idő 95% -át [0, 1] köpné ki, a többi 5% pedig az üres halmaz. Azon alkalmakkor, amikor intervallumként az üres halmazt kapja, nincs ‘ t 95% a valószínűsége annak, hogy a valódi érték belül van!
    • Joris, én a ” data ” a ” minta szinonimájaként, ” tehát szerintem egyetértünk. Azt akarom mondani, hogy ‘ lehetséges, hogy a mintavétel után olyan helyzetekben tartózkodj, ahol teljes bizonyossággal bebizonyíthatod, hogy az intervallumod téves – hogy nem fedi le a igazi érték. Ez nem azt jelenti, hogy ez nem érvényes 95% -os megbízhatósági intervallum. Tehát ‘ nem mondhatja el, hogy a megbízhatósági paraméter (a 95%) bármit is mondana egy adott intervallum lefedettségének valószínűségéről, miután ‘ ve elvégezte a kísérletet és megkapta az intervallumot. Csak a posteriori valószínűségről beszélhet erről egy előbbi.
    • Az egyik Jaynes-cikkben bayes.wustl.edu/etj/articles/ confidence.pdf Felépít egy megbízhatósági intervallumot, majd megmutatja, hogy az adott minta esetében 100% -ban biztos lehet abban, hogy a valós érték nem a ” megbízhatósági intervallumban rejlik “. Ez nem jelenti azt, hogy a CI ” helytelen “, ez csak annyit jelent, hogy a CI ‘ A gyakorisági konfidencia intervallum nem válasz arra a kérdésre, hogy ” mi az az intervallum, amely a statisztika valódi értékét 95% -os valószínűséggel tartalmazza “. Sajnos ezt a kérdést szeretnénk feltenni, ezért értelmezik a CI-t gyakran úgy, mintha válasz lenne erre a kérdésre. 🙁
    • @svadalli – a bayesi megközelítés nem gondolja, hogy a $ \ theta $ véletlenszerű . Nem a $ \ theta $ van elosztva ($ \ theta A $ fix, de ismeretlen), ez az elosztott bizonytalanság a $ \ theta $ körül, a $ \ theta $ ismeretállapotától függ. amit $ f (\ theta) $ rögzít, az $ Pr (\ theta \ text {intervallumban van} (\ theta, \ theta + d \ theta) | I) = f (\ theta) d \ theta $. valójában ugyanez az argumentum vonatkozik a $ X $ -ra is, ez is fixnek tekinthető, de ismeretlen.

    Válasz

    Nem értek egyet Srikant válaszával egy alapvető kérdésben. Srikant ezt állította:

    “Következtetési probléma: A következtetési problémád a következő: Milyen values értékek ésszerűek, figyelembe véve a megfigyelt x adatokat?”

    Valójában ez a BAYESI INFERENCE PROBLÉMA. A Bayes-i statisztikákban P (θ | x), azaz a megfigyelt adatok (minta) adott paraméterérték valószínűségének kiszámítását igyekszünk kiszámítani. olyan interval intervallum, amelynek 95% esélye van (vagy másra), hogy tartalmazza a θ valódi értékét, figyelembe véve a probléma alapját képező számos feltételezést.

    A FREQUENTIST INFERENCE PROBLÉMA ez:

    A megfigyelt adatok x ésszerűek-e a θ feltételezett értékeire tekintettel?

    A gyakorisági statisztikákban arra törekszünk, hogy kiszámítsuk a P (x | θ) értéket, vagyis az adatok (minta) megfigyelésének valószínűségét a feltételezett paraméterérték (ek) alapján. A MEGBÍZHATÓ INTERVÁLUMOT (valószínűleg helytelen elnevezést) úgy értelmezik: ha az x véletlenszerű mintát létrehozó kísérletet sokszor megismételnék, akkor a véletlen mintákból összeállított ilyen intervallumok 95% -a (vagy más) tartalmazná a paraméter valódi értékét.

    Rendetlenség a fejeddel? Ez a probléma a gyakorisági statisztikákkal és a legfontosabb dolog, ami a bayesi statisztikákkal jár.

    Amint Sikrant rámutat, P (θ | x) és P (x | θ) a következőképpen kapcsolódnak egymáshoz:

    P (θ | x) = P (θ) P (x | θ)

    Ahol P (θ) a korábbi valószínűségünk; P (x | θ) a valószínűsége az a prior és P (θ | x) feltételes adat a hátsó valószínűség. Az előtti P (θ) eredendően szubjektív, de ez az univerzumról szóló tudás ára – nagyon mély értelemben.

    A Sikrant és Keith válaszainak többi része is kiváló.

    Megjegyzések

    • Technikailag igazad van, de ne feledd, hogy a konfidenciaintervallum megadja azokat a paraméterértékeket, amelyekre a nullhipotézis igaz. Így ” a megfigyelt adatok x ésszerűek, ha figyelembe vesszük a tétára vonatkozó hipotézisünket? ” átfogalmazható úgy, hogy ” A theta milyen valós értékei lennének kompatibilis hipotézisek ed adatok x?Az átfogalmazott kérdés kihasználja azt a tényt, hogy nullhipotézis teszteket hajtunk végre azzal, hogy megvizsgáljuk, hogy a feltételezett érték a konfidencia intervallumba esik-e. hipotézis. Így amikor az egyenlet ” fix ” részét megváltoztatja, ha nem veszi figyelembe a hipotézis valószínűségét, mielőtt megfigyelné adatokat, akkor mindenképpen következetlenségekkel és következetlen eredményekkel kell előállnia. A feltételes valószínűség nem ” korlátozott ” a feltételek megváltoztatásakor (pl. A feltételek megváltoztatásával a feltételes valószínűséget 0-ról 1-re módosíthatja) . Az előzetes valószínűség figyelembe veszi ezt az önkényt. Az X feltételezését azért végezzük el, mert biztosak vagyunk benne, hogy X bekövetkezett – megfigyeltük X-et!

    Válasz

    A A korábban adott válaszok nagyon hasznosak és részletesek. Itt van az én $ 0,25. (és mások).

    A hiteles intervallumok (legmagasabb hátsó sűrűség, HPD) Wald és de Finetti művein alapulva (és mások által sokat kibővítve) a döntéselmélet gyökereinek tekinthetők.

    Mivel ebben a szálban az emberek nagyszerű munkát végeztek a példák és a hipotézisek különbségének felhozatalában a Bayes-i és a gyakoriság eseteiben, csak néhány fontos pontot hangsúlyozok.

    1. A CI-k azon a tényen alapulnak, hogy következtetéseket kell levonni egy kísérlet minden lehetséges ismétléséről, amely látható, és NEM csak a megfigyelt adatokra, ahol a HPD-k TELJESEN a megfigyelt adatokon alapulnak (és elõzetes feltételezéseinken kívül).

    2. Általában a CI-k NEM koherensek (később kifejtjük), ahol a HPD-k koherensek (a döntéselmélet gyökerei miatt). A koherencia (amint azt nagyanyámnak elmagyaráznám) azt jelenti: fogadási problémát adva egy paraméterértékre, ha egy klasszikus statisztikus (gyakortaíró) CI-re és Bayes-féle HPD-re fogad, a gyakoriság elveszíti veszteségét (a triviális eset kivételével). amikor HPD = CI). Röviden, ha a kísérlet eredményeit valószínűségként kívánja összefoglalni az adatok alapján, a valószínűség HAS posterior valószínűségű (egy előzetes alapján). Van egy tétel (vö. Heath and Sudderth, Annals of Statistics, 1978), amely (nagyjából) kimondja: Az adatok alapján a valószínűség $ \ theta $ hozzárendelése nem teszi lehetővé biztos vesztes, ha és csak akkor, ha azt bayesi módon nyerik.

    3. Mivel a CI-k nem kötik a megfigyelt adatokat (más néven “Feltétel-elv” CP-t), ott Paradox példák lehetnek: Fisher nagy támogatója volt a CP-nek, és sok paradox példát is talált, amikor ezt NEM követték (mint a CI esetében). Ez az oka annak, hogy p-értékeket alkalmazott következtetésre, szemben a CI. Véleménye szerint a p-értékek a megfigyelt adatokon alapultak (sokat el lehet mondani a p-értékekről, de itt nem ez áll a középpontban). A két leghíresebb paradox példa a következő: (4 és 5)

    4. Cox példája (Annals of Math. Stat., 1958): $ X_i \ sim \ mathcal {N} (\ mu, \ sigma ^ 2) $ (iid) a $ i \ esetében \ {1, \ dots, n \} $ , és szeretnénk társ $ \ mu $ . A $ n $ NEM rögzített, és érme dobásával választják meg. Ha az érme dobása H-t eredményez, akkor 2-t választunk, különben 1000-et választunk. A “józan ész” becslés – a minta átlaga egy elfogulatlan becslés, amelynek szórása $ 0.5 \ sigma ^ 2 + 0.0005 \ sigma ^ 2 $ . Mit használunk a minta varianciájaként, amikor $ n = 1000 $ ? Nem jobb (vagy ésszerű) a minta átlagbecslőjének varianciáját $ 0,001 \ sigma ^ 2 $ (feltételes variancia )ként használni a becslő tényleges varianciája helyett , ami HATALMAS !! ( $ 0.5 \ sigma ^ 2 + 0.0005 \ sigma ^ 2 $ ). Ez a CP egyszerű példája, amikor a varianciát $ 0.001 \ sigma ^ 2 $ amikor $ n = 1000 $ . $ Az n $ önállónak nincs jelentősége vagy nincs információja a $ \ mu $ és a $ \ sigma $ (azaz a $ n $ kiegészítő számukra), de MEGADVA az értékét, sokat tud az “adatok minőségéről”. Ez közvetlenül kapcsolódik a CI-hez, mivel ezek vonja be azt a varianciát, amelyet nem szabad a $ n $ feltételhez kötni, vagyis végül a nagyobb varianciát használjuk, tehát túl konzervatív.

    5. Welch példája: Ez a példa bármely $ n $ esetén működik, de a $ n = 2 $ az egyszerűség kedvéért. $ X_1, X_2 \ sim \ mathcal {U} (\ theta – 1/2, \ theta + 1/2) $ (iid), $ \ theta $ a Real sorhoz tartozik. Ez azt jelenti, hogy $ X_1 – \ theta \ sim \ mathcal {U} (- 1/2, 1/2) $ (iid). $ \ frac {1} {2} ( X_1 + X_2) {\ bar x} – \ theta $ (vegye figyelembe, hogy ez NEM statisztika) a $ \ theta $ független elosztással rendelkezik. Választhatunk $ c > 0 $ st $ \ text {Prob} _ \ theta (-c < = {\ bar x} – \ theta < = c) = 1- \ alfa (\ kb 99 \%) $ , ami azt jelenti, hogy a $ ({\ bar x} – c, {\ bar x} + c) $ a 99% CI $ \ theta $ . Ennek a CI-nek az értelmezése: ha ismételten veszünk mintát, akkor más $ {\ bar x} $ -ot kapunk, és legalább 99% -szor igaz $ \ theta $ , DE (az elefánt a szobában) egy GIVEN adat esetén NEM “” ismerjük annak valószínűségét, hogy a CI igaz $ \ theta $ . Most vegye figyelembe a következő adatokat: $ X_1 = 0 $ és $ X_2 = 1 $ , mivel $ | X_1 – X_2 | = 1 $ , BIZTOSAN tudjuk, hogy az intervallum A $ (X_1, X_2) $ tartalmaz $ \ theta $ (egy lehetséges kritika, $ \ text { Prob} (| X_1 – X_2 | = 1) = 0 $ , de matematikailag tudjuk kezelni, és nem fogom megvitatni). Ez a példa a koherencia fogalmát is gyönyörűen szemlélteti. Ha klasszikus statisztikus vagy, akkor mindenképpen fogadni fog a 99% -os CI-re anélkül, hogy megnéznéd a $ | X_1 – X_2 | $ értékét (feltéve, hogy hű vagy szakma). A bayesiánus azonban csak akkor fogad a CI-re, ha a $ | X_1 – X_2 | $ értéke közel 1. Ha feltételezzük a $ | X_1 – X_2 | $ , az intervall koherens, és a játékos nem lesz többé biztos vesztes (hasonlóan Heath és Sudderth tételéhez).

    6. Fishernek ajánlása volt ilyen problémákra – használja a CP-t. Welch példájához Fisher javasolta a $ X_2-X_1 $ feltétel feltételét. Mint látjuk, a $ X_2-X_1 $ kiegészítő eszköz a $ \ theta $ -hoz, de információt nyújt theta. Ha a $ X_2-X_1 $ KIS, akkor nincs sok információ a $ \ theta $ -ról az adat. Ha a $ X_2-X_1 $ NAGY, sok információ található a $ \ theta $ -ról adat. Fisher kiterjesztette a kiegészítő statisztika kondicionálásának stratégiáját egy Fiducial Inference nevű általános elméletre (amelyet legnagyobb kudarcának is neveznek, vö. Zabell, Stat. Sci. 1992), de ez nem vált népszerűvé Az általános és rugalmasság hiánya. Fisher a klasszikus statisztikáktól (a Neyman iskola) és a bayesi iskolától (így a Savage híres közleményétől) is megpróbált más utat találni: “Fisher Bayes-omlettet szeretett volna elkészíteni (azaz CP-t használva) anélkül, hogy a folklór (nincs bizonyíték) azt mondja: Fisher vitáiban megtámadta Neymant (I. és II. típusú hiba és CI miatt) azzal, hogy minőségellenőr nek nevezte, nem pedig A Scientist nél, mivel Neyman módszerei nem függenek a megfigyelt adatoktól, ehelyett az összes lehetséges ismétlést megvizsgálták.

    7. A statisztikusok a megfelelőségi elvet is szeretnék használni ( SP) a CP mellett. De SP és CP együttesen a Likelihood Principle-t (LP) jelenti (vö. Birnbaum, JASA, 1962), azaz adott CP és SP , figyelmen kívül kell hagyni a mintateret, és csak a valószínűség függvényt kell vizsgálni. Így csak a megadott adatokat kell megvizsgálnunk, és a NOT t a teljes mintaterületre kell néznünk (a teljes mintaterület vizsgálata hasonló módon hasonlít az ismételt mintavételhez). Ez olyan koncepcióhoz vezetett, mint az Observed Fisher Information (vö. Efron és Hinkley, AS, 1978), amelyek gyakoriak szempontból mérik az adatokkal kapcsolatos információkat. Az adatokban szereplő információk mennyisége bayesi fogalom (és ezért a HPD-hez kapcsolódik), a CI helyett. kiterjesztései nem váltak népszerűvé. Jó referenciaforrás Berger (“Lehet, hogy Fisher, Neyman és Jeffreys egyetértenek a hipotézisek tesztelésében”, Stat Sci, 2003).


    Összegzés:

    (amint arra Srikant és mások rámutattak)
    A CI-k nem értelmezhetők valószínűségként, és nem “nem mond semmit az ismeretlen paraméterről MEGADJA A megfigyelt adatokat. A CI-k ismételt kísérletekről szóló állítások.

    A HPD valószínűségi intervallumok az ismeretlen paraméter hátsó eloszlásán alapulnak, és valószínűségi alapú értelmezéssel rendelkeznek az adott adatok alapján.

    A gyakori tulajdonság (ismételt mintavétel) tulajdonság kívánatos tulajdonság, és a HPD-k (megfelelő priorokkal) és a CI egyaránt rendelkeznek. A HPD-k az ismeretlen paraméterrel kapcsolatos kérdések megválaszolásakor is feltételezik a megadott adatokat.

    (Cél NEM szubjektív) A Bayesiek egyetértenek a klasszikus statisztikusokkal abban, hogy a paraméternek egyetlen IGAZ értéke van. Mindkettő azonban különbözik abban a tekintetben, ahogyan következtetni kíván erre az igazi paraméterre.

    A Bayes-i HPD-k jó módot kínálnak az adatok kondicionálására, de ha nem sikerül megegyezniük a gyakoriakkal a CI tulajdonságai nem túl hasznosak (analógia: aki HPD-ket használ (jó néhány előbbivel) jó gyakorisági tulajdonság nélkül, eleve kárhoztatva van, mint egy ács, aki csak a kalapáccsal törődik és elfelejti a csavarhúzót)

    Végül láttam embereket ebben a szálban (Dr. Joris megjegyzése: “… az ezzel kapcsolatos feltételezések diffúz előzményt, azaz a valódi paraméter ismeretének teljes hiányát jelentik”.) a valódi paraméter ismeretének hiánya a diffúz előtag használatával egyenértékű. NEM tudom, hogy egyet tudok-e érteni az állítással (Dr. Keith egyetért velem). Például az alap lineáris modellek esetében egyes eloszlások elérhetőek egy egyenletes prior használatával (amelyet egyesek diffúznak neveztek), DE NEM azt jelenti, hogy az egyenletes eloszlás ELŐZETTEN alacsony információsnak tekinthető. A NEM INFORMATÍV (Objektív) prior nem azt jelenti, hogy kevés információja van a paraméterről.

    Megjegyzés: Sok ilyen ponton alapul az egyik prominens bayesi előadásról. Még mindig hallgató vagyok, és valamilyen módon félreérthettem volna. Kérjük, fogadja el előre a bocsánatkérésemet.

    Hozzászólások

    • ” a gyakoriság KÖTELES veszíteni ” A legtöbb szavazatot kapott választ nézve I ‘ d feltételezzük, hogy ez a segédfunkciótól függ (pl. nem akkor, ha sajnálatos optimalizálás folyik). Intuitív módon ez függhet az előző függvény meghatározásának képességétől is.
    • ” a gyakornok KÖTELEZŐ elveszíteni ” … * a megfelelő előzetes * feltételektől függően (ami általában nem olyan egyszerű) Tökéletes példa: a szerencsejáték-függők 99% -ban biztosak abban, hogy szerencséjük ezúttal megváltozik. Akik ezt beépítik, döntésük elemzése általában hosszú távon nem megy olyan jól.
    • Nem hiszem, hogy a konfidenciaintervallumokat CI-ként > rövidítenem kell, hogy id = “6e92f73347”>

    i> a hiteles intervallumok és a megbízhatósági intervallumok közötti különbségtételre adott válaszban.

    Válasz

    Mindig jó szórakozás egy kis filozófiában. Nagyon tetszik Keith válasza, azonban azt mondanám, hogy “Mr. Felejtõ Bayesia” álláspontot képviseli. A rossz lefedettség akkor, amikor a B és a C típusú csak akkor jöhet létre, ha ugyanazon valószínűségeloszlást alkalmazza minden tárgyalást folytat, és nem hajlandó frissíteni az előbbit.

    Ezt egészen világosan láthatja, mert az A és D típusú edények úgymond “határozott jóslatokkal” szolgálnak (0-1 és 2 esetén) 3 chip), míg a B és C típusú edények alapvetően egyenletes chipeloszlást biztosítanak. Tehát a kísérlet megismételésekor néhány rögzített “igazi tégely” (vagy ha másik kekszből vettünk mintát) a chipek egyenletes elosztása bizonyítékot szolgáltat a B vagy C típusú üvegeknél.

    És “gyakorlati” szempontból a B és C típusokhoz óriási minta szükséges, hogy meg lehessen különböztetni őket. A két eloszlás KL eltérései $ KL ( B || C) \ kb. 0,006 \ kb. KL (C || B) $. Ez két normális eloszlásnak megfelelő divergencia, mindkettő $ 1 $ szórással és különbséggel $ \ sqrt értéke {2 \ szorosa 0,006} = 0,11 $. Tehát valószínűleg nem várható el, hogy képesek legyenek megkülönböztetni egy minta alapján (normál esetben kb. 320 mintaméretre lenne szükségünk, hogy 5% -os szignifikancia szinten észleljük ezt a különbséget). Tehát megalapozottan összeomolhatjuk a B és írja be a C-t együtt, egészen addig, amíg elég nagy mintánk van.

    Most mi történik azokkal a hiteles intervallumokkal? Valójában most 100% -os lefedettséggel rendelkezünk “B vagy C” -vel! ? A lefedettség változatlan, mivel az összes intervallum tartalmazta mind B-t, mind C-t, vagy egyiket sem, így továbbra is kritikus kritikák alá esnek Keith válaszában – 59% és 0% a megfigyelt 3 és 0 zseton esetében.

    De legyen itt pragmatikus.Ha valamit optimalizál egy funkció függvényében, akkor nem várható el, hogy egy másik függvénynél jól működjön. Mindazonáltal mind a gyakorisági, mind a bayesi intervallumok átlagosan elérik a kívánt hitelességi / megbízhatósági szintet. Van $ (0+ 99 + 99 + 59 + 99) /5=71.2$ – tehát a gyakoriságnak megfelelő átlagos hitelessége van. Van $ (98 + 60 + 66 + 97) /4=80.3 $ értéke is – a bayesi megfelelő átlagos lefedettséggel rendelkezik.

    Egy másik pontot szeretnék hangsúlyozni, hogy a Bayes-féle nem azt mondja, hogy “a paraméter véletlenszerű” egy valószínűségi eloszlás hozzárendelésével. A Bayes-i (nos, legalábbis nekem mindenképp) valószínűségi eloszlás egy leírás A véletlenszerűség fogalma a Bayes-elméletben nem igazán létezik, csak a “tudás” és a “nem tudás” fogalma. Az “ismertek” belemennek a feltételekbe, az “ismeretlenek” pedig mire számoljuk a valószínűségeket, ha érdekli őket, és marginalizáljuk, ha kellemetlenséget okozunk. ami ismert egy fix paraméterről, átlagolva azt, ami nem ismert róla. Tehát, ha annak a személynek az álláspontját képviselnénk, aki bepakolta a sütitartót, és tudta, hogy A típusú, akkor hitelességi intervalluma csak [A] lesz, függetlenül a mintától, és nem számít, hány mintát vettek. És 100% -ban pontosak lennének!

    A megbízhatósági intervallum a különböző véletlenszerűségen vagy variáción alapul, amely a különböző lehetséges mintákban létezik. Mint ilyen, csak a mintában szereplő változatot veszik figyelembe. Tehát a konfidenciaintervallum változatlan annak a személynek, aki csomagolta a sütiedényt, és újdonság, hogy az A típusú volt. Tehát, ha 1 kekszet húzna ki a kekszből az A típusú tégelyből, a gyakornok 70% -os magabiztossággal állítja, hogy nem A, pedig tudják, hogy az üveg A típusú! (ha fenntartották ideológiájukat és figyelmen kívül hagyták józan eszüket). Annak megállapításához, hogy ez a helyzet, vegye figyelembe, hogy ebben a helyzetben semmi sem változtatta meg a mintavételi eloszlást – egyszerűen egy másik személy perspektíváját vettük figyelembe, egy paraméterrel kapcsolatos, nem adatalapú információkkal.

    Bizalom az intervallumok csak akkor változnak, ha az adatok megváltoznak, vagy a modell / mintavételi eloszlás megváltozik. a hitelességi intervallumok megváltozhatnak, ha más releváns információkat is figyelembe vesznek.

    Ne feledje, hogy ez az őrült magatartás bizonyára nem az, amelyet a megbízhatósági intervallumok híve valósítana meg; de bizonyítja a módszer alapjául szolgáló filozófia gyengeségét egy adott esetben. A bizalmi intervallumok akkor működnek a legjobban, ha nem tudsz sokat egy paraméterről, amely meghaladja az adatsorban található információt. És a hitelességi intervallumok nem képesek sokat javítani a konfidencia intervallumokon, hacsak nincs olyan előzetes információ, amelyet a konfidencia intervallum képes “ne vegye figyelembe, vagy nehéz megtalálni az elegendő és kiegészítő statisztikákat.

    Megjegyzések

    • Tudok ‘ azt mondom, hogy megértettem Keith ‘ magyarázatát a korsó példára, egy gyors kérdés: $ m $ -szor megismételem a kísérletet, $ m $ különböző mintát gyűjtöttem, így most ‘ kiszámított $ m $ különböző CI-ket (mindegyik 95% -os megbízhatósági szinttel), most mi a CI? Ez azt jelenti, hogy a $ m $ CI-k 95% -ának fedeznie kell a valós értéket? / li>
    • @loganecolss – ez valóban igaz, de csak a $ m \ to \ infty $ értékben. Ez megegyezik a ” valószínűséggel ” = ” hosszú távú gyakoriság ” értelmezés a CI-k mögött.
    • Igen, a határértékben. Akkor egy vagy csak néhány minta esetében a CI-k nem ‘ jelentenek semmit, igaz? Akkor mi a ‘ pont a CI kiszámításához, ha nincs ‘ tonna mintám?
    • @loganecolss – ez ‘ s ezért ‘ ma Bayesian.
    • @nazka – mintegy. Azt mondanám, hogy mindig a legjobb Bayes-féle megközelítést alkalmazni, függetlenül attól, hogy mennyi adata van. Ha ezt gyakori eljárással jól meg lehet közelíteni, akkor ezt használja. A Bayesian nem a lassú szinonimája.

    Válasz

    Ahogy megértem: A hiteles intervallum kijelentés az érdekes statisztika azon értéktartománya, amelyek továbbra is hihetőek, figyelembe véve az általunk ténylegesen megfigyelt adatmintát. A konfidencia intervallum annak a gyakoriságnak a megállapítása, amellyel a valódi érték abban a konfidencia intervallumban rejlik, amikor a kísérletet sokszor megismétlik, minden alkalommal ugyanazon alapul szolgáló populáció különböző adatmintáival.

    Normál esetben az a kérdés, amire válaszolni akarunk, “a statisztika mely értékei egyeznek a megfigyelt adatokkal”, és a hiteles intervallum közvetlen választ ad erre a kérdésre – a statisztika valódi értéke 95% -os hiteles intervallumban rejlik, valószínűséggel 95%.A konfidencia intervallum nem ad közvetlen választ erre a kérdésre; nem helyes azt állítani, hogy annak valószínűsége, hogy a statisztika valódi értéke a 95% -os megbízhatósági intervallumon belül van, 95% (hacsak nem esik egybe a hiteles intervallummal). Ez azonban egy gyakori téves értelmezés a gyakorisági bizalmi intervallumról, mivel az az értelmezés, amely közvetlen választ adna a kérdésre.

    Jayne tanulmánya, amelyet egy másik kérdésben tárgyalok, jó példát ad a ezt (5. példa) tökéletesen megbízható intervallumként állítjuk össze, ahol az adott adatminta, amelyen alapul, kizárja a statisztika valódi értékének 95% -os konfidencia intervallumban való létezésének lehetőségét! Ez csak egy probléma, ha a konfidencia intervallumot helytelenül értelmezzük a statisztika elfogadható értékeinek kimutatásaként az általunk megfigyelt minta alapján.

    A nap végén arról van szó, hogy “lovak tanfolyamok “, és melyik intervallum a legmegfelelőbb a megválaszolni kívánt kérdéstől függően – csak válassza ki azt a módszert, amely közvetlenül megválaszolja a kérdést.

    Gyanítom, hogy a megbízhatósági intervallumok hasznosabbak az [eltervezett] ismételhető kísérletek elemzésekor csak a feltételezés a megbízhatósági intervallum alapja), és a megfigyelési adatok elemzése során a hiteles intervallumok jobbak, de ez csak egy vélemény (a munkám során mindkétféle intervallumot használom, de egyikben sem írnám le magam szakértőként).

    Megjegyzések

    • Az ismételt kísérletek konfidenciaintervallumaival az a kérdés, hogy a működésük érdekében az ismételhető kísérlet feltételeinek ugyanazoknak kell maradniuk (és ki hinne ebben?), míg a Bayes-intervallum (ha megfelelően használják) feltételezi a megfigyelt adatokat, és így engedelmet nyújt a valós világban (adatokon keresztül) bekövetkező változásoknak. Úgy gondolom, hogy a Bayes-i statisztikák kondicionálási szabályai ok miatt olyan nehéz túlszárnyalni (szerintem lehetetlen: csak ekvivalencia érhető el), és az ezt elérő automatikus gépezet teszik láthatóvá olyan csúszós.

    Válasz

    Nagyon sok értelmezést találtam a konfidencia intervallumról és a hiteles halmazról. Például a konfidenciaintervallum nem fejezhető ki ebben a formátumban $ P (\ theta \ CI-ben) $. Ha alaposan megnézi a gyakoriság és a Bayesian következtetéseinek “eloszlásait”, akkor az adatokon a mintavételi eloszlásról szóló Frequentist művek, míg a paraméter (hátsó) eloszlásán a Bayesian munkái láthatók. Teljesen különböző mintaterületen és Sigma Algebrán vannak meghatározva.

    Tehát igen, azt mondhatja: “Ha sokszor megismétli a kísérletet, a 95% -os CI-k körülbelül 95% -a fedi az igaz paramétert”. Bár a bayesi nyelven azt kell mondanod, hogy “a statisztika valódi értéke 95% -os hiteles intervallumban rejlik, 95% -os valószínűséggel”, ez a 95% -os valószínűség (bayesi nyelven) maga azonban csak becslés. (Ne feledje, hogy a feltétel eloszlásán alapul ez a konkrét adat, nem pedig a mintavételi eloszlás). Ennek a becslésnek véletlenszerű hibának kell lennie a véletlenszerű minta miatt.

    A Bayesian megpróbálja elkerülni az I. típusú hibákat. A Bayesian mindig azt mondja, hogy nincs értelme az I. típusú hibákról beszélni Bayesian nyelven. Ez nem teljesen igaz. A statisztikusok mindig meg akarják mérni annak lehetőségét vagy hibáját, hogy “Az Ön adatai arra utalnak, hogy döntést hozzon, de a lakosság másképp javasolja”. Erre Bayesian nem tud válaszolni (a részletek itt el vannak hagyva). Sajnos ez lehet a legfontosabb, amire a statisztikusnak válaszolnia kell. A statisztikusok nemcsak döntést javasolnak. A statisztikusoknak képesnek kell lenniük arra is, hogy megvizsgálják, mennyire tévedhet a döntés.

    A következő táblázatot és kifejezéseket kell kitalálnom a koncepció magyarázatához. Remélem, ez segíthet megmagyarázni a bizalmi intervallum és a hiteles készlet különbségét.

    Felhívjuk figyelmét, hogy a hátsó eloszlás $ P (\ theta_0 | Data_n) $, ahol $ \ theta_0 $ az előző $ P-ből van meghatározva. (\ theta_0) $. A gyakoriakban a mintavételi eloszlás $ P (Data_n; \ theta) $. A $ \ hat {\ theta} $ mintavételi eloszlása $ P (\ hat {\ theta} _n; \ theta) $. A $ n $ alindex a minta mérete. Kérjük, ne használja a $ P (Data_n | \ theta) $ jelölést a mintavételi eloszlás bemutatására a gyakoriságban. Beszélhet véletlenszerű adatokról a $ P (Data_n; \ theta) $ és $ P (\ hat {\ theta} _n; \ theta) $ értékekben, de véletlenszerű adatokról nem beszélhet a $ P (\ theta_0 | Data_n) $ értékben.

    Bizalom intervallum vs hiteles készlet

    A “???????” elmagyarázza, miért nem vagyunk képesek értékelni az I. típusú hibát (vagy bármi hasonlót) a Bayes-ben.

    Felhívjuk figyelmét arra is, hogy bizonyos körülmények között hiteles halmazok használhatók a megbízhatósági intervallumok közelítésére. Ez azonban csak matematikai közelítés. Az értelmezésnek a gyakoriakkal kell járnia. A Bayes-értelmezés ebben az esetben már nem működik.


    Thylacoleo “jelölés a $ P (x | \ theta) $ fájlban nem gyakori. Ez továbbra is bayesi. Ez a jelölés alapvető problémát okoz az intézkedéselméletben, amikor a gyakoriakról beszélünk.

    Egyetértek a Dikran Marsupial következtetésével. Ha Ön Az FDA véleményezője, mindig tudni szeretné annak lehetőségét, hogy jóváhagyja a gyógyszeres alkalmazást, de a gyógyszer valójában nem hatékony. Ez az a válasz, amelyet a Bayesian nem tud megadni, legalábbis a klasszikus / tipikus bayesi nyelvben.

    Válasz

    Általános és következetes bizalom és hiteles régiók. http://dx.doi.org/10.6084/m9.figshare.1528163 kóddal: http://dx.doi.org/10.6084/m9.figshare.1528187

    A hiteles intervallumok és a megbízhatóság leírását tartalmazza intervallumok a készletválasztáshoz általános R kóddal együtt a valószínűség függvény és néhány megfigyelt adat kiszámításához. tesztstatisztika, amely megbízható és megbízható, optimális méretű intervallumokat ad, amelyek összhangban állnak egymással.

    Röviden és a képleteket elkerülve. A Bayes-i hiteles intervallum a paraméterek valószínűségén alapszik. adatok . A nagy valószínűséggel rendelkező paramétereket a hiteles halmazba / intervallumba gyűjti. A 95% -os hiteles intervallum olyan paramétereket tartalmaz, amelyek együttes valószínűsége 0,95 az adatok alapján.

    A gyakoriság konfidencia intervallum a az adatok valószínűsége adott paraméterek esetén . Minden (esetleg végtelenül sok) paraméterhez előbb állítja elő azt az adatkészletet, amelyet valószínűleg figyelembe vesznek a paraméter megadásakor. Ezután ellenőrzi az egyes paramétereket, hogy a kiválasztott nagy valószínűségű adatok tartalmazzák-e a megfigyelt adatokat. Ha a nagy valószínűségű adatok tartalmazzák a megfigyelt adatokat, akkor a megfelelő paraméter hozzáadódik a konfidencia intervallumhoz. Így a konfidenciaintervallum olyan paraméterek összegyűjtése, amelyekre vonatkozóan nem zárhatjuk ki annak lehetőségét, hogy a paraméter generálta az adatokat. Ez olyan szabályt ad, hogy ha hasonló problémákra ismételten alkalmazzuk, a 95% -os konfidenciaintervallum az esetek 95% -ában tartalmazza a valódi paraméterértéket.

    95% -os hiteles és 95% -os megbízhatósági készlet példa negatív binomiális eloszlásból 95% -os hitelesség és 95% -os megbízhatóság a negatív binomiális eloszláshoz

    Megjegyzések

    • A megbízhatósági intervallumok leírása nem megfelelő. A ” 95% ” abból a valószínűségből származik, hogy a populációból származó minta olyan intervallumot eredményez, amely tartalmazza a paraméter valódi értékét.
    • @jlimahaverford – A leírás éppúgy, mint a tiéd. Ahhoz, hogy a link leírásra kerüljön, amit leír, hozzáadtam a ” t. Ez olyan szabályt ad, hogy ha hasonló problémákra többször alkalmazzuk, akkor a 95% -os hiteles intervallum a 95 Az esetek% -a. ”
    • Nem a hiteles intervallumok leírásáról beszéltem, hanem a megbízhatósági intervallumokról. ‘ Most észreveszem, hogy a megbízhatósági intervallumokra vonatkozó paragrafusod közepén újra hiteles dolgokról kezdesz beszélni, és szerintem ez tévedés. A fontos gondolat ez: ” Ha ez lenne a paraméter valódi értéke, akkor mekkora annak a valószínűsége, hogy ekkora vagy annál nagyobb mintát vennék. Ha a válasz meghaladja az 5% -ot, ‘ s a konfidencia intervallumban. ”
    • @jlimahaverford – aggódik és javítva – köszönöm.
    • hmm, nem látom, hogy javítva lenne.

    Válasz

    Ez inkább egy megjegyzés, de túl hosszú. A következő cikkben: A sztochasztikusság korának hajnala (David Mumford) Mumfordnak a következő érdekes megjegyzése van:

    Míg mindezeket az igazán izgalmas felhasználási módokat a statisztikák alkalmazták, a statisztikusok többsége maga, Sir RA vezetésével Fisher kezüket a hátuk mögött kötötték, és ragaszkodtak ahhoz, hogy a statisztikákat nem szabad felhasználni, de teljesen reprodukálható helyzetekben, és csak az empirikus adatok felhasználásával. Ez az úgynevezett “gyakoriak” iskola, amely harcolt a Bayes-i iskolával, amely úgy vélte, Ez a megközelítés tagadja, hogy a statisztikai következtetésnek bármi köze lehet a valós gondolathoz, mivel a valós élethelyzetek mindig a kontextus változóiban vannak eltemetve és nem ismételhetők meg.Szerencsére a bayesi iskola nem teljesen halt meg, DeFinetti, E.T. folytatta. Jaynes, mások.

    Vélemény, hozzászólás?

    Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük