Schimbul lui Joris și Srikant aici m-a făcut să mă întreb (din nou) dacă explicațiile pentru diferența dintre intervalele de încredere și intervalele credibile au fost cele corecte. Cum ați explica diferența?
Răspuns
I sunt de acord complet cu explicația lui Srikant. Pentru a da o răsucire mai euristică:
Abordările clasice afirmă, în general, că lumea este unică (de exemplu, un parametru are o anumită valoare adevărată) și încearcă să efectueze experimente a căror concluzie rezultată – nu contează adevărata valoare a parametrului – va fi corectă cu cel puțin o probabilitate minimă.
Ca rezultat, pentru a exprima incertitudinea în cunoștințele noastre după un experiment, abordarea frecventistă utilizează un „interval de încredere” – o gamă de valori concepute pentru a include adevărata valoare a parametrului cu o probabilitate minimă, să zicem 95%. Un frecventist va proiecta experimentul și procedura de interval de încredere de 95%, astfel încât din fiecare 100 de experimente efectuate să înceapă până la sfârșit, cel puțin 95 dintre intervalele de încredere rezultate vor fi de așteptat să includă valoarea reală a parametrului. Celelalte 5 ar putea fi ușor greșite sau ar putea fi prostii complete – vorbind formal că „e ok în ceea ce privește abordarea, atâta timp cât 95 din 100 inferențe sunt corecte. (Desigur, am prefera să fie ușor greșit, nu un nonsens total.)
Abordările bayesiene formulează problema diferit. În loc să spună că parametrul are pur și simplu o valoare adevărată (necunoscută), o metodă bayesiană spune că valoarea parametrului este fixă, dar a fost aleasă dintr-o anumită distribuție de probabilitate – cunoscută sub numele de distribuție de probabilitate anterioară. (Un alt mod de a spune că este că, înainte de a lua orice măsurătoare, bayesianul atribuie o distribuție de probabilitate, pe care o numesc o stare de credință, pe care se întâmplă să fie adevărata valoare a parametrului.) Acest „anterior” ar putea fi cunoscut (imaginați-vă încercând pentru a estima dimensiunea unui camion, dacă știm distribuția generală a dimensiunilor camioanelor de la DMV) sau ar putea fi o presupunere extrasă din aer. Inferența bayesiană este mai simplă – colectăm câteva date și apoi calculăm probabilitatea diferitelor valori ale parametrului DATE date. Această nouă distribuție a probabilității se numește „probabilitate a posteriori” sau pur și simplu „posterioară”. Abordările bayesiene își pot rezuma incertitudinea oferind o serie de valori pe distribuția de probabilitate posterioară care include 95% din probabilitate – acest lucru se numește „interval de credibilitate de 95%”.
Un partizan bayesian ar putea critica interval de încredere frecventist de genul acesta: „Deci, ce se întâmplă dacă 95 din 100 de experimente produc un interval de încredere care include adevărata valoare? Nu-mi pasă de 99 de experimente NU AM FĂCUT; Îmi pasă de acest experiment AM FĂCUT. Regula ta permite ca 5 din 100 să fie prostii complete [valori negative, valori imposibile] atâta timp cât celelalte 95 sunt corecte; asta este „ridicol”.
Un tânăr frecventist ar putea critica intervalul de credibilitate bayesiană așa: „Deci, dacă 95% din probabilitatea posterioară este inclusă în acest interval? Ce se întâmplă dacă adevărata valoare este, să zicem, 0,37? Dacă este, atunci metoda dvs., de la început la sfârșit, va fi GREȘIT 75% din timp. Răspunsul dvs. este „Oh, bine, este ok pentru că, în conformitate cu precedentul, este foarte rar că valoarea este 0,37” și poate fi așa, dar vreau o metodă care să funcționeze pentru ORICE valoare posibilă a parametrului. Nu-mi pasă de 99 de valori ale parametrului pe care nu-l are; Îmi pasă de singura valoare adevărată pe care o are. De asemenea, apropo, răspunsurile tale sunt corecte numai dacă priorul este corect. Dacă pur și simplu îl scoți din aer, pentru că se simte bine, poți fi departe. „
Într-un sens, ambii acești partizani sunt corecți în criticile lor față de metodele celorlalți, dar aș îndemna să vă gândiți matematic la distincție – așa cum explică Srikant.
Iată un exemplu extins din acea discuție care arată diferența exact într-un exemplu discret.
Când Eram un copil mama mea obișnuia să mă surprindă din când în când, comandând un borcan de fursecuri cu ciocolată care să fie livrate prin poștă. Compania de livrare a stocat patru tipuri diferite de borcane pentru biscuiți – tip A, tip B, tip C și tip D , și toți erau pe același camion și nu ați fost niciodată sigur ce tip veți obține. Fiecare borcan avea exact 100 de cookie-uri, dar caracteristica care distinge diferitele borcane de cookie-uri a fost distribuția lor respectivă de chipsuri de ciocolată pe cookie. Dacă ați intrat în un borcan și a scos un singur cookie uniform la întâmplare, acestea sunt distribuțiile de probabilitate pe care le-ați ge t pe numărul de jetoane:
Un vas de tip cookie A, de exemplu, are 70 de cookie-uri cu două jetoane fiecare și fără cookie-uri cu patru jetoane sau mai multe!Un borcan de tip D are 70 de cookie-uri cu câte un cip fiecare. Observați cum fiecare coloană verticală este o funcție de masă de probabilitate – probabilitatea condiționată a numărului de jetoane pe care le-ați obține, având în vedere că borcanul = A, sau B, sau C, sau D și fiecare coloană se ridică la 100.
Îmi plăcea să joc un joc de îndată ce distribuitorul a dat jos noul meu borcan de cookie-uri. Aș scoate un singur cookie la întâmplare din borcan, am numărat chipsurile de pe cookie și aș încerca să-mi exprim incertitudine – la nivelul de 70% – din care borcane ar putea fi. Astfel, identitatea borcanului (A, B, C sau D) este valoarea a parametrului estimat. Numărul de jetoane (0, 1, 2, 3 sau 4) este rezultatul sau observația sau eșantionul .
Inițial am jucat acest joc folosind un interval de încredere frecventist de 70%. Un astfel de interval trebuie să mă asigure că nu contează adevărata valoare a parametrului, adică indiferent de borcanul cookie pe care l-am obținut, intervalul ar acoperi acea valoare adevărată cu cel puțin 70% probabilitate.
Un interval, desigur, este o funcție care leagă un rezultat (un rând) de un set de valori ale parametrului (un set de coloane). Dar pentru a construi intervalul de încredere și a garanta o acoperire de 70%, trebuie să lucrăm „pe verticală „- privind fiecare coloană pe rând și asigurându-vă că 70% din funcția de masă a probabilității este acoperită astfel încât 70% din timp, identitatea acelei coloane va face parte din intervalul care rezultă. Amintiți-vă că sunt coloanele verticale care formează un pmf
Deci, după ce am făcut această procedură, am terminat cu aceste intervale:
De exemplu, dacă numărul de jetoane pe cookie-ul pe care îl desenez este 1, intervalul meu de încredere va fi {B, C, D}. Dacă numărul este 4, intervalul meu de încredere va fi {B, C}. Observați că, din moment ce fiecare coloană se ridică la 70% sau mai mult, atunci indiferent în ce coloană ne aflăm cu adevărat (indiferent de borcanul pe care livratorul l-a lăsat), intervalul rezultat din această procedură va include jar cu o probabilitate de cel puțin 70%.
Observați, de asemenea, că procedura pe care am urmat-o la construirea intervalelor a avut o anumită discreție. În coloana pentru tipul B, aș fi putut la fel de ușor să mă asigur că intervalele inclus B ar fi 0,1,2,3 în loc de 1,2,3,4. Acest lucru ar fi dus la o acoperire de 75% pentru borcanele de tip B (12 + 19 + 24 + 20), îndeplinind în continuare limita inferioară a 70%.
Sora mea Bayesia a crezut această aplicație totuși, gândacul era nebun. „Trebuie să-l consideri pe deliverman ca parte a sistemului”, a spus ea. „Să” tratăm identitatea borcanului ca o variabilă aleatorie în sine și să presupunem că delivermanul alege dintre ei în mod uniform – adică îi are pe toți patru pe camion și când ajunge la casa noastră alege unul la întâmplare, fiecare cu o probabilitate uniformă. „
” Cu această presupunere, acum să analizăm probabilitățile comune ale întregului eveniment – tipul de jar și numărul de jetoane pe care le trageți de la primul dvs. cookie”, a spus ea, desenând următorul tabel:
Observați că întregul tabel este acum o funcție de masă de probabilitate – adică întregul tabel se ridică la 100%.
” Ok, „am spus,” unde te îndrepți cu asta? „
” Te-ai uitat la probabilitatea condiționată a numărului de jetoane, având în vedere borcanul „, a spus Bayesia. „Totul este greșit! Ceea ce îți pasă cu adevărat este probabilitatea condiționată a borcanului, având în vedere numărul de jetoane de pe cookie! Intervalul dvs. de 70% ar trebui să includă pur și simplu borcanele de listă care, în total, au 70% probabilitate de a fi adevăratul borcan. Nu este atât de simplu și mai intuitiv? „
” Sigur, dar cum o putem calcula? ” Am întrebat.
„Să” spunem că știm că ai 3 jetoane. Apoi, putem ignora toate celelalte rânduri din tabel și pur și simplu tratăm acel rând ca o funcție de masă de probabilitate. „Va trebui să mărim proporțional probabilitățile, astfel încât fiecare rând să se ridice la 100, totuși”. A făcut:
„Observați cum fiecare rând este acum un pmf și se ridică la 100%. „Am răsturnat probabilitatea condițională din ceea ce ați început – acum este probabilitatea ca omul să fi scăpat dintr-un anumit borcan, având în vedere numărul de jetoane de pe primul cookie.”
„Interesant, ” Am spus. „Deci, acum încercuim doar borcane în fiecare rând pentru a obține o probabilitate de până la 70%?” Am făcut exact asta, făcând aceste intervale de credibilitate:
Fiecare interval include un set de borcane care, a posteriori , însumează o probabilitate de 70% de a fi adevăratul borcan.
„Ei bine, așteaptă”, am spus. „Nu sunt convins.Să „punem cele două tipuri de intervale unul lângă altul și să le comparăm pentru acoperire și, presupunând că distribuitorul alege fiecare tip de borcan cu probabilitate, credibilitate egală.”
Iată:
Intervalele de încredere:
Intervale de credibilitate:
„Vedeți cât de nebune sunt intervalele dvs. de încredere?” spuse Bayesia. „Nu ai nici măcar un răspuns sensibil atunci când desenezi un cookie cu zero chipsuri! Spuneți doar că este intervalul gol. Dar este evident că este greșit – trebuie să fie unul dintre cele patru tipuri de borcane. Cum poți trăi cu tine însuți, menționând un interval la sfârșitul zilei când știi că intervalul este greșit? Și idem când trageți un cookie cu 3 jetoane – intervalul dvs. este corect doar 41% din timp. Numirea acestui interval de încredere „70%” este o prostie. ”
„ Ei bine, hei ”, i-am răspuns.„ Este corect 70% din timp, indiferent de borcanul pe care livratorul l-a lăsat. „este mult mai mult decât puteți spune despre intervalele dvs. de credibilitate. Ce se întâmplă dacă borcanul este de tip B? Apoi, intervalul dvs. va fi greșit 80% din timp și va fi corectat doar 20% din timp! „
” Aceasta pare a fi o mare problemă „, am continuat eu”, deoarece greșelile dvs. vor fi corelate cu tipul borcanului. Dacă trimiteți 100 de roboți „bayezieni” pentru a evalua ce tip de borcan aveți, fiecare robot prelevând un cookie, îmi spuneți că în zilele de tip B, vă veți aștepta ca 80 dintre roboți să primească un răspuns greșit, fiecare având o credință de> 73% în concluzia incorectă! Acest lucru este supărător, mai ales dacă doriți ca majoritatea roboților să fie de acord cu răspunsul corect. „
” PLUS a trebuit să facem această presupunere că livratorul se comportă uniform și selectează fiecare tip de borcan la întâmplare „, am spus.” De unde a venit asta? Ce se întâmplă dacă nu este în regulă? Nu ai vorbit cu el; nu l-ați intervievat. Cu toate acestea, toate afirmațiile dvs. de a posteriori probabilitate se bazează pe această afirmație despre comportamentul său. Nu trebuia să fac astfel de presupuneri, iar intervalul meu îndeplinește criteriul său chiar și în cel mai rău caz. „
” Este adevărat că intervalul meu de credibilitate are performanțe slabe la borcanele de tip B „, a spus Bayesia. „Dar ce se întâmplă? Borcanele de tip B se întâmplă doar 25% din timp. Este echilibrat de acoperirea mea bună a borcanelor de tip A, C și D. Și nu public niciodată prostii. „
„ Este adevărat că intervalul meu de încredere are o performanță slabă atunci când „am desenat un cookie cu zero jetoane”, am spus. „Dar și ce? Fursecurile fără cipuri se întâmplă, cel mult, 27% din timp în cel mai rău caz (un borcan de tip D). Îmi permit să dau prostii pentru acest rezultat, deoarece NICI jar nu va avea ca rezultat un răspuns greșit mai mult de 30% din timp. „
” Sumele coloanei contează „, am spus.
„Sumele rând contează”, a spus Bayesia.
„Văd că suntem într-un impas”, am spus. „Amândoi suntem corecți în afirmațiile matematice pe care le facem, dar nu suntem de acord cu privire la modul adecvat de a cuantifica incertitudinea.”
„Este adevărat”, a spus sora mea. „Vrei un cookie? „
Comentarii
- Răspuns bun – doar un punct minor, spui ” …. În loc să spună că parametrul are o valoare adevărată, o metodă bayesiană spune că valoarea este aleasă dintr-o anumită distribuție de probabilitate ….. ” Acest lucru nu este adevărat. Un bayesian se potrivește cu distribuția de probabilitate pentru a exprima incertitudinea cu privire la valoarea adevărată, necunoscută, fixă. Aceasta spune ce valori sunt plauzibile, având în vedere ceea ce se știa înainte de a observa datele. Declarația de probabilitate reală este $ Pr [\ theta_0 \ in (\ theta, \ theta + d \ theta) | I] $, unde $ \ theta_0 $ este valoarea adevărată și $ \ theta $ cea ipotezată, pe baza informațiilor $ I $.
- … cont ‘ d … dar este mult mai convenabil să scrieți doar $ p (\ theta) $, cu înțelegerea lui wha t înseamnă ” în fundal „. În mod clar, acest lucru poate provoca multă confuzie.
- Îmi pare rău să reînvieți această postare super veche, dar o întrebare rapidă, în postarea dvs. din secțiunea în care frecventistul critică abordarea bayesiană, spuneți: ” Ce se întâmplă dacă adevărata valoare este, să zicem, 0,37? Dacă este, atunci metoda dvs., de la început la sfârșit, va fi GREȘIT 75% din timp. ” Cum ați obținut aceste numere? cum corespunde 0,37 la 75% greșit? Este acest lucru în afara unui tip de curbă de probabilitate? Mulțumim
- @ BYS2, când autorul spune că
"What if the true value is, say, 0.37? If it is, then your method, run start to finish, will be WRONG 75% of the time"
, acestea dau doar exemple de numere compuse. În acest caz particular, se vor referi la o distribuție anterioară care avea o valoare foarte scăzută la 0,37, cu cea mai mare parte a densității probabilității sale în altă parte. Și presupunem că distribuția noastră de exemplu ar funcționa foarte slab atunci când valoarea reală a parametrului este 0.37, similar cu modul în care intervalele de credibilitate ale Bayesia ‘ au eșuat lamentabil atunci când borcanul a fost de tip B. - Autorul spune
"you will expect 80 of the robots to get the wrong answer, each having >73% belief in its incorrect conclusion!"
, dar aceasta ar fi trebuit să fie>72%
credință, deoarece 72% este credibilitatea minimă în tabelul intervalelor de credibilitate.
Răspuns
Înțelegerea mea este următoarea:
Fundal
Să presupunem că aveți niște date $ x $ și că încercați să estimați $ \ theta $. Aveți un proces de generare a datelor care descrie modul în care este generat $ x $ condiționat de $ \ theta $. Cu alte cuvinte, cunoașteți distribuția $ x $ (să zicem, $ f (x | \ theta) $.
Problemă de deducție
Problema dvs. de deducție este: Ce valori de $ \ theta $ sunt rezonabile având în vedere datele observate $ x $?
Intervalele de încredere
Intervalele de încredere sunt un răspuns clasic la problema de mai sus. În această abordare, presupuneți că există adevărat , fix valoarea $ \ theta $. Având în vedere această ipoteză, utilizați datele $ x $ pentru a ajunge la o estimare de $ \ theta $ (să zicem, $ \ hat {\ theta} $). Odată ce ați estimarea dvs. pe care doriți să o evaluați unde este adevărata valoare în raport cu estimarea dvs.
Observați că în această abordare valoarea adevărată nu este nu o variabilă aleatorie. Este o valoare fixă, ci cantitate necunoscută. În schimb, estimarea dvs. este o variabilă aleatorie, deoarece depinde de datele dvs. $ x $ care au fost generate din procesul dvs. de generare a datelor. Astfel, vă dați seama că obțineți diferite estimări de fiecare dată când repetați studiul.
Înțelegerea de mai sus conduce la următoarea metodologie pentru a evalua unde se află parametrul adevărat în raport cu estimarea dvs. Definiți un interval, $ I \ equiv [lb (x), ub (x)] $ cu următoarea proprietate:
$ P (\ theta \ in I) = 0,95 $
Un interval construit ca cel de mai sus este ceea ce se numește un interval de încredere. Deoarece adevărata valoare este necunoscută, dar fixă, adevărata valoare este fie în interval, fie în afara intervalului. Intervalul de încredere atunci este o afirmație despre probabilitatea ca intervalul pe care îl obținem să aibă de fapt valoarea parametrului adevărat. Astfel, declarația de probabilitate se referă la interval (adică la șansele acelui interval care are sau nu valoarea adevărată) decât la locația valorii parametrului adevărat.
În această paradigmă, nu are sens să vorbiți despre probabilitatea ca o valoare adevărată să fie mai mică sau mai mare decât o anumită valoare, întrucât valoarea adevărată este nu o variabilă aleatorie.
Intervale credibile
Spre deosebire de abordarea clasică, în abordarea bayesiană presupunem că adevărata valoare este o variabilă aleatorie. Astfel, captăm incertitudinea noastră cu privire la valoarea parametrului adevărat printr-o impunere a unei distribuții anterioare asupra vectorului parametrului adevărat (să zicem $ f (\ theta) $). pentru vectorul de parametri prin amestecarea datelor anterioare și a datelor pe care le avem (pe scurt posteriorul este $ f (\ theta | -) \ propto f (\ theta) f (x | \ theta) $).
Ajungem apoi la o estimare punctuală folosind distribuția posterioară (de exemplu, utilizați media distribuției posterioare). Cu toate acestea, întrucât în această paradigmă, vectorul parametru adevărat este o variabilă aleatorie, dorim să aflăm și gradul de incertitudine pe care îl avem în estimarea punctuală. Astfel, construim un interval astfel încât să se mențină următoarele:
$ P (l (\ theta) \ le {\ theta} \ le ub (\ theta)) = 0,95 $
Cele de mai sus sunt un interval credibil.
Rezumat
Intervalele credibile surprind incertitudinea noastră actuală în locația valorile parametrilor și astfel pot fi interpretate ca afirmație probabilistică despre parametru.
În schimb, intervalele de încredere surprind incertitudinea cu privire la intervalul pe care l-am obținut (adică, dacă acesta conține valoarea adevărată sau nu). Astfel, acestea nu pot fi interpretate ca o afirmație probabilistică despre valorile parametrilor adevărați.
Comentarii
- Un interval de încredere de 95%, prin definiție, acoperă parametrul adevărat valoare în 95% din cazuri, după cum ați indicat corect. Astfel, șansa ca intervalul dvs. să acopere valoarea parametrului adevărat este de 95%. Uneori puteți spune ceva despre șansa ca parametrul să fie mai mare sau mai mic decât oricare dintre limite, pe baza ipotezelor pe care le faceți atunci când construiți intervalul (destul de des distribuția normală a estimării dvs.). Puteți calcula P (theta > ub) sau P (ub < theta). Afirmația se referă la graniță, într-adevăr, dar o puteți face.
- Joris, nu pot ‘ să fiu de acord. Da, pentru orice valoare a parametrului, va exista > 95% probabilitate ca intervalul rezultat să acopere valoarea adevărată.Asta nu înseamnă că ‘ nu înseamnă că, după efectuarea unei observații speciale și calcularea intervalului, există încă 95% probabilitate condițională, având în vedere datele că ACEL interval acoperă adevărata valoare. După cum am spus mai jos, în mod formal ar fi perfect acceptabil ca un interval de încredere să scuipe [0, 1] 95% din timp și golul să seteze celelalte 5%. Ocaziile în care ați obținut setul gol ca interval, există ‘ 95% probabilitate că adevărata valoare este înăuntru!
- Joris, foloseam ” date ” ca sinonim pentru eșantionul „, ” deci cred că suntem de acord. Ideea mea este că ‘ este posibil să vă aflați în situații, după ce ați luat eșantionul, unde puteți demonstra cu certitudine absolută că intervalul dvs. este greșit – că nu acoperă valoare adevarata. Acest lucru nu înseamnă că nu este un interval valid de încredere de 95%. Deci, nu puteți ‘ să spuneți că parametrul de încredere (95%) vă spune orice despre probabilitatea acoperirii unui anumit interval după ce ‘ am făcut experimentul și am obținut intervalul. Doar o probabilitate a posteriori, informată de un prior, poate vorbi despre asta.
- Într-una din lucrările lui Jaynes bayes.wustl.edu/etj/articles/ konfyans.pdf El construiește un interval de încredere și apoi arată că pentru eșantionul particular puteți fi 100% sigur că adevărata valoare nu se află în ” interval de încredere „. Asta nu ‘ nu înseamnă că IC este ” greșit „, doar că un interval de încredere frecventist nu este un răspuns la întrebarea ” care este intervalul care conține adevărata valoare a statisticii cu probabilitate 95% „. Din păcate, aceasta este întrebarea pe care am vrea să o punem, motiv pentru care CI este deseori interpretată ca și cum ar fi un răspuns la această întrebare. 🙁
- @svadalli – abordarea bayesiană nu consideră că $ \ theta $ este aleatoriu . Nu $ \ theta $ este distribuit ($ \ theta $ este fix, dar necunoscut), este incertitudinea despre $ \ theta $ care este distribuită, condiționată de o stare de cunoaștere despre $ \ theta $. Declarația de probabilitate reală că $ f (\ theta) $ captează este $ Pr (\ theta \ text {este în intervalul} (\ theta, \ theta + d \ theta) | I) = f (\ theta) d \ theta $. În de fapt, exact același argument se aplică și pentru $ X $, și el poate fi considerat fix, dar necunoscut.
Răspuns
Nu sunt de acord cu răspunsul lui Srikant cu privire la un punct fundamental. Srikant a afirmat acest lucru:
„Problemă de inferență: problema dvs. de inferență este: Ce valori ale lui θ sunt rezonabile, având în vedere datele observate x?”
De fapt, aceasta este PROBLEMA DE INFERENȚĂ BAYESIANĂ. În statisticile Bayesiene căutăm să calculăm P (θ | x), adică probabilitatea valorii parametrului dat de datele observate (eșantion). INTERVALUL CREDIBIL este un interval de θ care are o șansă de 95% (sau altul) de a conține adevărata valoare de θ având în vedere mai multe ipoteze care stau la baza problemei.
PROBLEMA DE INFERENȚĂ FREQUENTISTĂ este aceasta:
Datele observate x sunt rezonabile având în vedere valorile ipotezate ale lui θ?
În statisticile frecventiste, încercăm să calculăm P (x | θ), adică probabilitatea de a observa datele (eșantionul), având în vedere valoarea (valorile) parametrilor ipotizați. INTERVALUL DE CONFIDENȚĂ (poate o denumire greșită) este interpretat ca: dacă experimentul care a generat eșantionul eșantionat x s-ar repeta de mai multe ori, 95% (sau altele) din astfel de intervale construite din acele eșantioane ar conține adevărata valoare a parametrului.
Mizerie cu capul? Aceasta este problema statisticilor frecventiste și principalul lucru pe care îl au statisticile bayesiene.
După cum subliniază Sikrant, P (θ | x) și P (x | θ) sunt legate astfel:
P (θ | x) = P (θ) P (x | θ)
Unde P (θ) este probabilitatea noastră anterioară; P (x | θ) este probabilitatea datele condiționate de acel prior și P (θ | x) sunt probabilitatea posterioară. P (θ) anterioară este inerent subiectivă, dar acesta este prețul cunoașterii despre Univers – într-un sens foarte profund.
Celelalte părți ale răspunsurilor atât ale lui Sikrant, cât și ale lui Keith sunt excelente.
Comentarii
- Din punct de vedere tehnic, aveți dreptate, dar rețineți că intervalul de încredere oferă setul de valori ale parametrilor pentru care ipoteza nulă este adevărată. Astfel, ” sunt datele observate x rezonabile având în vedere ipoteza noastră despre theta? ” poate fi reformulat ca ” Ce adevărate valori ale theta ar fi o ipoteză compatibilă având în vedere observ date ed x? ” Rețineți că întrebarea reformulată nu implică neapărat faptul că se presupune că theta este o variabilă aleatorie.Întrebarea reformulată exploatează faptul că efectuăm teste de ipoteză nulă, verificând dacă valoarea ipoteză se încadrează în intervalul de încredere.
- @svadali – intervalele de încredere evaluează date pentru o valoare fixă ipoteză. Astfel, atunci când schimbați ” fix ” parte a ecuației, dacă nu luați în considerare probabilitatea ipotezei înainte de a vă date, atunci sunteți obligat să veniți cu inconsecvențe și rezultate incoerente. Probabilitatea condițională nu este ” restricționată ” la modificarea condițiilor (de exemplu, modificând condițiile, puteți schimba o probabilitate condițională de la 0 la 1) . Probabilitatea anterioară ține seama de acest arbitrar. Condiționarea pentru X se face deoarece suntem siguri că X a apărut – am observat X!
Răspuns
răspunsurile furnizate anterior sunt foarte utile și detaliate. Iată 0,25 USD.
Intervalul de încredere (CI) este un concept bazat pe definiția clasică a probabilității (numită și „definiția frecventistă”) că probabilitatea este ca proporția și se bazează pe sistemul axiomatic al Kolmogrov (si altii).
Intervalele credibile (Highest Posterior Density, HPD) pot fi considerate a-și avea rădăcinile în teoria deciziilor, pe baza lucrărilor lui Wald și de Finetti (și extinse mult de către alții).
Deoarece oamenii din acest subiect au făcut o treabă excelentă dând exemple și diferența de ipoteze în cazul bayesian și frecventist, voi sublinia doar câteva puncte importante.
-
IC-urile se bazează pe faptul că TREBUIE să se facă deducerea asupra tuturor repetărilor posibile ale unui experiment care poate fi văzut și NU numai pe datele observate, în care HPD-urile se bazează ÎNTREGUT pe datele observate (și, în general, presupunerile noastre anterioare).
-
În general, IC-urile NU sunt coerente (vor fi explicate mai târziu), unde HPD-urile sunt coerente (datorită rădăcinilor lor în teoria deciziei). Coerența (așa cum i-aș explica bunicii mele) înseamnă: dată fiind o problemă de pariere pe o valoare a parametrului, dacă un statistician clasic (frecventist) pariază pe CI și un pariu bayezian pe HPD-uri, frecventistul ESTE LEGAT de pierdut (cu excepția cazului banal) când HPD = CI). Pe scurt, dacă doriți să rezumați rezultatele experimentului dvs. ca o probabilitate bazată pe date, probabilitatea ESTE să fie o probabilitate posterioară (pe baza unui precedent). Există o teoremă (cf. Heath și Sudderth, Annals of Statistics, 1978) care afirmă (aproximativ): Atribuirea probabilității la $ \ theta $ pe baza datelor nu va face un ratat sigur dacă și numai dacă este obținut într-un mod bayesian.
-
Întrucât IC-urile nu sunt condiționate de datele observate (numite și CP „Principiul condiționalității”), există poate fi exemple paradoxale. Fisher a fost un mare susținător al CP și a găsit, de asemenea, o mulțime de exemple paradoxale atunci când acest lucru NU a fost urmat (ca în cazul CI). Acesta este motivul pentru care a folosit valorile p pentru inferență, spre deosebire de CI. În opinia sa, valorile p s-au bazat pe datele observate (se pot spune multe despre valorile p, dar aici nu se pune accentul). Două dintre cele mai faimoase exemple paradoxale sunt: (4 și 5)
-
Exemplul lui Cox (Annals of Math. Stat., 1958): $ X_i \ sim \ mathcal {N} (\ mu, \ sigma ^ 2) $ (iid) pentru $ i \ in \ {1, \ dots, n \} $ și vrem să estimăm mate $ \ mu $ . $ n $ NU este fixat și este ales aruncând o monedă. Dacă aruncarea cu monede are ca rezultat H, se alege 2, altfel se alege 1000. Estimarea „bunului simț” – media eșantionului este o estimare imparțială cu o varianță de $ 0,5 \ sigma ^ 2 + 0,0005 \ sigma ^ 2 $ . Ce folosim ca medie a varianței eșantionului atunci când $ n = 1000 $ ? Nu este mai bine (sau sensibil) să folosiți varianța estimatorului mediu al eșantionului ca 0,001 $ \ sigma ^ 2 $ (varianță condițională) în loc de varianța reală a estimatorului , care este UMER !! ( $ 0,5 \ sigma ^ 2 + 0,0005 \ sigma ^ 2 $ ). Aceasta este o ilustrare simplă a CP atunci când folosim varianța ca 0,001 $ \ sigma ^ 2 $ când $ n = 1000 $ . $ n $ autonom nu are nicio importanță sau nu are informații pentru $ \ mu $ și $ \ sigma $ (adică $ n $ este accesoriu pentru ei), dar DATORI valoarea sa, știți multe despre „calitatea datelor”. Acest lucru se referă direct la CI, deoarece implică varianța care nu ar trebui să fie condiționată de $ n $ , adică vom ajunge să folosim varianța mai mare, deci prea conservatoare.
-
Exemplul lui Welch: Acest exemplu funcționează pentru orice $ n $ , dar vom lua $ n = 2 $ pentru simplitate. $ X_1, X_2 \ sim \ mathcal {U} (\ theta – 1/2, \ theta + 1/2) $ (iid), $ \ theta $ aparține liniei Real. Aceasta implică $ X_1 – \ theta \ sim \ mathcal {U} (- 1/2, 1/2) $ (iid). $ \ frac {1} {2} ( X_1 + X_2) {\ bar x} – \ theta $ (rețineți că NU este o statistică) are o distribuție independentă de $ \ theta $ . Putem alege $ c > 0 $ st $ \ text {Prob} _ \ theta (-c < = {\ bar x} – \ theta < = c) = 1- \ alpha (\ approx 99 \%) $ , ceea ce implică $ ({\ bar x} – c, {\ bar x} + c) $ este CI de 99% din $ \ theta $ . Interpretarea acestui CI este: dacă eșantionăm în mod repetat, vom obține $ {\ bar x} $ diferit și 99% (cel puțin) ori va conține adevărat $ \ theta $ , DAR (elefantul din cameră) pentru date DATE, nu știm probabilitatea ca CI să conțină adevărat $ \ theta $ . Acum, luați în considerare următoarele date: $ X_1 = 0 $ și $ X_2 = 1 $ , ca $ | X_1 – X_2 | = 1 $ , știm SIGUR că intervalul $ (X_1, X_2) $ conține $ \ theta $ (o posibilă critică, $ \ text { Prob} (| X_1 – X_2 | = 1) = 0 $ , dar ne descurcăm matematic și nu voi discuta). Acest exemplu ilustrează, de asemenea, frumos conceptul de coerență. Dacă sunteți un statistician clasic, veți paria cu siguranță pe CI de 99% fără a analiza valoarea $ | X_1 – X_2 | $ (presupunând că sunteți fidel profesie). Cu toate acestea, un bayezian va paria pe CI numai dacă valoarea $ | X_1 – X_2 | $ este aproape de 1. Dacă condiționăm pe $ | X_1 – X_2 | $ , intervalul este coerent și jucătorul nu va mai pierde sigur (similar teoremei lui Heath și Sudderth).
-
Fisher a primit o recomandare pentru astfel de probleme – utilizați CP. Pentru exemplul lui Welch, Fisher a sugerat condiția $ X_2-X_1 $ . După cum vedem, $ X_2-X_1 $ este accesoriu pentru $ \ theta $ , dar oferă informații despre theta. Dacă $ X_2-X_1 $ este MICĂ, nu există multe informații despre $ \ theta $ în datele. Dacă $ X_2-X_1 $ este MARE, există o mulțime de informații despre $ \ theta $ în date. Fisher a extins strategia de condiționare a statisticilor auxiliare la o teorie generală numită inferență fiducială (numită și cel mai mare eșec al său, cf. Zabell, Stat. Sci. 1992), dar nu a devenit populară datorită lipsă de generalitate și flexibilitate. Fisher încerca să găsească o cale diferită atât de statisticile clasice (ale Școlii Neyman), cât și de școala bayesiană (de unde faimosul adagiu de la Savage: „Fisher a vrut să facă o omletă bayesiană (adică folosind CP) fără rupând ouăle bayeziene „). Folclorul (fără dovezi) spune: Fisher, în dezbaterile sale, l-a atacat pe Neyman (pentru erori de tip I și tip II și CI), numindu-l mai degrabă decât un tip de control al calității > Scientist , deoarece metodele lui Neyman nu au condiționat datele observate, au analizat în schimb toate repetările posibile.
-
Statisticienii doresc, de asemenea, să utilizeze principiul suficientă ( SP) în plus față de CP. Dar SP și CP implică împreună Principiul Probabilității (LP) (cf. Birnbaum, JASA, 1962), adică dat de CP și SP , trebuie să ignorați spațiul eșantion și să priviți doar funcția de probabilitate. Astfel, trebuie să ne uităm doar la datele date și NU la întregul spațiu eșantion (examinarea întregului spațiu eșantion este într-un mod similar cu eșantionarea repetată). Acest lucru a condus la un concept precum Observed Fisher Information (cf. Efron și Hinkley, AS, 1978) care măsoară informațiile despre date dintr-o perspectivă frecventistă. Cantitatea de informații din date este un concept bayesian (și, prin urmare, este legat de HPD), în loc de CI.
-
Kiefer a făcut unele lucrări fundamentale asupra CI la sfârșitul anilor 1970, dar extensiile sale nu au devenit populare. O bună sursă de referință este Berger („Fisher, Neyman și Jeffreys ar putea fi de acord cu privire la testarea ipotezelor”, Stat Sci, 2003).
Rezumat:
(După cum subliniază Srikant și alții)
IC nu pot fi interpretate ca probabilitate și nu „Nu spune nimic despre parametrul necunoscut DATE datele observate. IC sunt afirmații despre experimente repetate.
HPD-urile sunt intervale probabiliste bazate pe distribuția posterioară a parametrului necunoscut și au o interpretare bazată pe probabilitate pe baza datelor date.
Proprietatea frecventistă (eșantionare repetată) este o proprietate dorită, iar HPD-urile (cu priorități corespunzătoare) și CI le au ambele. HPD-urile condiționează datele date și pentru a răspunde la întrebările despre parametrul necunoscut
(Obiectiv NU Subiectiv) Bayesienii sunt de acord cu statisticienii clasici că există o singură valoare TRUE a parametrului. Cu toate acestea, ambele diferă prin modul în care fac inferență cu privire la acest parametru adevărat.
HPD Bayesian ne oferă o modalitate bună de condiționare a datelor, dar dacă nu reușesc să fie de acord cu frecventistul proprietățile CI nu sunt foarte utile (analogie: o persoană care folosește HPD-uri (cu unele anterioare) fără o bună proprietate frecventistă, va fi condamnată ca un tâmplar căruia îi pasă doar de ciocan și uită de șurubelniță)
În sfârșit, am văzut oameni în acest fir (comentarii ale dr. Joris: „… presupunerile implicate implică o prioritate difuză, adică o lipsă completă de cunoștințe despre adevăratul parametru.”) vorbind despre lipsa cunoștințelor despre adevăratul parametru echivalând cu utilizarea unui prior difuz. NU știu dacă pot fi de acord cu afirmația (Dr. Keith este de acord cu mine). De exemplu, în cazul modelelor liniare de bază, unele distribuții pot fi obținute utilizând un prior uniform (pe care unii oameni l-au numit difuz), DAR nu înseamnă că distribuția uniformă poate fi privită ca o INFORMAȚIE SCĂZUTĂ ÎNAINTE. În general, NON-INFORMATIV (Obiectiv) anterior nu înseamnă că are informații scăzute despre parametru.
Notă: Multe dintre aceste puncte se bazează la prelegerile unuia dintre proeminenții bayezieni. Sunt încă student și l-aș fi putut înțelege greșit într-un fel. Vă rog să acceptați scuzele mele în prealabil.
Comentarii
- ” frecventistul ESTE OBLIGAT să piardă ” Privind cel mai votat răspuns, eu ‘ presupunem că acest lucru depinde de funcția utilitară (de ex. nu dacă optimizarea regretului are loc). Intuitiv, ar putea depinde și de capacitatea de a determina funcția anterioară …
- ” frecventistul ESTE OBLIGAT să piardă ” … * condiționat de a avea priorul corespunzător * (ceea ce, în general, nu este atât de ușor) .Exemplu perfect: dependenții de jocuri de noroc sunt 99% siguri că norocul lor se va schimba de data aceasta. Cei care încorporează acest lucru în analiza deciziilor lor tind să nu se descurce atât de bine pe termen lung.
- Nu cred că ‘ cred că ar trebui să abreviați intervalele de încredere ca CI într-un răspuns despre distincția dintre intervale credibile și intervale de încredere.
Răspuns
Întotdeauna distractiv de angajat într-un pic de filozofie. Îmi place foarte mult răspunsul lui Keith, totuși aș spune că ia poziția de „Domnule uitat Bayesia”. Acoperirea proastă atunci când tipul B și tipul C poate apărea numai dacă aplică aceeași distribuție de probabilitate la fiecare încercare și refuză să-și actualizeze priorul.
Puteți vedea acest lucru destul de clar, deoarece borcanele de tip A și de tip D fac „predicții definite” ca să spunem așa (pentru 0-1 și 2- Respectiv 3 jetoane), în timp ce borcanele de tip B și C oferă practic o distribuție uniformă a jetoanelor. Deci, la repetarea experimentului cu un „borcan adevărat” fix (sau dacă am prelevat un alt biscuit), o distribuție uniformă a jetoanelor va oferi dovezi pentru borcanele de tip B sau C.
Și din punctul de vedere „practic”, tipul B și C ar necesita un eșantion enorm pentru a putea distinge între ele. Divergențele KL între cele două distribuții sunt $ KL ( B || C) \ aproximativ 0,006 \ aproximativ KL (C || B) $. Aceasta este o divergență echivalentă cu două distribuții normale ambele cu varianță $ 1 $ și o diferență în înseamnă $ \ sqrt {2 \ ori 0,006} = 0,11 $. Deci, nu ne putem aștepta să putem discrimina pe baza unui eșantion (pentru cazul normal, am avea nevoie de aproximativ 320 de dimensiuni ale eșantionului pentru a detecta această diferență la un nivel de semnificație de 5%). Așadar, putem prăbuși în mod justificat tipul B și tastați C împreună, până când avem un eșantion suficient de mare.
Acum ce se întâmplă cu acele intervale credibile? De fapt, acum avem o acoperire 100% a „B sau C”! Ce zici de intervalele frecventiste? Acoperirea este neschimbată deoarece toate intervalele conțin atât B, cât și C sau niciuna, așa că este încă supusă criticilor din răspunsul lui Keith – 59% și 0% pentru 3 și 0 jetoane observate.
Dar să fim pragmatici aici.Dacă optimizați ceva în ceea ce privește o funcție, nu se poate aștepta să funcționeze bine pentru o funcție diferită. Cu toate acestea, atât intervalele frecventiste, cât și cele bayeziene ating nivelul de credibilitate / încredere dorit în medie. Avem $ (0+ 99 + 99 + 59 + 99) /5=71.2$ – deci frecventistul are o credibilitate medie adecvată. Avem și $ (98 + 60 + 66 + 97) /4=80.3$ – bayezianul are o acoperire medie adecvată.
Un alt punct pe care aș dori să-l subliniez este că Bayesianul nu spune că „parametrul este aleatoriu” prin atribuirea unei distribuții de probabilitate. Pentru Bayesian (măcar pentru mine oricum) o distribuție de probabilitate este o descriere a ceea ce se știe despre acel parametru. Noțiunea de „aleatorie” nu există cu adevărat în teoria bayesiană, doar noțiunile de „cunoaștere” și „neștiință”. „Cunoscutul” intră în condiții, iar „necunoscutele” sunt pentru ce calculăm probabilitățile, dacă sunt de interes și marginalizăm dacă este o neplăcere. Deci descrie un interval credibil ceea ce se știe despre un parametru fix, făcând o medie asupra a ceea ce nu se știe despre el. Deci, dacă ar fi să luăm poziția persoanei care a ambalat borcanul pentru biscuiți și am ști că este de tip A, intervalul lor de credibilitate ar fi doar [A], indiferent de eșantion și indiferent de câte eșantioane au fost luate. Și ar fi 100% precise!
Un interval de încredere se bazează pe „aleatoriu” sau variație care există în diferitele probe posibile. Ca atare, singura variație pe care o iau în considerare este aceea dintr-un eșantion. Deci, intervalul de încredere este neschimbat pentru persoana care a ambalat borcanul pentru biscuiți și nou că a fost de tip A. Deci, dacă ați extras biscuitul cu 1 cip din borcanul de tip A, frecventistul ar afirma cu 70% încredere că tipul era nu A, deși știu că borcanul este de tip A! (dacă și-au menținut ideologia și și-au ignorat bunul simț). Pentru a vedea că acesta este cazul, rețineți că nimic în această situație nu a schimbat distribuția eșantionării – pur și simplu am luat perspectiva unei alte persoane cu informații bazate pe „non-date” despre un parametru.
Încredere intervalele se vor schimba numai atunci când se modifică datele sau se schimbă modelul / distribuția eșantionării. intervalele de credibilitate se pot modifica dacă se iau în considerare alte informații relevante.
Rețineți că acest comportament nebun nu este cu siguranță ceea ce ar face de fapt un susținător al intervalelor de încredere; dar demonstrează o slăbiciune a filozofiei care stă la baza metodei într-un caz particular. Intervalele de încredere funcționează cel mai bine atunci când nu știți multe despre un parametru dincolo de informațiile conținute într-un set de date. Și mai mult, intervalele de credibilitate câștigate nu pot fi îmbunătățite mult la intervalele de încredere, cu excepția cazului în care există informații anterioare pe care „nu ia în considerare sau găsirea statisticilor suficiente și auxiliare este dificilă.
Comentarii
- Pot ‘ nu spun că am înțeles explicația lui Keith ‘ a exemplului de jar, o întrebare rapidă: repet experimentul de $ m $ ori, am colectat $ m $ eșantioane diferite, așa că acum am ‘ am calculat $ m $ CIs diferite (fiecare cu un nivel de încredere de 95%), acum ce este CI? Înseamnă că 95% din $ m $ CIs ar trebui să acopere adevărata valoare?
- @loganecolss – acest lucru este într-adevăr adevărat, dar numai în limita ca $ m \ to \ infty $. Aceasta corespunde probabilității standard ” ” = ” frecvență pe termen lung ” interpretare care stă la baza CI-urilor.
- Da, în limită. Apoi, pentru unul sau doar câteva exemple, IC-urile nu ‘ nu înseamnă nimic, nu? Atunci ce ‘ este punctul de calcul al CI, dacă nu ‘ am tone de probe?
- @loganecolss – ‘ este motivul pentru care ‘ ma bayezian.
- @nazka – un fel de. Aș spune că este întotdeauna cel mai bine să folosiți o abordare bayesiană, indiferent de cât de multe date aveți. Dacă acest lucru poate fi bine aproximat printr-o procedură frecventistă, atunci utilizați asta. Bayesian nu este un sinonim pentru lent.
Răspuns
După cum înțeleg: Un interval credibil este o afirmație din gama de valori pentru statisticile de interes care rămân plauzibile având în vedere eșantionul particular de date pe care l-am observat de fapt. Un interval de încredere este o afirmație a frecvenței cu care se află adevărata valoare în intervalul de încredere atunci când experimentul se repetă de mai multe ori, de fiecare dată cu un eșantion diferit de date din aceeași populație subiacentă.
În mod normal, întrebarea la care dorim să răspundem este „ce valori ale statisticii sunt în concordanță cu datele observate”, iar intervalul credibil oferă un răspuns direct la acea întrebare – adevărata valoare a statisticii constă într-un interval credibil de 95% cu probabilitate 95%.Intervalul de încredere nu oferă un răspuns direct la această întrebare; nu este corect să afirmăm că probabilitatea ca adevărata valoare a statisticii să se situeze în intervalul de încredere de 95% este de 95% (cu excepția cazului în care se întâmplă să coincidă cu intervalul credibil). Cu toate acestea, aceasta este o interpretare greșită foarte frecventă a unui interval de încredere frecventist, deoarece este interpretarea care ar fi un răspuns direct la întrebare.
Lucrarea de Jayne pe care o discut într-o altă întrebare oferă un bun exemplu de aceasta (exemplul # 5), în cazul în care este construit un interval de încredere perfect corect, în care eșantionul particular de date pe care se bazează exclude orice posibilitate ca valoarea reală a statisticii să fie în intervalul de încredere de 95%! Acesta este doar un problemă dacă intervalul de încredere este interpretat incorect ca o afirmație a valorilor plauzibile ale statisticii pe baza eșantionului special pe care l-am observat.
La sfârșitul zilei, este o chestiune de „cai pentru cursuri „, și care interval este cel mai bun depinde de întrebarea la care doriți să răspundeți – alegeți metoda care răspunde direct la această întrebare.
Bănuiesc că intervalele de încredere sunt mai utile atunci când analizați experimentele repetate [proiectate] (ca este doar presupunerea care stau la baza intervalului de încredere) și intervale credibile mai bune atunci când analizăm date observaționale, dar aceasta este doar o opinie (folosesc ambele tipuri de intervale în propria mea lucrare, dar nu m-aș descrie ca expert în niciunul dintre ele).
Comentarii
- Problema cu intervale de încredere în experimentele repetate este că, pentru ca acestea să funcționeze, condițiile experimentului repetabil trebuie să rămână aceleași (și cine ar crede asta?), în timp ce intervalul bayesian (dacă este utilizat în mod corespunzător) condiționează datele observate și, astfel, oferă cote pentru modificările care au loc în lumea reală (prin intermediul datelor). Cred că regulile de condiționare ale statisticilor bayesiene fac dificilă depășirea performanței (cred că este imposibil: se poate obține doar echivalența) și mașinile automate pe care le realizează, care o fac să pară atât de slick.
Răspuns
Am găsit o mulțime de interpretări despre intervalul de încredere și setul credibil sunt greșite. De exemplu, intervalul de încredere nu poate fi exprimat în acest format $ P (\ theta \ in CI) $. Dacă priviți cu atenție „distribuțiile” în inferența frecvențistului și a bayezianului, veți vedea lucrări frecventiste despre distribuția eșantionării asupra datelor, în timp ce bayezianul lucrează la distribuția (posterioară) a parametrului. Acestea sunt definite pe Sample Space și Sigma Algebra complet diferite.
Deci da, puteți spune „Dacă repetați experimentul de multe ori, aproximativ 95% din 95% CI vor acoperi adevăratul parametru”. Deși în Bayesian veți spune că „adevărata valoare a statisticii constă într-un interval credibil de 95% cu probabilitate 95%”, totuși, această probabilitate de 95% (în Bayesian) în sine este doar o estimare. (Amintiți-vă că se bazează pe distribuția condițiilor date de aceste date specifice, nu pe distribuția eșantionării). Acest estimator ar trebui să vină cu o eroare aleatorie datorată eșantionului aleatoriu.
Bayesian încearcă să evite problema de eroare de tip I. Bayesian spune întotdeauna că nu are sens să vorbim despre eroarea de tip I în Bayesian. Acest lucru nu este în întregime adevărat. Statisticienii doresc întotdeauna să măsoare posibilitatea sau eroarea că „Datele dvs. vă sugerează să luați o decizie, dar populația sugerează altfel”. La asta Bayesian nu poate răspunde (detalii omise aici). Din păcate, acesta poate fi cel mai important lucru la care ar trebui să răspundă statisticianul. Statisticienii nu sugerează doar o decizie. Statisticienii ar trebui, de asemenea, să poată aborda cât de mult poate decizia greșită.
Trebuie să inventez următorul tabel și termenii pentru a explica conceptul. Sper că acest lucru poate ajuta la explicarea diferenței dintre intervalul de încredere și setul credibil.
Vă rugăm să rețineți că distribuția posterioară este $ P (\ theta_0 | Data_n) $, unde $ \ theta_0 $ este definit din $ P anterior (\ theta_0) $. În frecvențist distribuția eșantionării este $ P (Data_n; \ theta) $. Distribuția de eșantionare a $ \ hat {\ theta} $ este $ P (\ hat {\ theta} _n; \ theta) $. Indicele $ n $ este dimensiunea eșantionului. Vă rugăm să nu utilizați notația $ P (Data_n | \ theta) $ pentru a prezenta distribuția eșantionării în frecventist. Puteți vorbi despre date aleatorii în $ P (Date_n; \ theta) $ și $ P (\ hat {\ theta} _n; \ theta) $, dar nu puteți vorbi despre date aleatorii în $ P (\ theta_0 | Data_n) $.
„???????” explică de ce nu suntem capabili să evaluăm eroarea de tip I (sau ceva similar) în Bayesian.
Rețineți, de asemenea, că seturile credibile pot fi utilizate pentru a aproxima intervalele de încredere în anumite circumstanțe. Cu toate acestea, aceasta este doar o aproximare matematică. Interpretarea ar trebui să meargă frecventist. Interpretarea bayesiană în acest caz nu mai funcționează.
Notarea Thylacoleo în $ P (x | \ theta) $ nu este frecventistă. Aceasta este încă Bayesiană. notația cauzează o problemă fundamentală în teoria măsurătorilor atunci când vorbim despre frecventist.
Sunt de acord cu concluzia făcută de Dikran Marsupial . Dacă sunteți Evaluator FDA, doriți întotdeauna să știți posibilitatea de a aproba o cerere de medicament, dar medicamentul nu este de fapt eficient. Acesta este răspunsul pe care Bayesian nu îl poate oferi, cel puțin în clasicul / tipic Bayesian.
Răspuns
Încredere generică și consecventă și regiuni credibile. http://dx.doi.org/10.6084/m9.figshare.1528163 cu cod la http://dx.doi.org/10.6084/m9.figshare.1528187
Oferă o descriere a intervalelor și încrederii credibile intervale pentru selectarea setului împreună cu codul R generic pentru a calcula atât având în vedere funcția de probabilitate, cât și unele date observate o statistică de testare care oferă intervale de încredere și de încredere de dimensiuni optime care sunt consistente între ele.
Pe scurt și evitând formulele. intervalul credibil bayesian se bazează pe probabilitatea a parametrilor, dată fiind date . Colectează parametrii care au o probabilitate mare în setul / intervalul credibil. Intervalul credibil de 95% conține parametri care împreună au o probabilitate de 0,95 date de date.
Frecventistul interval de încredere se bazează pe probabilitatea datelor date unor parametri . Pentru fiecare parametru (posibil infinit), generează mai întâi setul de date care este probabil să fie observat în condițiile parametrului. Apoi verifică pentru fiecare parametru dacă datele selectate de probabilitate ridicată conțin datele observate. Dacă datele cu probabilitate ridicată conțin datele observate, parametrul corespunzător este adăugat la intervalul de încredere. Astfel, intervalul de încredere este colectarea parametrilor pentru care nu putem exclude posibilitatea ca parametrul să fi generat datele. Aceasta oferă o regulă astfel încât, dacă se aplică în mod repetat la probleme similare, intervalul de încredere de 95% va conține valoarea parametrului adevărat în 95% din cazuri.
95% set credibil și 95% set de încredere pentru un exemplu dintr-o distribuție binomială negativă
Comentarii
- Descrierea intervalelor de încredere nu este corectă. ” 95% ” provine din probabilitatea ca un eșantion din populație să producă un interval care conține valoarea adevărată a parametrului.
- @jlimahaverford – Descrierea este corectă ca și a ta. Pentru a face legătura cu ceea ce descrieți, am adăugat ” Aceasta oferă o regulă astfel încât, dacă se aplică în mod repetat la probleme similare, intervalul credibil de 95% va conține valoarea parametrului adevărat în 95 % din cazuri. ”
- Nu vorbeam despre descrierea dvs. a intervalelor credibile, ci despre intervalele de încredere. ‘ observ acum că în mijlocul paragrafului dvs. privind intervalele de încredere începeți să vorbiți din nou despre credibilitate și cred că aceasta este o greșeală. Ideea importantă este aceasta ” Dacă aceasta ar fi adevărata valoare a parametrului, care este probabilitatea ca eu să extrag un eșantion atât de extrem sau mai mult. Dacă răspunsul este mai mare de 5%, ‘ se află în intervalul de încredere. ”
- @jlimahaverford – aggree și corectat – Mulțumesc.
- hmm, nu văd corectat.
Răspunde
Acesta este mai mult un comentariu, dar prea lung. În următoarea lucrare: The Dawning of the Age of Stochasticity (David Mumford) Mumford are următorul comentariu interesant:
În timp ce toate aceste utilizări cu adevărat interesante erau făcute de statistici, majoritatea statisticienilor înșiși, conduși de Sir RA Fisher își lega mâinile la spate, insistând asupra faptului că statisticile nu pot fi folosite în nici o situație, ci total reproductibilă, apoi folosesc doar datele empirice. Aceasta este așa-numita școală „frecventistă” care a luptat cu școala bayesiană că prioritățile ar putea fi utilizate și utilizarea inferenței statistice foarte extinsă. Această abordare neagă faptul că inferența statistică poate avea orice legătură cu gândirea reală, deoarece situațiile din viața reală sunt întotdeauna îngropate în variabile contextuale și nu pot fi repetate.Din fericire, școala bayesiană nu a murit total, fiind continuată de DeFinetti, E.T. Jaynes, alții arizi.