Qual è ' la differenza tra un intervallo di confidenza e un intervallo credibile?

Lo scambio di Joris e Srikant qui mi ha fatto chiedere (di nuovo) se il mio le spiegazioni per la differenza tra intervalli di confidenza e intervalli credibili erano quelle corrette. Come spiegheresti la differenza?

Risposta

I daccordo completamente con la spiegazione di Srikant. Per dare una rotazione più euristica:

Gli approcci classici generalmente ipotizzano che il mondo sia unidirezionale (ad esempio, un parametro ha un particolare valore reale) e cerca di condurre esperimenti la cui conclusione risultante, non importa il vero valore del parametro – sarà corretto con almeno una minima probabilità.

Di conseguenza, per esprimere incertezza nella nostra conoscenza dopo un esperimento, lapproccio frequentista utilizza un “intervallo di confidenza” – un intervallo di valori progettato per includere il valore reale del parametro con una probabilità minima, diciamo 95%. Un frequentista progetterà lesperimento e la procedura dellintervallo di confidenza al 95% in modo che su ogni 100 esperimenti eseguiti dallinizio alla fine, si prevede che almeno 95 degli intervalli di confidenza risultanti includano il valore reale del parametro. Gli altri 5 potrebbero essere leggermente sbagliati, o potrebbero essere del tutto assurdi – formalmente parlando va bene per quanto riguarda lapproccio, purché 95 inferenze su 100 siano corrette. (Ovviamente preferiremmo che lo fossero leggermente sbagliato, non totale assurdità.)

Gli approcci bayesiani formulano il problema in modo diverso. Invece di dire che il parametro ha semplicemente un valore vero (sconosciuto), un metodo bayesiano dice che il valore del parametro è fisso ma è stato scelto da una certa distribuzione di probabilità, nota come distribuzione di probabilità a priori. (Un altro modo per dirlo è che prima di effettuare qualsiasi misurazione, il bayesiano assegna una distribuzione di probabilità, che chiamano stato di credenza, su quale sia il vero valore del parametro.) Questo “precedente” potrebbe essere noto (immagina di provare per stimare le dimensioni di un camion, se conosciamo la distribuzione complessiva delle dimensioni dei camion dal DMV) o potrebbe essere unipotesi tratta dal nulla. Linferenza bayesiana è più semplice: raccogliamo alcuni dati e quindi calcoliamo la probabilità di diversi valori del parametro DATI i dati. Questa nuova distribuzione di probabilità è chiamata “probabilità a posteriori” o semplicemente “a posteriori”. Gli approcci bayesiani possono riassumere la loro incertezza fornendo un intervallo di valori sulla distribuzione di probabilità a posteriori che include il 95% della probabilità – questo è chiamato “intervallo di credibilità del 95%”.

Un partigiano bayesiano potrebbe criticare il Intervallo di confidenza frequentista come questo: “Allora cosa succede se 95 esperimenti su 100 producono un intervallo di confidenza che include il valore vero? Non mi interessano 99 esperimenti CHE NON HO” FARE; Mi interessa questo esperimento CHE HO FATTO. La tua regola consente a 5 su 100 di essere completamente senza senso [valori negativi, valori impossibili] fintanto che gli altri 95 sono corretti; questo è “ridicolo”.

Un frequentista irriducibile potrebbe criticare lintervallo di credibilità bayesiano in questo modo: “E se il 95% della probabilità a posteriori fosse incluso in questo intervallo? E se il valore vero fosse, diciamo, 0,37? Se lo è, il tuo metodo, eseguito dallinizio alla fine, sarà SBAGLIATO il 75% delle volte. La tua risposta è “Oh beh, va bene perché secondo il precedente è molto raro che il valore sia 0,37” e potrebbe essere così, ma voglio un metodo che funzioni per QUALSIASI valore possibile del parametro. Non mi interessano circa 99 valori del parametro che NON HA; Mi interessa lunico vero valore CHE HA. Oh, inoltre, a proposito, le tue risposte sono corrette solo se la precedente è corretta. Se lo tiri fuori dal nulla perché ti sembra giusto, puoi essere lontano “.

In un certo senso entrambi questi partigiani hanno ragione nelle loro critiche reciproche” metodi, ma io esorto pensare matematicamente alla distinzione, come spiega Srikant.


Ecco un esempio esteso di quel discorso che mostra la differenza precisamente in un esempio discreto.

Quando Da bambino mia madre mi sorprendeva di tanto in tanto ordinando un barattolo di biscotti con gocce di cioccolato da recapitare per posta. La società di spedizioni forniva quattro diversi tipi di barattoli di biscotti: tipo A, tipo B, tipo C e tipo D , ed erano tutti sullo stesso camion e non sei mai stato sicuro di quale tipo avresti ottenuto. Ogni barattolo conteneva esattamente 100 biscotti, ma la caratteristica che distingueva i diversi barattoli di biscotti era la rispettiva distribuzione di gocce di cioccolato per biscotto. un barattolo e tirò fuori un singolo cookie in modo uniforme a caso, queste sono le distribuzioni di probabilità che vorresti ottenere t sul numero di chip:

testo alternativo

Un barattolo di biscotti di tipo A, ad esempio, ha 70 biscotti con due patatine ciascuno e niente biscotti con quattro o più patatine!Un barattolo di biscotti di tipo D contiene 70 biscotti con un chip ciascuno. Nota come ogni colonna verticale è una funzione di massa di probabilità: la probabilità condizionale del numero di gettoni che “d”, dato che il vaso = A, o B, o C, o D, e ogni colonna somma a 100.

Mi piaceva giocare non appena il fattorino lasciava il mio nuovo barattolo di biscotti. Tiravo fuori un singolo biscotto a caso dal barattolo, contavo le fiches sul biscotto e provavo a esprimere il mio incertezza – al livello del 70% – di quali barattoli potrebbe essere. Quindi è lidentità del vaso (A, B, C o D) che è il valore del parametro stimato. Il numero di chip (0, 1, 2, 3 o 4) è il risultato o losservazione o il campione .

Inizialmente giocavo a questo gioco utilizzando un intervallo di confidenza del 70% dei frequentisti. Tale intervallo deve essere sicuro che non importa il vero valore del parametro, il che significa che non importa quale cookie jar ho, lintervallo coprirà quel valore vero con almeno il 70% di probabilità.

Un intervallo, ovviamente, è una funzione che mette in relazione un risultato (una riga) a un insieme di valori del parametro (un insieme di colonne). Ma per costruire lintervallo di confidenza e garantire una copertura del 70%, dobbiamo lavorare “verticalmente “- guardando ciascuna colonna a turno e assicurandosi che il 70% della funzione di massa di probabilità sia coperto in modo che il 70% delle volte, lidentità di quella colonna farà parte dellintervallo che ne risulta. Ricorda che sono le colonne verticali a formare un pmf

Quindi, dopo aver eseguito questa procedura, ho concluso con questi intervalli:

inserisci la descrizione dellimmagine qui

Ad esempio, se il numero di gettoni sul cookie che disegno è 1, il mio intervallo di confidenza sarà {B, C, D}. Se il numero è 4, il mio intervallo di confidenza sarà {B, C}. Notare che poiché ogni colonna somma al 70% o più, allora non importa in quale colonna ci troviamo veramente (non importa in quale vaso il fattorino ha lasciato), lintervallo risultante da questa procedura includerà il corretto jar con almeno il 70% di probabilità.

Si noti inoltre che la procedura che ho seguito per costruire gli intervalli aveva una certa discrezione. Nella colonna per il tipo B, avrei potuto altrettanto facilmente assicurarmi che gli intervalli che incluso B sarebbe 0,1,2,3 invece di 1,2,3,4. Ciò avrebbe comportato una copertura del 75% per i barattoli di tipo B (12 + 19 + 24 + 20), rispettando comunque il limite inferiore di 70%.

Mia sorella Bayesia ha pensato a questa app lo scarafaggio era pazzo, però. “Devi considerare il deliverman come parte del sistema”, ha detto. “Trattiamo lidentità del barattolo come una variabile casuale stessa e” presumiamo che il trasportatore scelga tra loro in modo uniforme, il che significa che ha tutti e quattro sul suo camion, e quando arriva a casa nostra ne sceglie uno a caso, ciascuno con probabilità uniforme. “

” Con questo presupposto, ora guardiamo le probabilità congiunte dellintero evento: il tipo di vaso e il numero di gettoni estratti dal tuo primo cookie”, ha detto, disegnando la seguente tabella:

inserisci qui la descrizione dellimmagine

Nota che lintera tabella è ora una funzione di massa di probabilità, ovvero lintera tabella somma al 100%.

” Ok, “ho detto,” dove stai andando con questo? “

” Hai “guardato la probabilità condizionale del numero di chip, dato il barattolo”, ha detto Bayesia. “È tutto sbagliato! Quello che ti interessa davvero è la probabilità condizionale di quale barattolo sia, dato il numero di chip sul cookie! Il tuo intervallo del 70% dovrebbe semplicemente includere lelenco dei barattoli che, in totale, hanno il 70% di probabilità di essere il vero barattolo. Non è molto più semplice e intuitivo? “

” Certo, ma come lo calcoliamo? ” Ho chiesto.

“Diciamo” che sappiamo che hai 3 gettoni. Quindi possiamo ignorare tutte le altre righe della tabella e trattare semplicemente quella riga come una funzione di massa di probabilità. Tuttavia, dovremo aumentare le probabilità in modo proporzionale in modo che ogni riga venga sommata a 100 “. Lo ha fatto:

inserisci qui la descrizione dellimmagine

“Nota come ogni riga ora è un pmf e somma al 100%. Noi “ho invertito la probabilità condizionale da quella con cui hai iniziato – ora è la probabilità che luomo abbia lasciato cadere un certo barattolo, dato il numero di gettoni sul primo biscotto.”

“Interessante, ” Ho detto. “Quindi ora cerchiamo un numero sufficiente di barattoli in ogni riga per ottenere fino al 70% di probabilità?” Abbiamo fatto proprio questo, stabilendo questi intervalli di credibilità:

inserisci qui la descrizione dellimmagine

Ogni intervallo include una serie di barattoli che, a posteriori , somma al 70% di probabilità di essere il vero vaso.

“Bene, aspetta,” dissi. “Non sono convinto.Mettiamo “fianco a fianco i due tipi di intervalli e confrontiamoli per la copertura e, supponendo che il fattorino scelga ogni tipo di vaso con la stessa probabilità, credibilità”.

Eccoli:

Intervalli di fiducia:

inserisci la descrizione dellimmagine qui

Intervalli di credibilità:

inserisci qui la descrizione dellimmagine

“Vedi quanto sono folli i tuoi intervalli di confidenza?” disse Bayesia. “Non hai nemmeno una risposta sensata quando disegni un biscotto con zero chip! Dici solo che è lintervallo vuoto. Ma ovviamente è sbagliato: deve essere uno dei quattro tipi di barattoli. Come puoi convivere con te stesso, affermando un intervallo alla fine della giornata quando sai che lintervallo è sbagliato? E idem quando prendi un biscotto con 3 gettoni, il tuo intervallo è corretto solo il 41% delle volte. Definirlo un intervallo di confidenza del “70%” è una stronzata. “

” Bene, ehi “, ho risposto.” È corretto il 70% delle volte, non importa quale barattolo ha lasciato il fattorino. Quello “è molto di più di quello che puoi dire sui tuoi intervalli di credibilità. E se il barattolo è di tipo B? Quindi il tuo intervallo sarà sbagliato l80% delle volte e corretto solo il 20% delle volte! “

” Questo sembra un grosso problema “, ho continuato,” perché i tuoi errori saranno correlati con il tipo di vaso. Se invii 100 robot “bayesiani” per valutare il tipo di barattolo che hai, ogni robot campiona un cookie, mi stai dicendo che nei giorni di tipo B, ti aspetteresti che 80 robot ottengano la risposta sbagliata, ciascuno avere> 73% di convinzione nella sua conclusione errata! Questo è fastidioso, soprattutto se vuoi che la maggior parte dei robot concordi sulla risposta giusta. “

” INOLTRE dovevamo supporre che il fattorino si comporti in modo uniforme e seleziona ogni tipo di barattolo a caso “, ho detto.” Da dove viene? E se fosse sbagliato? Non gli hai parlato; non lhai intervistato. Eppure tutte le tue affermazioni di probabilità a posteriori si basano su questa affermazione sul suo comportamento. Non dovevo fare tali supposizioni, e il mio intervallo soddisfa il suo criterio anche nel caso peggiore. “

” È vero che il mio intervallo di credibilità funziona male sui barattoli di tipo B “, ha detto Bayesia. “Ma allora? I barattoli di tipo B si verificano solo il 25% delle volte. È bilanciato dalla mia buona copertura dei barattoli di tipo A, C e D. E non pubblico mai sciocchezze. “

” E vero che il mio intervallo di confidenza si comporta male quando “ho disegnato un biscotto con zero chip”, ho detto. “Ma allora? I biscotti senza chip si verificano, al massimo, il 27% delle volte nel peggiore dei casi (un barattolo di tipo D). Posso permettermi di dare sciocchezze per questo risultato perché NESSUN barattolo risulterà in una risposta sbagliata più del 30% delle volte. “

” Le somme delle colonne sono importanti “, ho detto.

“La fila conta”, ha detto Bayesia.

“Vedo che” siamo in un vicolo cieco “, ho detto. “Siamo entrambi corretti nelle affermazioni matematiche che” stiamo facendo, ma non siamo daccordo sul modo appropriato per quantificare lincertezza “.

” È vero “, disse mia sorella.” Vuoi un biscotto? “

Commenti

  • Buona risposta – solo un punto minore, dici ” …. Invece di dire che il parametro ha un valore vero, un metodo bayesiano dice che il valore è scelto da una distribuzione di probabilità ….. ” Questo non è vero. Un bayesiano si adatta alla distribuzione di probabilità per esprimere lincertezza sul valore fisso vero, sconosciuto. Questo dice quali valori sono plausibili, dato ciò che era noto prima di osservare i dati. Leffettiva dichiarazione di probabilità è $ Pr [\ theta_0 \ in (\ theta, \ theta + d \ theta) | I] $, dove $ \ theta_0 $ è il valore vero e $ \ theta $ quello ipotizzato, in base alle informazioni $ I $.
  • … cont ‘ d … ma è molto più conveniente scrivere $ p (\ theta) $, con la comprensione di cosa t significa ” in background “. Chiaramente questo può creare molta confusione.
  • scusa se ripeto questo post super vecchio ma una domanda veloce, nel tuo post nella sezione in cui il frequentista critica lapproccio bayesiano dici: ” E se il valore vero fosse, diciamo, 0,37? Se lo è, il tuo metodo, eseguito dallinizio alla fine, sarà SBAGLIATO il 75% delle volte. ” Come hai ottenuto quei numeri? come fa 0,37 a corrispondere al 75% sbagliato? È fuori da qualche tipo di curva di probabilità? Grazie
  • @ BYS2, quando lautore dice che "What if the true value is, say, 0.37? If it is, then your method, run start to finish, will be WRONG 75% of the time", stanno solo fornendo numeri di esempio che hanno inventato. In questo caso particolare, si riferirebbero a una distribuzione precedente che aveva un valore molto basso a 0,37, con la maggior parte della sua densità di probabilità altrove. E presumiamo che la nostra distribuzione di esempio funzionerebbe molto male quando il vero valore del parametro è 0.37, analogamente a come gli intervalli di credibilità di Bayesia ‘ fallirono miseramente quando il barattolo era di tipo B.
  • Lautore dice "you will expect 80 of the robots to get the wrong answer, each having >73% belief in its incorrect conclusion!", ma questa dovrebbe essere >72% convinzione, poiché il 72% è la credibilità minima nella tabella degli intervalli di credibilità.

Risposta

La mia comprensione è la seguente:

Background

Supponi di avere dei dati $ x $ e stai cercando di stimare $ \ theta $. Hai un processo di generazione dei dati che descrive come $ x $ viene generato in base a $ \ theta $. In altre parole, conosci la distribuzione di $ x $ (diciamo, $ f (x | \ theta) $.

Problema di inferenza

Il tuo problema di inferenza è: quali valori di $ \ theta $ sono ragionevoli dati i dati osservati $ x $?

Intervalli di confidenza

Gli intervalli di confidenza sono una risposta classica al problema precedente. In questo approccio, presumi che ci sia vero , fisso il valore di $ \ theta $. Dato questo presupposto, usi i dati $ x $ per ottenere una stima di $ \ theta $ (diciamo, $ \ hat {\ theta} $). Una volta che hai stima che desideri valutare dove si trova il valore vero in relazione alla stima.

Nota che in questo approccio il valore vero non è una variabile casuale. È una variabile fissa ma quantità sconosciuta. Al contrario, la tua stima è una variabile casuale poiché dipende dai tuoi dati $ x $ che sono stati generati dal tuo processo di generazione dei dati. Pertanto, ti rendi conto che ottieni stima ogni volta che ripeti il tuo studio.

La comprensione di cui sopra porta alla seguente metodologia per valutare dove si trova il vero parametro in relazione alla tua stima. Definisci un intervallo, $ I \ equiv [lb (x), ub (x)] $ con la seguente proprietà:

$ P (\ theta \ in I) = 0,95 $

Un intervallo costruito come sopra è quello che viene chiamato intervallo di confidenza. Poiché il valore vero è sconosciuto ma fisso, il valore vero è nellintervallo o al di fuori dellintervallo. Lintervallo di confidenza quindi è unaffermazione sulla probabilità che lintervallo che otteniamo abbia effettivamente il valore del parametro vero. Pertanto, laffermazione di probabilità riguarda lintervallo (cioè le possibilità che lintervallo abbia o meno il valore vero) piuttosto che la posizione del valore del parametro vero.

In questo paradigma, non ha senso parlare della probabilità che un valore vero sia minore o maggiore di un valore in quanto il valore vero non è una variabile casuale.

Intervalli credibili

In contrasto con lapproccio classico, nellapproccio bayesiano assumiamo che il valore vero sia una variabile casuale. Quindi, catturiamo la nostra incertezza sul vero valore del parametro imponendo una distribuzione a priori sul vero vettore del parametro (diciamo $ f (\ theta) $).

Usando il teorema di Bayes, costruiamo la distribuzione a posteriori per il vettore parametro fondendo il precedente e i dati che abbiamo (brevemente il posteriore è $ f (\ theta | -) \ propto f (\ theta) f (x | \ theta) $).

Si arriva quindi a una stima puntuale utilizzando la distribuzione a posteriori (ad esempio, utilizzare la media della distribuzione a posteriori). Tuttavia, poiché con questo paradigma, il vero vettore di parametro è una variabile casuale, vogliamo anche conoscere lentità dellincertezza che abbiamo nella nostra stima puntuale. Pertanto, costruiamo un intervallo tale che valga quanto segue:

$ P (l (\ theta) \ le {\ theta} \ le ub (\ theta)) = 0,95 $

Quanto sopra è un intervallo credibile.

Riepilogo

Gli intervalli credibili catturano la nostra attuale incertezza nella posizione del valori dei parametri e quindi può essere interpretato come affermazione probabilistica sul parametro.

Al contrario, gli intervalli di confidenza catturano lincertezza sullintervallo che abbiamo ottenuto (cioè, se contiene il valore vero o meno). Pertanto, non possono essere interpretati come unaffermazione probabilistica sui veri valori dei parametri.

Commenti

  • Un intervallo di confidenza del 95% per definizione copre il parametro vero valore nel 95% dei casi, come correttamente indicato. Pertanto, la possibilità che lintervallo copra il valore del parametro vero è del 95%. A volte puoi dire qualcosa sulla possibilità che il parametro sia più grande o più piccolo di uno qualsiasi dei limiti, in base alle ipotesi che fai quando costruisci lintervallo (abbastanza spesso la distribuzione normale della tua stima). Puoi calcolare P (theta > ub) o P (ub < theta). Laffermazione riguarda il confine, in effetti, ma puoi farcela.
  • Joris, non posso ‘ essere daccordo. Sì, per qualsiasi valore del parametro, ci sarà > 95% di probabilità che lintervallo risultante copra il valore vero.Ciò ‘ non significa che dopo aver preso una particolare osservazione e calcolato lintervallo, cè ancora una probabilità condizionale del 95%, dati i dati che QUELLintervallo copre il valore reale. Come ho detto di seguito, formalmente sarebbe perfettamente accettabile che un intervallo di confidenza sputasse [0, 1] il 95% delle volte e il set vuoto laltro 5%. Nelle occasioni in cui hai ottenuto il set vuoto come intervallo, cè ‘ t 95% di probabilità che il valore vero sia compreso!
  • Joris, stavo usando ” dati ” come sinonimo di ” sample, ” quindi penso che siamo daccordo. Il punto è che ‘ è possibile trovarsi in situazioni, dopo aver preso il campione, in cui puoi dimostrare con assoluta certezza che il tuo intervallo è sbagliato, che non copre il vero valore. Ciò non significa che non sia un intervallo di confidenza del 95% valido. Quindi puoi ‘ t dire che il parametro di confidenza (il 95%) ti dice qualcosa sulla probabilità di copertura di un particolare intervallo dopo che ‘ ho fatto lesperimento e ho ottenuto lintervallo. Solo una probabilità a posteriori, informata da un precedente, può parlarne.
  • In uno degli articoli di Jaynes bayes.wustl.edu/etj/articles/ confidenza.pdf Costruisce un intervallo di confidenza e poi mostra che per il particolare campione puoi essere sicuro al 100% che il valore vero non si trova nel ” intervallo di confidenza “. Ciò non ‘ significa che lelemento della configurazione è ” sbagliato “, è proprio questo un intervallo di confidenza frequentista non è una risposta alla domanda ” qual è lintervallo che contiene il vero valore della statistica con probabilità 95% “. Purtroppo questa è la domanda che vorremmo porre, motivo per cui lIC viene spesso interpretato come se fosse una risposta a quella domanda. 🙁
  • @svadalli – lapproccio bayesiano non considera che $ \ theta $ sia casuale . Non è $ \ theta $ che viene distribuito ($ \ theta $ è fisso ma sconosciuto), è l incertezza su $ \ theta $ che è distribuita, condizionata a uno stato di conoscenza di $ \ theta $. che $ f (\ theta) $ sta catturando è $ Pr (\ theta \ text {è nellintervallo} (\ theta, \ theta + d \ theta) | I) = f (\ theta) d \ theta $. In Infatti, lo stesso identico argomento si applica a $ X $, anchesso può essere considerato fisso, ma sconosciuto.

Risposta

Non sono daccordo con la risposta di Srikant su un punto fondamentale. Srikant ha affermato questo:

“Problema di inferenza: il tuo problema di inferenza è: quali valori di θ sono ragionevoli dati i dati osservati x?”

Infatti questo è il PROBLEMA DELLINFERENZA BAYESIANA. Nella statistica bayesiana si cerca di calcolare P (θ | x) cioè la probabilità del valore del parametro dato i dati osservati (campione). LINTERVALLO CREDIBILE è un intervallo di θ che ha una probabilità del 95% (o altro) di contenere il valore vero di θ date le diverse ipotesi alla base del problema.

Il PROBLEMA DI INFERENZA FREQUENTISTA è questo:

I dati osservati x sono ragionevoli dati i valori ipotizzati di θ?

Nelle statistiche frequentiste cerchiamo di calcolare P (x | θ) cioè la probabilità di osservare i dati (campione) dati i valori dei parametri ipotizzati. LINTERVALLO DI CONFIDENZA (forse un termine improprio) viene interpretato come: se lesperimento che ha generato il campione casuale x fosse ripetuto molte volte, il 95% (o altro) di tali intervalli costruiti da quei campioni casuali conterrebbe il vero valore del parametro.

Pasticciare con la tua testa? Questo è il problema con le statistiche frequentiste e la cosa principale che la statistica bayesiana ha da offrire.

Come sottolinea Sikrant, P (θ | x) e P (x | θ) sono correlati come segue:

P (θ | x) = P (θ) P (x | θ)

Dove P (θ) è la nostra probabilità a priori; P (x | θ) è la probabilità di i dati condizionati a quella precedente e P (θ | x) è la probabilità a posteriori. La precedente P (θ) è intrinsecamente soggettiva, ma questo è il prezzo della conoscenza dellUniverso – in un senso molto profondo.

Le altre parti delle risposte di Sikrant e Keith sono eccellenti.

Commenti

  • Tecnicamente, hai ragione ma tieni presente che lintervallo di confidenza fornisce linsieme dei valori dei parametri per i quali lipotesi nulla è vera. Pertanto, ” i dati osservati sono x ragionevoli data la nostra ipotesi su theta? ” può essere riformulato come ” Quali veri valori di theta sarebbero unipotesi compatibile data losservazione ed data x? ” Nota che la domanda riformulata non implica necessariamente che si presume che theta sia una variabile casuale.La domanda riformulata sfrutta il fatto che eseguiamo test di ipotesi nulla controllando se il valore ipotizzato cade nellintervallo di confidenza.
  • @svadali – gli intervalli di confidenza valutano dati per un valore fisso ipotesi. Pertanto, quando si modifica la parte ” fissa ” dellequazione, se non si tiene conto della probabilità dellipotesi prima di osservare dati, quindi sei destinato a presentare incongruenze e risultati incoerenti. La probabilità condizionale non è ” vincolata ” quando si modificano le condizioni (ad esempio, modificando le condizioni è possibile modificare una probabilità condizionale da 0 a 1) . La probabilità a priori tiene conto di questa arbitrarietà. Il condizionamento su X viene eseguito perché siamo certi che X si sia verificato: abbiamo osservato X!

Answer

Il le risposte fornite in precedenza sono molto utili e dettagliate. Ecco il mio $ 0,25.

Lintervallo di confidenza (CI) è un concetto basato sulla definizione classica di probabilità (chiamata anche “definizione frequentista”) che la probabilità è come la proporzione e si basa sul sistema assiomatico di Kolmogrov (e altri).

Si può ritenere che gli intervalli credibili (Densità posteriore più alta, HPD) abbiano le sue radici nella teoria delle decisioni, basata sui lavori di Wald e de Finetti (ed estesa molto da altri).

Poiché le persone in questo thread hanno svolto un ottimo lavoro nel fornire esempi e la differenza di ipotesi nel caso bayesiano e frequentista, sottolineerò solo alcuni punti importanti.

  1. Gli IC si basano sul fatto che DEVONO essere inferite su tutte le possibili ripetizioni di un esperimento che può essere visto e NON solo sui dati osservati dove gli HPD si basano INTERAMENTE sui dati osservati (e ovviamente le nostre ipotesi precedenti).

  2. In generale gli CI NON sono coerenti (verrà spiegato più avanti) mentre gli HPD sono coerenti (a causa delle loro radici nella teoria delle decisioni). Coerenza (come spiegherei a mia nonna) significa: dato un problema di scommesse su un valore di parametro, se uno statistico classico (frequentista) punta su CI e un bayesiano su HPD, il frequentista È VINCOLATO a perdere (escluso il caso banale quando HPD = CI). In breve, se vuoi riassumere i risultati del tuo esperimento come una probabilità basata sui dati, la probabilità DEVE essere una probabilità a posteriori (basata su un precedente). Cè un teorema (cfr Heath e Sudderth, Annals of Statistics, 1978) che afferma (approssimativamente): Lassegnazione di probabilità a $ \ theta $ basata sui dati non farà un sicuro perdente se e solo se è ottenuto in modo bayesiano.

  3. Poiché gli elementi della configurazione non condizionano i dati osservati (chiamato anche “principio di condizionalità” CP), possono essere esempi paradossali. Fisher è stato un grande sostenitore di CP e ha anche trovato molti esempi paradossali quando questo NON è stato seguito (come nel caso di CI). Questo è il motivo per cui ha usato i valori p per linferenza, al contrario di CI. A suo avviso, i valori p erano basati sui dati osservati (si può dire molto sui valori p, ma non è questo il punto centrale qui). Due degli esempi paradossali più famosi sono: (4 e 5)

  4. Esempio di Cox (Annals of Math. Stat., 1958): $ X_i \ sim \ mathcal {N} (\ mu, \ sigma ^ 2) $ (iid) per $ i \ in \ {1, \ dots, n \} $ e vogliamo esti mate $ \ mu $ . $ n $ NON è fisso e viene scelto lanciando una moneta. Se il lancio della moneta risulta H, viene scelto 2, altrimenti viene scelto 1000. La stima del “buon senso” – la media del campione è una stima imparziale con una varianza di $ 0,5 \ sigma ^ 2 + 0,0005 \ sigma ^ 2 $ . Che cosa usiamo come varianza della media del campione quando $ n = 1000 $ ? Non è meglio (o sensato) usare la varianza dello stimatore della media campionaria come $ 0,001 \ sigma ^ 2 $ (varianza condizionale) invece della varianza effettiva dello stimatore , che è ENORME !! ( $ 0,5 \ sigma ^ 2 + 0,0005 \ sigma ^ 2 $ ). Questa è una semplice illustrazione di CP quando usiamo la varianza come $ 0,001 \ sigma ^ 2 $ quando $ n = 1000 $ . $ n $ stand alone non ha importanza o nessuna informazione per $ \ mu $ e $ \ sigma $ (cioè $ n $ è ausiliario per loro) ma, DATO il suo valore, sai molto sulla “qualità dei dati”. Questo è direttamente correlato allIC in quanto coinvolgono la varianza che non dovrebbe essere condizionata a $ n $ , cioè finiremo per usare la varianza maggiore, quindi più conservativa.

  5. Esempio di Welch: questo esempio funziona per qualsiasi $ n $ , ma prenderemo $ n = 2 $ per semplicità. $ X_1, X_2 \ sim \ mathcal {U} (\ theta – 1/2, \ theta + 1/2) $ (iid), $ \ theta $ appartiene alla riga Real. Ciò implica $ X_1 – \ theta \ sim \ mathcal {U} (- 1/2, 1/2) $ (iid). $ \ frac {1} {2} ( X_1 + X_2) {\ bar x} – \ theta $ (nota che NON è una statistica) ha una distribuzione indipendente da $ \ theta $ . Possiamo scegliere $ c > 0 $ st $ \ text {Prob} _ \ theta (-c < = {\ bar x} – \ theta < = c) = 1- \ alpha (\ approx 99 \%) $ , il che implica $ ({\ bar x} – c, {\ bar x} + c) $ è il 99% CI di $ \ theta $ . Linterpretazione di questo elemento della configurazione è: se campioniamo ripetutamente, otterremo $ {\ bar x} $ e il 99% (almeno) volte conterrà true $ \ theta $ , MA (lelefante nella stanza) per dati DATI, NON conosciamo la probabilità che CI contenga $ \ theta $ . Ora, considera i seguenti dati: $ X_1 = 0 $ e $ X_2 = 1 $ , come $ | X_1 – X_2 | = 1 $ , sappiamo PER SICURO che lintervallo $ (X_1, X_2) $ contiene $ \ theta $ (una possibile critica, $ \ text { Prob} (| X_1 – X_2 | = 1) = 0 $ , ma possiamo gestirlo matematicamente e non ne parlerò). Questo esempio illustra magnificamente anche il concetto di coerenza. Se sei uno statistico classico, scommetterai sicuramente sullIC al 99% senza guardare il valore di $ | X_1 – X_2 | $ (supponendo che tu sia fedele al tuo professione). Tuttavia, un bayesiano scommetterà sullelemento della configurazione solo se il valore di $ | X_1 – X_2 | $ è vicino a 1. Se condizioniamo $ | X_1 – X_2 | $ , lintervallo è coerente e il giocatore non sarà più un perdente sicuro (simile al teorema di Heath e Sudderth).

  6. Fisher aveva una raccomandazione per tali problemi: utilizzare CP. Per lesempio di Welch, Fisher ha suggerito la condizione di $ X_2-X_1 $ . Come si vede, $ X_2-X_1 $ è ausiliario per $ \ theta $ , ma fornisce informazioni su theta. Se $ X_2-X_1 $ è PICCOLO, non ci sono molte informazioni su $ \ theta $ in i dati. Se $ X_2-X_1 $ è GRANDE, ci sono molte informazioni su $ \ theta $ nel dati. Fisher estese la strategia del condizionamento sulla statistica accessoria a una teoria generale chiamata Inferenza fiduciale (chiamata anche il suo più grande fallimento, cfr Zabell, Stat. Sci. 1992), ma non divenne popolare a causa di mancanza di generalità e flessibilità. Fisher stava cercando di trovare un modo diverso sia dalla statistica classica (della Neyman School) che dalla scuola bayesiana (da cui il famoso adagio di Savage: “Fisher voleva fare una frittata bayesiana (cioè usando CP) senza rompere le uova bayesiane “). Folklore (nessuna prova) dice: Fisher nei suoi dibattiti ha attaccato Neyman (per errore di tipo I e II e CI) definendolo un addetto al controllo di qualità piuttosto che un Scienziato , poiché i metodi di Neyman non condizionavano i dati osservati, ha invece esaminato tutte le possibili ripetizioni.

  7. Gli statistici vogliono anche utilizzare il principio di sufficienza ( SP) in aggiunta al CP. Ma SP e CP insieme implicano il principio di probabilità (LP) (cfr Birnbaum, JASA, 1962), cioè dato CP e SP , si deve ignorare lo spazio campionario e guardare solo alla funzione di verosimiglianza. Quindi, dobbiamo solo guardare i dati forniti e NON lintero spazio campionario (osservare lintero spazio campionario è simile al campionamento ripetuto). Ciò ha portato a concetti come Observed Fisher Information (cfr. Efron e Hinkley, AS, 1978) che misurano le informazioni sui dati da una prospettiva frequentista. La quantità di informazioni nei dati è un concetto bayesiano (e quindi correlato allHPD), invece di CI.

  8. Kiefer ha svolto un lavoro fondamentale sullIC alla fine degli anni 70, ma le sue estensioni non sono diventate popolari. Una buona fonte di riferimento è Berger (“Potrebbe Fisher, Neyman e Jeffreys concordare sulla verifica delle ipotesi”, Stat Sci, 2003).


Riepilogo:

(come sottolineato da Srikant e altri)
I CI non possono essere interpretati come probabilità e non “Non dire nulla sul parametro sconosciuto DATI i dati osservati. Gli IC sono affermazioni su esperimenti ripetuti.

Gli HPD sono intervalli probabilistici basati sulla distribuzione a posteriori del parametro sconosciuto e hanno uninterpretazione basata sulla probabilità basata sui dati forniti.

La proprietà della proprietà frequentista (campionamento ripetuto) è una proprietà desiderabile e HPD (con priori appropriati) e CI le hanno entrambe. Gli HPD condizionano i dati forniti anche nel rispondere alle domande sul parametro sconosciuto

(Obiettivo NON Soggettivo) I bayesiani concordano con gli statistici classici sul fatto che esiste un unico valore VERO del parametro. Tuttavia, differiscono entrambi nel modo in cui fanno inferenza su questo vero parametro.

Gli HPD bayesiani ci danno un buon modo di condizionare i dati, ma se non sono daccordo con il frequentista proprietà di CI non sono molto utili (analogia: una persona che usa HPD (con qualche precedente) senza una buona proprietà frequentista, è destinata ad essere condannata come un falegname che si preoccupa solo del martello e dimentica il cacciavite)

Alla fine, ho visto persone in questo thread (commenti del Dr. Joris: “… le ipotesi coinvolte implicano un diffuso a priori, cioè una completa mancanza di conoscenza del vero parametro.”) parlare di mancanza di conoscenza del vero parametro che equivale alluso di un precedente diffuso. NON so se posso essere daccordo con laffermazione (il Dr. Keith è daccordo con me). Ad esempio, nel caso dei modelli lineari di base, alcune distribuzioni possono essere ottenute utilizzando una priorità uniforme (che alcune persone chiamano diffusa), MA non significa che la distribuzione uniforme può essere considerata come una BASSA INFORMAZIONE PRIMA. In generale, la priorità NON INFORMATIVA (oggettiva) non significa che abbia poche informazioni sul parametro.

Nota: Molti di questi punti sono basati sulle lezioni di uno dei più importanti bayesiani. Sono ancora uno studente e avrei potuto fraintenderlo in qualche modo. Per favore accetta le mie scuse in anticipo.

Commenti

  • ” il frequentista È VINCOLATO a perdere ” Guardando la risposta più votata, ‘ d presumere che ciò dipenda dalla funzione di utilità (ad es. no se è in corso lottimizzazione del rimpianto). Intuitivamente, potrebbe anche dipendere dalla capacità di determinare la funzione precedente …
  • ” il frequentista È VINCOLATO a perdere ” … * a condizione di avere lappropriato precedente * (cosa che, in generale, non è così facile) Esempio perfetto: i dipendenti dal gioco dazzardo sono sicuri al 99% che la loro fortuna cambierà questa volta. Coloro che lo hanno incorporato prima in alla loro analisi decisionale tendono a non andare così bene nel lungo periodo.
  • Non ‘ penso che dovresti abbreviare gli intervalli di confidenza come CI in una risposta sulla distinzione tra intervalli credibili e intervalli di confidenza.

Risposta

Sempre divertente da coinvolgere un po di filosofia. Mi piace abbastanza la risposta di Keith, tuttavia direi che sta assumendo la posizione di “Mr dimentica Bayesia”. La cattiva copertura quando il tipo B e il tipo C possono verificarsi solo se applica la stessa distribuzione di probabilità ad ogni prova e si rifiuta di aggiornare il suo precedente.

Puoi vederlo abbastanza chiaramente, poiché i vasi di tipo A e tipo D fanno “previsioni definite” per così dire (per 0-1 e 2- 3 chip rispettivamente), mentre i barattoli di tipo B e C danno fondamentalmente una distribuzione uniforme dei chip. Quindi, ripetendo lesperimento con un “vero barattolo” fisso (o se abbiamo campionato un altro biscotto), una distribuzione uniforme delle chip fornirà prova per i barattoli di tipo B o C.

E dal punto di vista “pratico”, il tipo B e C richiederebbe un enorme campione per essere in grado di distinguerli. Le divergenze KL tra le due distribuzioni sono $ KL ( B || C) \ circa 0,006 \ circa KL (C || B) $. Questa è una divergenza equivalente a due distribuzioni normali entrambe con varianza $ 1 $ e una differenza di significa $ \ sqrt {2 \ times 0.006} = 0.11 $. Quindi non ci si può aspettare che siamo in grado di discriminare sulla base di un campione (per il caso normale, avremmo bisogno di circa 320 dimensioni del campione per rilevare questa differenza a un livello di significatività del 5%). Quindi possiamo giustamente collassare il tipo B e digitare C insieme, fino a quando non avremo un campione abbastanza grande.

Ora cosa succede a quegli intervalli credibili? In realtà ora abbiamo una copertura del 100% di “B o C”! E gli intervalli frequentisti ? La copertura è invariata poiché tutti gli intervalli contenevano sia B che C o nessuno dei due, quindi è ancora soggetto alle critiche nella risposta di Keith: 59% e 0% per chip 3 e 0 osservati.

Ma siamo pragmatici qui.Se ottimizzi qualcosa rispetto a una funzione, non ci si può aspettare che funzioni bene per una funzione diversa. Tuttavia, sia lintervallo frequentista che quello bayesiano raggiungono in media il livello di credibilità / confidenza desiderato. Abbiamo $ (0+ 99 + 99 + 59 + 99) /5=71.2$ – quindi il frequentista ha una credibilità media adeguata. Abbiamo anche $ (98 + 60 + 66 + 97) /4=80.3$ – il bayesiano ha una copertura media appropriata.

Un altro punto che vorrei sottolineare è che il bayesiano non sta dicendo che “il parametro è casuale” assegnando una distribuzione di probabilità. Per il bayesiano (beh, almeno per me comunque) una distribuzione di probabilità è una descrizione di ciò che si sa su quel parametro. La nozione di “casualità” non esiste realmente nella teoria bayesiana, solo le nozioni di “sapere” e “non sapere”. I “conosciuti” entrano nelle condizioni e gli “sconosciuti” sono per cosa calcoliamo le probabilità, se di interesse, e marginalizziamo se è un fastidio. Quindi un intervallo credibile descrive ciò che si conosce di un parametro fisso, facendo una media su ciò che non si conosce. Quindi, se dovessimo prendere la posizione della persona che ha imballato il barattolo dei biscotti e sapesse che era di tipo A, il loro intervallo di credibilità sarebbe solo [A], indipendentemente dal campione e indipendentemente dal numero di campioni prelevati. E sarebbero accurati al 100%!

Un intervallo di confidenza si basa sulla “casualità” o variazione che esiste nei diversi campioni possibili. In quanto tale, lunica variazione che prendono in considerazione è quella in un campione. Quindi lintervallo di confidenza è invariato per la persona che ha imballato il barattolo di biscotti e nuovo che era di tipo A. Quindi se estraessi il biscotto con 1 chip dal barattolo di tipo A, il frequentista affermerebbe con il 70% di sicurezza che il tipo era non A, anche se sanno che il barattolo è di tipo A! (se hanno mantenuto la loro ideologia e ignorato il loro buon senso). Per vedere che questo è il caso, nota che nulla in questa situazione ha cambiato la distribuzione del campionamento: abbiamo semplicemente preso la prospettiva di una persona diversa con informazioni “non basate sui dati” su un parametro.

Fiducia gli intervalli cambieranno solo quando i dati cambiano o la distribuzione del modello / campionamento cambia. gli intervalli di credibilità possono cambiare se vengono prese in considerazione altre informazioni rilevanti.

Si noti che questo comportamento folle non è certamente ciò che farebbe effettivamente un sostenitore degli intervalli di confidenza; ma dimostra una debolezza nella filosofia alla base del metodo in un caso particolare. Gli intervalli di confidenza funzionano al meglio quando non sai molto su un parametro oltre alle informazioni contenute in un set di dati. Inoltre, gli intervalli di credibilità non saranno in grado di migliorare molto sugli intervalli di confidenza a meno che non ci siano informazioni precedenti che lintervallo di confidenza può “Non prendere in considerazione o trovare statistiche sufficienti e accessorie è difficile.

Commenti

  • Posso ‘ dico di aver capito la spiegazione di Keith ‘ dellesempio jar, una domanda veloce: ripeto lesperimento $ m $ volte, ho raccolto $ m $ campioni diversi, quindi ora ho ‘ abbiamo calcolato $ m $ IC diversi (ciascuno con un livello di confidenza del 95%), ora cosè lIC? Significa che il 95% di $ m $ IC dovrebbe coprire il valore reale?
  • @loganecolss – questo è effettivamente vero, ma solo nel limite da $ m \ a \ infty $. Questo corrisponde alla ” probabilità ” = ” Interpretazione della ” frequenza di lungo periodo alla base degli elementi della configurazione.
  • Sì, nel limite. Quindi, per uno o solo un paio di esempi, gli elementi della configurazione non ‘ significano nulla, giusto? Allora a cosa ‘ si calcola il CI, se ‘ non ho tonnellate di campioni?
  • @loganecolss – questo ‘ è il motivo per cui ‘ sono bayesiano.
  • @nazka – una specie di. Direi che è sempre meglio usare un approccio bayesiano indipendentemente dalla quantità di dati a disposizione. Se questo può essere ben approssimato da una procedura frequentista, allora usala. Bayesiano non è sinonimo di lento.

Risposta

A quanto ho capito: un intervallo credibile è unaffermazione dellintervallo di valori per la statistica di interesse che rimangono plausibili dato il particolare campione di dati che abbiamo effettivamente osservato. Un intervallo di confidenza è una dichiarazione della frequenza con cui il valore vero si trova nellintervallo di confidenza quando lesperimento viene ripetuto un gran numero di volte, ogni volta con un diverso campione di dati dalla stessa popolazione sottostante.

Normalmente la domanda a cui vogliamo rispondere è “quali valori della statistica sono coerenti con i dati osservati”, e lintervallo credibile fornisce una risposta diretta a quella domanda – il vero valore della statistica si trova in un intervallo credibile del 95% con probabilità 95%.Lintervallo di confidenza non fornisce una risposta diretta a questa domanda; non è corretto affermare che la probabilità che il valore reale della statistica si trovi allinterno dellintervallo di confidenza del 95% è del 95% (a meno che non coincida con lintervallo credibile). Tuttavia questa è uninterpretazione errata molto comune di un intervallo di confidenza frequentista poiché è linterpretazione che sarebbe una risposta diretta alla domanda.

Larticolo di Jayne che discuto in unaltra domanda fornisce un buon esempio di questo (esempio # 5), dove viene costruito un intervallo di confidenza perfettamente corretto, dove il particolare campione di dati su cui si basa esclude qualsiasi possibilità che il valore reale della statistica sia nellintervallo di confidenza del 95%! Questo è solo un problema se lintervallo di confidenza viene interpretato erroneamente come una dichiarazione di valori plausibili della statistica sulla base del particolare campione che abbiamo osservato.

Alla fine della giornata, si tratta di “cavalli per corsi “e quale intervallo è migliore dipende dalla domanda a cui vuoi rispondere: scegli semplicemente il metodo che risponde direttamente a quella domanda.

Sospetto che gli intervalli di confidenza siano più utili quando si analizzano esperimenti ripetibili [progettati] (come quello è solo il presupposto sottostante lintervallo di confidenza) e intervalli credibili migliori quando si analizzano i dati osservativi, ma questa è solo unopinione (utilizzo entrambi i tipi di intervalli nel mio lavoro, ma non mi descriverei come esperto in nessuno dei due).

Commenti

  • Il problema con gli intervalli di confidenza in esperimenti ripetuti è che, affinché funzionino, le condizioni dellesperimento ripetibile devono rimanere le stesse (e chi lo crederebbe?), mentre lintervallo bayesiano (se usato correttamente) condiziona i dati osservati, e quindi fornisce tolleranze per i cambiamenti che si verificano nel mondo reale (tramite i dati). Penso che siano le regole di condizionamento delle statistiche bayesiane che rendono così difficile superare le prestazioni (penso che sia impossibile: solo lequivalenza può essere raggiunta), e il meccanismo automatico con cui ottiene ciò che lo fa sembrare così intelligente.

Risposta

Ho trovato che molte interpretazioni sullintervallo di confidenza e sul set credibile sono sbagliate. Ad esempio, lintervallo di confidenza non può essere espresso in questo formato $ P (\ theta \ in CI) $. Se osservi attentamente le “distribuzioni” nellinferenza del frequentista e del bayesiano, vedrai che il frequentista lavora sulla distribuzione campionaria sui dati mentre il bayesiano lavora sulla distribuzione (posteriore) del parametro. Sono definiti su Sample Space e Sigma Algebra completamente diversi.

Quindi sì, puoi dire “Se ripeti lesperimento molte volte, circa il 95% degli elementi della configurazione del 95% coprirà il vero parametro”. Sebbene in bayesiano si possa dire “il vero valore della statistica si trova in un intervallo credibile del 95% con probabilità del 95%”, tuttavia, questa probabilità del 95% (in bayesiano) stessa è solo una stima. (Ricorda che si basa sulla distribuzione delle condizioni dati questi dati specifici, non sulla distribuzione del campionamento). Questo stimatore dovrebbe presentare un errore casuale dovuto al campione casuale.

Bayesiano cerca di evitare il problema di errore di tipo I. Bayesiano dice sempre che non ha senso parlare di errore di tipo I in bayesiano. Questo non è del tutto vero. Gli statistici vogliono sempre misurare la possibilità o lerrore che “i tuoi dati suggeriscono di prendere una decisione ma la popolazione suggerisce il contrario”. Questo è qualcosa che bayesiano non può rispondere (dettagli omessi qui). Sfortunatamente, questa potrebbe essere la cosa più importante a cui dovrebbe rispondere lo statistico. Gli statistici non suggeriscono solo una decisione. Gli statistici dovrebbero anche essere in grado di capire quanto la decisione può andare storta.

Devo inventare la seguente tabella e i termini per spiegare il concetto. Spero che questo possa aiutare a spiegare la differenza tra Confidence Interval e Credible Set.

Si noti che la distribuzione a posteriori è $ P (\ theta_0 | Data_n) $, dove $ \ theta_0 $ è definito dal $ P precedente (\ theta_0) $. In frequentist la distribuzione del campionamento è $ P (Data_n; \ theta) $. La distribuzione campionaria di $ \ hat {\ theta} $ è $ P (\ hat {\ theta} _n; \ theta) $. Il pedice $ n $ è la dimensione del campione. Si prega di non utilizzare la notazione $ P (Data_n | \ theta) $ per presentare la distribuzione del campionamento in frequentist. Puoi parlare di dati casuali in $ P (Data_n; \ theta) $ e $ P (\ hat {\ theta} _n; \ theta) $ ma non puoi parlare di dati casuali in $ P (\ theta_0 | Data_n) $.

Intervallo di confidenza e insieme credibile

Il “???????” spiega perché non siamo in grado di valutare lerrore di tipo I (o qualcosa di simile) in bayesiano.

Si noti inoltre che gli insiemi credibili possono essere utilizzati per approssimare gli intervalli di confidenza in alcune circostanze. Tuttavia questa è solo unapprossimazione matematica. Linterpretazione dovrebbe andare con il frequentista. Linterpretazione bayesiana in questo caso non funziona più.


Thylacoleo “s in $ P (x | \ theta) $ non è frequentista. Questo è ancora bayesiano. Questo la notazione causa un problema fondamentale nella teoria della misura quando si parla di frequentista.

Sono daccordo con la conclusione di Dikran Marsupial . Se sei il Revisore FDA, vuoi sempre sapere la possibilità che tu approvi una domanda di farmaco ma il farmaco in realtà non è efficace. Questa è la risposta che bayesiano non può fornire, almeno nel bayesiano classico / tipico.

Risposta

Confidenza generica e coerente e regioni credibili. http://dx.doi.org/10.6084/m9.figshare.1528163 con codice in http://dx.doi.org/10.6084/m9.figshare.1528187

Fornisce una descrizione di intervalli credibili e affidabilità intervalli per la selezione degli insiemi insieme al codice R generico per calcolare sia data la funzione di verosimiglianza che alcuni dati osservati. un test statistico che fornisce intervalli credibili e di confidenza di dimensioni ottimali coerenti tra loro.

In breve ed evitando formule. L intervallo credibile bayesiano si basa sulla probabilità dei parametri dati dati . Raccoglie i parametri che hanno unalta probabilità nel set / intervallo credibile. Lintervallo di credibilità del 95% contiene parametri che insieme hanno una probabilità di 0,95 dati i dati.

intervallo di confidenza del frequentista si basa sul probabilità dei dati forniti da alcuni parametri . Per ogni parametro (possibilmente infinitamente molti), genera prima linsieme di dati che è probabile che venga osservato dato il parametro. Quindi verifica per ogni parametro se i dati ad alta probabilità selezionati contengono i dati osservati. Se i dati ad alta probabilità contengono i dati osservati, il parametro corrispondente viene aggiunto allintervallo di confidenza. Pertanto, lintervallo di confidenza è la raccolta di parametri per i quali non possiamo escludere la possibilità che il parametro abbia generato i dati. Ciò fornisce una regola tale che, se applicato ripetutamente a problemi simili, lintervallo di confidenza del 95% conterrà il valore del parametro vero nel 95% dei casi.

Insieme credibile al 95% e impostato di confidenza al 95% per un esempio tratto da una distribuzione binomiale negativa 95% di credibilità e 95% di confidenza per una distribuzione binomiale negativa

Commenti

  • La descrizione degli intervalli di confidenza non è corretta. Il ” 95% ” deriva dalla probabilità che un campione della popolazione produca un intervallo che contiene il vero valore del parametro.
  • @jlimahaverford – La descrizione è corretta come la tua. Per creare il collegamento a ciò che descrivi, ho aggiunto ” Questo fornisce una regola tale che, se applicato ripetutamente a problemi simili, lintervallo credibile al 95% conterrà il valore del parametro vero in 95 % dei casi. ”
  • Non stavo parlando della tua descrizione di intervalli credibili, stavo parlando di intervalli di confidenza. Ora ‘ sto notando che a metà del tuo paragrafo sugli intervalli di confidenza inizi a parlare di nuovo di credibile e penso che questo sia un errore. Lidea importante è questa ” Se questo fosse il vero valore del parametro, qual è la probabilità che disegnerei un campione a questo estremo o più. Se la risposta è maggiore del 5%, ‘ è nellintervallo di confidenza. ”
  • @jlimahaverford – aggree e corretto – Grazie.
  • hmm, non lo vedo corretto.

Risposta

Questo è più un commento ma troppo lungo. Nel seguente documento: The Dawning of the Age of Stochasticity (David Mumford) Mumford ha il seguente commento interessante:

Sebbene tutti questi usi davvero entusiasmanti fossero fatti delle statistiche, la maggior parte degli stessi statistici, guidati da Sir RA Fisher, si legavano le mani dietro la schiena, insistendo sul fatto che le statistiche non potevano essere usate in situazioni ma totalmente riproducibili e quindi usando solo i dati empirici. Questa è la cosiddetta scuola “frequentista” che ha combattuto con la scuola bayesiana che credeva che potrebbero essere usati i priori e luso dellinferenza statistica notevolmente esteso Questo approccio nega che linferenza statistica possa avere qualcosa a che fare con il pensiero reale perché le situazioni della vita reale sono sempre sepolte in variabili contestuali e non possono essere ripetute.Fortunatamente, la scuola bayesiana non è morta del tutto, continuata da DeFinetti, E.T. Jaynes, altri aridi.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *