Joris와 Srikant의 교환 여기 가 내 내부 신뢰 구간과 신뢰할 수있는 구간의 차이에 대한 설명이 정확했습니다. 차이점을 어떻게 설명 하시겠습니까?
답변
I Srikant의 설명에 완전히 동의합니다. 좀 더 휴리스틱 한 방법을 사용하려면 :
고전적인 접근 방식은 일반적으로 세계가 일방 통행이라고 가정하고 (예 : 매개 변수에는 하나의 특정 실제 값이 있음) 결과에 관계없이 결론을 내릴 수있는 실험을 시도합니다. 매개 변수의 실제 값은 최소한의 확률로 정확할 것입니다.
결과적으로 실험 후 지식의 불확실성을 표현하기 위해 빈도 주의적 접근 방식은 “신뢰 구간”을 사용합니다. 최소 확률 (예 : 95 %)로 매개 변수의 실제 값을 포함하도록 설계된 값의 범위. 빈도 주의자는 실험 및 95 % 신뢰 구간 절차를 설계하여 100 개의 실험 실행이 시작될 때까지 완료 될 때마다 결과 신뢰 구간 중 최소 95 개에 매개 변수의 실제 값이 포함될 것으로 예상됩니다. 다른 5 개는 약간 틀렸거나 완전히 넌센스 일 수 있습니다. 공식적으로 말하면 100 개의 추론 중 95 개가 옳다면 접근 방식에 관한 한 괜찮습니다. 완전히 넌센스가 아니라 약간 잘못되었습니다.)
베이지안 접근 방식은 문제를 다르게 공식화합니다. 매개 변수가 단순히 하나의 (알 수없는) 참값을 갖는다 고 말하는 대신 베이지안 방법은 매개 변수의 값이 고정되었지만 사전 확률 분포로 알려진 일부 확률 분포에서 선택됩니다. (즉, 측정을 수행하기 전에 베이지안은 매개 변수의 실제 값이 무엇인지에 대해 믿음 상태라고 부르는 확률 분포를 할당합니다.) DMV에서 트럭 크기의 전체 분포를 알고 있다면 트럭의 크기를 추정하거나 허공에서 나온 가정 일 수 있습니다. 베이지안 추론은 더 간단합니다. 일부 데이터를 수집 한 다음 데이터에 제공된 매개 변수 값의 확률을 계산합니다. 이 새로운 확률 분포를 “사후 확률”또는 단순히 “후방”이라고합니다. 베이지안 접근 방식은 확률의 95 %를 포함하는 사후 확률 분포에 값 범위를 제공하여 불확실성을 요약 할 수 있습니다.이를 “95 % 신뢰 구간”이라고합니다.
베이 즈 당파는이를 비판 할 수 있습니다. 빈도주의 신뢰 구간은 다음과 같습니다. “100 개의 실험 중 95 개가 실제 값을 포함하는 신뢰 구간을 산출하면 어떻게됩니까? 99 개의 실험에 대해서는 신경 쓰지 않습니다. 내가하지 않았던이 실험에 관심이 있습니다. 귀하의 규칙 100 개 중 5 개는 다른 95 개가 옳다면 완전한 넌센스 [음수 값, 불가능한 값]가 될 수 있습니다. 그것은 “말도 안되는 일입니다.”
빈도 주의자 열성적인 사람이 베이지안 신뢰 구간을 비판 할 수 있습니다. “그러면 사후 확률의 95 %가이 범위에 포함되면 어떻게 될까요? 만약 진정한 가치가 0.37이라면? 만약 그렇다면, 당신의 방법, 실행 시작부터 끝까지 75 %의 시간이 잘못 될 것입니다. 귀하의 응답은 “오, 그거”입니다. 이전에 따르면 값이 0.37 인 것은 매우 드뭅니다. 그럴 수도 있지만 매개 변수의 가능한 모든 값에 대해 작동하는 메서드를 원합니다. 나는 그것이 가지고 있지 않은 매개 변수의 99 개 값을 신경 쓰지 않는다. 나는 그것이 가진 하나의 진정한 가치에 관심이 있습니다. 아, 그건 그렇고, 당신의 대답은 이전이 맞을 때만 맞습니다. 옳다고 느껴서 허공에서 빼 내면 멀어 질 수 있습니다. “
어떤 의미에서이 두 당파는 서로에 대한 비판에서 옳습니다.”라는 방법을 촉구합니다. Srikant가 설명하는 것처럼 그 차이에 대해 수학적으로 생각할 수 있습니다.
여기에 개별 예에서 차이를 정확하게 보여주는 확장 된 예가 있습니다.
언제 저는 어렸을 때 어머니가 초콜릿 칩 쿠키 한 병을 우편으로 배달해달라고 주문하여 저를 놀라게 하시곤하셨습니다. 배송 회사는 A 형, B 형, C 형, D 형의 4 가지 종류의 쿠키 항아리를 비축했습니다. , 그리고 그들은 모두 같은 트럭에 있었고 당신은 당신이 어떤 유형을 얻을지 확신하지 못했습니다. 각 항아리에는 정확히 100 개의 쿠키가 있었지만 다른 쿠키 항아리를 구별하는 특징은 쿠키 당 초콜릿 칩의 분포입니다. 한 병에 쿠키 하나를 무작위로 골고루 꺼 냈습니다. 칩 수 :
예를 들어 A 형 쿠키 항아리에는 2 개의 쿠키가있는 70 개의 쿠키가 있습니다. 칩이 각각 4 개 이상인 쿠키는 없습니다!D 형 쿠키 항아리에는 각각 칩이 하나씩있는 70 개의 쿠키가 있습니다. 각 수직 열이 어떻게 확률 질량 함수인지 확인하십시오. 즉, jar = A, B, C 또는 D이고 각 열의 합이 100 일 때 얻을 수있는 칩 개수의 조건부 확률입니다.
배달원이 새 쿠키 항아리를 버리 자마자 게임을하는 것을 좋아했습니다. 항아리에서 무작위로 하나의 쿠키를 꺼내고 쿠키의 칩을 세고 불확실성 (70 % 수준에서)이 될 수 있습니다. 따라서 매개 변수의 값인 는 jar (A, B, C 또는 D)의 신원입니다. 칩의 개수 (0, 1, 2, 3 또는 4)는 결과 또는 관찰 또는 샘플입니다. .
원래 나는 빈도 주의자, 70 % 신뢰 구간을 사용하여이 게임을했습니다. 이러한 구간은 문제에 상관없이 매개 변수의 실제 값입니다. 즉, 어떤 쿠키 병을 얻었든지간에 간격은 해당 실제 값을 적어도 70 % 확률로 포함합니다.
물론 간격은 다음과 같습니다. 결과 (행)를 매개 변수 값 집합 (열 집합)과 연결하는 함수입니다. 그러나 신뢰 구간을 구성 하고 70 % 범위를 보장하려면 “수직으로 작업해야합니다. “-각 열을 차례로 살펴보고 확률 질량 함수의 70 %가 시간의 70 %가되도록 해당 열의 ID는 결과 간격의 일부가됩니다. pmf를 형성하는 것은 수직 열이라는 것을 기억하십시오.
이 절차를 수행 한 후 다음 간격으로 끝났습니다.
예를 들어 내가 그리는 쿠키의 칩 수가 1이면 신뢰 구간은 {B, C, D}가됩니다. 숫자가 4이면 신뢰 구간 각 열의 합계가 70 % 이상이므로 실제로 어떤 열에 있든 (배달원이 어떤 항아리를 떨어 뜨 렸든)이 절차의 결과 간격에는 올바른 값이 포함됩니다. 적어도 70 %의 확률로 jar.
구간을 구성 할 때 따랐던 절차에 약간의 재량권이 있다는 점에 유의하십시오. type-B에 대한 열에서 다음과 같은 간격을 쉽게 확인할 수있었습니다. 포함 된 B는 1,2,3,4 대신 0,1,2,3이 될 것입니다. 이는 B 형 병 (12 + 19 + 24 + 20)에 대해 75 % 커버리지를 가져 왔지만 여전히 하한을 충족합니다. 70 %.
누나 Bayesia가이 앱을 하지만 바퀴벌레는 미쳤습니다. “배달원을 시스템의 일부로 고려해야합니다.”라고 그녀는 말했습니다. “항아리의 정체를 임의의 변수 자체로 취급하고, 배달원이 그 중에서 균일하게 선택한다고 가정 해보자 . 즉, 트럭에 4 개를 모두 가지고 있고, 우리 집에 그는 각각 균일 한 확률을 가진 무작위로 하나를 선택합니다. “
“이제 전체 이벤트의 공동 확률을 살펴 보겠습니다. 즉 jar 유형 및 첫 번째 쿠키에서 가져온 칩 수”라고 그녀는 다음 표를 그리며 말했습니다.
전체 테이블이 이제 확률 질량 함수입니다. 즉, 전체 테이블의 합계가 100 %입니다.
” 좋아, “내가 말했다.”이걸 가지고 어디로 가고 있니? “
“당신은 단지 주어진 칩 수의 조건부 확률을 조사해 왔습니다. “Bayesia가 말했다. “그게 다 틀렸어! 당신이 정말로 신경 쓰는 것은 쿠키에있는 칩의 수를 고려할 때 그것이 어느 병인지 조건부 확률입니다! 70 % 간격에는 전체 병이 실제 병이 될 확률이 70 % 인 병 목록 만 포함되어야합니다. “훨씬 더 간단하고 직관적이지 않습니까?”
“그렇지만 어떻게 계산할까요?” 내가 물었다.
“칩 3 개를 얻었다는 것을 알고 “하자 “고 가정 해 보겠습니다. 그런 다음 테이블의 다른 모든 행을 무시하고 해당 행을 확률 질량 함수로 처리 할 수 있습니다. 그러나 각 행의 합이 100이되도록 확률을 비례 적으로 확장해야합니다. ” 그녀는 다음과 같이했습니다.
“각 행이 이제 어떻게 pmf이고 합계가 100 %인지 주목하세요. “처음부터 조건부 확률을 뒤집 었습니다. 이제 첫 번째 쿠키의 칩 수를 고려할 때 남자가 특정 항아리를 떨어 뜨릴 확률입니다.”
“흥미 롭습니다. ” 나는 말했다. “이제 우리는 70 %의 확률을 얻기 위해 각 행에있는 충분한 병에 동그라미를 치세요?” 우리는 다음과 같은 신뢰 구간을 만들었습니다.
각 구간에는 다음과 같은 항아리 세트가 포함됩니다. em> 사후 , 진정한 병이 될 확률의 합계는 70 %입니다.
“잠깐만 요.”라고 나는 말했다. “나는”확신하지 못합니다.두 종류의 간격을 나란히 놓고 적용 범위를 비교하고 배달원이 동일한 확률과 신뢰성으로 각 종류의 병을 선택한다고 가정합니다. “
다음은 다음과 같습니다.
p>
신뢰 구간 :
신뢰성 간격 :
“신뢰 구간이 얼마나 미친 지 보십니까?” Bayesia가 말했다. 칩이없는 쿠키를 그릴 때 “당신”은 현명한 대답조차 없습니다! 당신은 단지 “빈 간격”이라고 말할뿐입니다. 그러나 그것은 분명히 잘못된 것입니다. 네 가지 유형의 항아리 중 하나 여야합니다. 간격이 잘못되었다는 것을 알 때 하루가 끝날 때 간격을 지정하면서 어떻게 혼자 살 수 있습니까? 그리고 마찬가지로 3 개의 칩이있는 쿠키를 가져올 때-간격은 41 % 만 정확합니다. 이것을 “70 %”신뢰 구간이라고 부르는 것은 엉터리입니다. “
“글쎄, 헤이, “나는 대답했다.”배달원이 어떤 항아리를 떨어 뜨 렸는지에 관계없이 70 %의 시간이 정확합니다. “신뢰성 구간에 대해 말할 수있는 것보다 훨씬 더 많습니다. 병이 B 형이면 어떻게 되나요? 그러면 당신의 인터벌은 80 %의 시간이 틀릴 것이고 20 %의 시간 만이 정정 될 것입니다! “
“이것은 큰 문제인 것 같습니다. 왜냐하면 당신의 실수는 항아리의 종류. 당신이 가지고있는 항아리의 종류를 평가하기 위해 100 대의 “Bayesian”로봇을 보내면, 각 로봇은 하나의 쿠키를 샘플링합니다. 당신은 “B 형 날에 80 대의 로봇이 각각 틀린 답을 얻을 것으로 예상 할 것입니다.” 잘못된 결론에 대해 73 % 이상의 믿음을 가지고 있습니다. 특히 대부분의 로봇이 정답에 동의하기를 원하는 경우에는 문제가됩니다. “
“또한 우리는 배달원이 행동한다는 가정을해야했습니다. 균일하게 각 병의 종류를 무작위로 선택합니다. “”어디에서 왔습니까? 그게 틀렸다면 어떻게하나요? 당신은 그를 인터뷰하지 않았습니다. 그러나 사후 확률에 대한 당신의 모든 진술은 그의 행동에 대한이 진술에 달려 있습니다. 나는 그러한 가정을 할 필요가 없었고, 나의 간격은 심지어 그 기준을 충족합니다. 최악의 경우. “
“신뢰성 구간이 B 형 병에서 저조한 성능을 발휘하는 것은 사실입니다. “라고 Bayesia는 말했습니다. “하지만 어떻게? B 형 병은 25 % 만 발생합니다. A 형, C 형, D 형 병에 대한 좋은 커버리지로 균형을 이룹니다. 그리고 난 넌센스를 게시하지 않습니다. “
“칩이 0 인 쿠키를 그렸을 때 내 신뢰 구간이 제대로 작동하지 않는다는 것은 사실입니다. 칩리스 쿠키는 최악의 경우 (D 형 항아리) 최대 27 %의 시간 동안 발생합니다. 병이 없으면 30 % 이상 오답이 나오기 때문에이 결과에 대해 넌센스를 줄 수 있습니다. “
“열 합계가 중요합니다. “라고 저는 말했습니다.
“행 합계는 중요합니다.”라고 Bayesia는 말했습니다.
“우리가 곤경에 처한 것을 볼 수 있습니다.”라고 나는 말했습니다. “우리 둘 다 우리가 만들고있는 수학적 진술에서 정확하지만 불확실성을 정량화하는 적절한 방법에 대해서는 동의하지 않습니다.”
“그것이 사실입니다.”제 여동생이 말했습니다. “쿠키를 드릴까요? “
댓글
답변
내 이해는 다음과 같습니다.
배경
$ x $ 데이터가 있고 $ \ theta $를 추정하려고한다고 가정합니다. $ \ theta $에서 $ x $가 조건부로 생성되는 방법을 설명하는 데이터 생성 프로세스가 있습니다. 즉, $ x $의 분포를 알고 있습니다 (예 : $ f (x | \ theta) $.
추론 문제
추론 문제는 다음과 같습니다. 관찰 된 데이터 $ x $에서 $ \ theta $의 어떤 값이 합리적입니까?
신뢰 구간
신뢰 구간은 위의 문제에 대한 고전적인 대답입니다.이 접근 방식에서는 참이라고 가정합니다. , $ \ theta $의 고정 값.이 가정에서 $ \ theta $의 추정치를 얻기 위해 $ x $ 데이터를 사용합니다 (예 : $ \ hat {\ theta} $). 추정치와 관련하여 실제 값이 어디에 있는지 평가할 수 있습니다.
이 접근 방식에서 실제 값은 랜덤 변수가 아닙니다 . 고정 된 것이지만 알 수없는 수량입니다. 반대로 추정치는 데이터 생성 프로세스에서 생성 된 $ x $ 데이터에 따라 달라 지므로 임의의 변수 입니다 . 따라서 연구를 반복 할 때마다 추정치입니다.
위의 이해는 다음과 같은 방법을 통해 실제 매개 변수가 추정치와 관련하여 어디에 있는지 평가합니다. 다음 속성을 사용하여 $ I \ equiv [lb (x), ub (x)] $ 간격을 정의합니다.
$ P (\ theta \ in I) = 0.95 $
위와 같이 구성된 구간을 신뢰 구간이라고합니다. 참 값은 알 수 없지만 고정되어 있으므로 참 값은 간격 내에 있거나 간격을 벗어납니다. 신뢰 구간은 우리가 얻은 구간이 실제로 실제 모수 값을 가질 가능성에 대한 진술입니다. 따라서 확률 진술은 실제 매개 변수 값의 위치가 아니라 간격 (즉, 해당 간격이 실제 값을 가질 수있는 가능성)에 관한 것입니다.
이 패러다임에서 실제 값이 임의의 변수가 아닌 실제 값이 일부 값보다 작거나 클 확률에 대해 설명합니다.
신뢰할 수있는 간격
전통적인 접근 방식과 달리 베이지안 접근 방식에서는 실제 값이 임의의 변수라고 가정합니다. 따라서 실제 매개 변수 벡터에 사전 분포를 적용하여 실제 매개 변수 값에 대한 불확실성을 포착합니다 (예 : $ f (\ theta) $).
베이 정리를 사용하여 사후 분포를 구성합니다. 이전과 데이터를 혼합하여 매개 변수 벡터를 위해 (간단히 사후는 $ f (\ theta |-) \ propto f (\ theta) f (x | \ theta) $)
그런 다음 사후 분포를 사용하여 점 추정치에 도달합니다 (예 : 사후 분포의 평균 사용). 그러나이 패러다임에서 실제 매개 변수 벡터는 랜덤 변수이므로 점 추정에서 불확실성의 정도를 알고 싶습니다. 따라서 다음과 같은 간격을 구성합니다.
$ P (l (\ theta) \ le {\ theta} \ le ub (\ theta)) = 0.95 $
위는 신뢰할 수있는 간격입니다.
요약
신뢰할 수있는 간격은 현재 위치에서 불확실성을 포착합니다. 따라서 매개 변수에 대한 확률 적 설명으로 해석 될 수 있습니다.
반대로, 신뢰 구간은 우리가 얻은 구간에 대한 불확실성을 포착합니다 (즉, 실제 값을 포함하는지 여부). 따라서 실제 매개 변수 값에 대한 확률 적 설명으로 해석 될 수 없습니다.
설명
- 정의에 따른 95 % 신뢰 구간은 실제 매개 변수를 포함합니다. 올바르게 표시 한대로 95 %의 경우 값. 따라서 구간이 실제 매개 변수 값을 포함 할 확률은 95 %입니다. 구간을 구성 할 때 내린 가정 (대부분 추정치의 정규 분포)에 따라 모수가 경계보다 크거나 작을 가능성에 대해 말할 수 있습니다. P (theta > ub) 또는 P (ub < theta)를 계산할 수 있습니다. 진술은 실제로 경계에 관한 것이지만 당신은 그것을 만들 수 있습니다.
- Joris, 나는 동의 할 수 없다 ‘. 예, 매개 변수의 모든 값에 대해 결과 간격이 실제 값을 포함 할 확률은 > 95 %입니다.그렇다고해서 ‘ 특정 관찰을 수행하고 간격을 계산 한 후에도 해당 간격이 실제 값을 포함한다는 데이터를 고려할 때 조건부 확률이 95 %라는 의미는 아닙니다. 아래에서 말했듯이, 공식적으로 신뢰 구간이 95 %의 시간을 [0, 1] 뱉어 내고 나머지는 5 %를 뱉어내는 것이 완벽하게 허용됩니다. 간격으로 빈 세트를 얻은 경우에는 ‘ 실제 값이 95 % 범위 내에 있습니다!
- Joris, 저는
데이터 ” (” 샘플, ” 동의한다고 생각합니다. 내 요점은 ‘ 샘플을 채취 한 후 간격이 잘못되었음을 절대적으로 확실하게 증명할 수있는 상황에있을 수 있다는 것입니다. 진정한 가치. 이것이 유효한 95 % 신뢰 구간이 아님을 의미하지는 않습니다. 따라서 ‘ 신뢰도 매개 변수 (95 %)가 이후 특정 구간의 적용 확률에 대해 알려주지 않는다고 말할 수 없습니다. ‘ 실험을 수행하고 간격을 얻었습니다. 사전에 의해 정보를 얻은 사후 확률 만이 그것에 대해 말할 수 있습니다.
- Jaynes 논문 중 하나에서 bayes.wustl.edu/etj/articles/ trust.pdf 그는 신뢰 구간을 구성한 다음 특정 샘플에 대해 실제 값이 ” 신뢰 구간 “. 이는 ‘ CI가 ” 잘못된 “임을 의미하지는 않습니다. 빈도주의 신뢰 구간은 질문에 대한 답이 아닙니다. ” 확률이 95 % 인 통계의 실제 값을 포함하는 구간은 무엇입니까 “. 슬프게도 그것이 우리가 묻고 싶은 질문입니다. 그래서 CI가 종종 그 질문에 대한 대답 인 것처럼 해석되는 이유입니다. 🙁
- @svadalli-베이지안 접근 방식은 $ \ theta $ 무작위 라는 관점을 취하지 않습니다. 배포되는 것은 $ \ theta $가 아닙니다 ($ \ theta $는 고정되어 있지만 알려지지 않음) $ \ theta $에 대한 지식 상태에 따라 배포되는 $ \ theta $ 에 대한 불확실성 입니다. 실제 확률 진술 $ f (\ theta) $가 캡처하는 것은 $ Pr (\ theta \ text {is in the interval} (\ theta, \ theta + d \ theta) | I) = f (\ theta) d \ theta $. 사실, $ X $에도 똑같은 인수가 적용되지만 고정 된 것으로 간주 될 수 있지만 알 수 없습니다.
답변
저는 한 가지 근본적인 점에 대한 Srikant의 답변에 동의하지 않습니다. Srikant는 다음과 같이 말했습니다.
“추론 문제 : 추론 문제 : 관측 된 데이터 x를 고려할 때 θ의 어떤 값이 합리적입니까?”
p>
사실 이것은 BAYESIAN 추론 문제입니다. 베이지안 통계에서 우리는 P (θ | x) 즉, 관측 된 데이터 (샘플)가 주어진 매개 변수 값의 확률을 계산하려고합니다. The CREDIBLE INTERVAL 문제의 기초가되는 몇 가지 가정을 감안할 때 θ의 실제 값을 포함 할 가능성이 95 % 인 θ 간격입니다.
FREQUENTIST 추론 문제는 다음과 같습니다.
가설 된 θ 값을 고려할 때 관측 된 데이터 x가 합리적입니까?
빈도주의 통계에서 우리는 P (x | θ), 즉 가정 된 매개 변수 값이 주어진 데이터 (샘플)를 관찰 할 확률을 계산하려고합니다. 신뢰 구간 (아마도 잘못된 명칭)은 다음과 같이 해석됩니다. 무작위 샘플 x를 생성 한 실험이 여러 번 반복 된 경우, 해당 랜덤 샘플에서 구성된 그러한 구간의 95 % (또는 기타)는 매개 변수의 실제 값을 포함합니다.
머리가 어지럽습니까? 이것이 빈도주의 통계의 문제이며 베이지안 통계가이 문제를 해결하는 주요 원인입니다.
Sikrant가 지적했듯이 P (θ | x)와 P (x | θ)는 다음과 같이 관련됩니다.
P (θ | x) = P (θ) P (x | θ)
여기서 P (θ)는 우리의 사전 확률이고, P (x | θ)는 그 사전과 P (θ | x)를 조건으로하는 데이터는 사후 확률입니다. 사전 P (θ)는 본질적으로 주관적이지만 그것은 매우 심오한 의미에서 우주에 대한 지식의 대가입니다.
Sikrant와 Keith의 답변 중 다른 부분은 훌륭합니다.
댓글
- 기술적으로는 정확하지만 신뢰 구간은 귀무 가설이 참인 매개 변수 값 세트를 제공합니다. 따라서 ” 세타에 대한 가설을 고려할 때 관측 된 데이터 x 합리적입니까? “는 ” 관측치가 주어진 경우 호환 가능한 가설이 될 세타의 실제 값으로 다시 표현할 수 있습니다. ed data x? ” 다시 표현 된 질문이 반드시 theta가 무작위 변수로 간주된다는 것을 의미하지는 않습니다.다시 표현 된 질문은 가정 된 값이 신뢰 구간에 속하는지 검사하여 귀무 가설 테스트를 수행한다는 사실을 활용합니다.
- @svadali-신뢰 구간은 고정 된 데이터 를 평가합니다. 가설. 따라서 방정식의 ” 고정 된 ” 부분을 변경할 때 가설을 관찰하기 전에 가설의 확률을 고려하지 않으면 데이터의 경우 불일치 및 일관성없는 결과가 나올 수 있습니다. 조건을 변경할 때 조건부 확률이 ” 제한되지 않습니다 ” (예 : 조건을 변경하여 조건부 확률을 0에서 1로 변경할 수 있음) . 사전 확률은 이러한 임의성을 고려합니다. X에 대한 컨디셔닝은 X가 발생했음을 확신하기 때문에 수행됩니다. X를 관찰했습니다!
답변
이전에 제공된 답변은 매우 유용하고 자세합니다. 여기 내 $ 0.25가 있습니다.
신뢰 구간 (CI)은 확률이 비율과 같고 Kolmogrov의 공리 시스템을 기반으로하는 확률의 고전적 정의 ( “빈 차주의 정의”라고도 함)에 기반한 개념입니다. (다른 사람).
신뢰할 수있는 간격 (Highest Posterior Density, HPD)은 Wald와 de Finetti의 작업을 기반으로 한 결정 이론에 뿌리를두고있는 것으로 간주 될 수 있습니다 (다른 사람들에 의해 많이 확장 됨).
이 스레드의 사람들이 베이지안과 빈도주의 사례에서 예시와 가설의 차이를 잘 보여 주었으므로 몇 가지 중요한 점만 강조하겠습니다.
-
CI는 HPD가 관찰 된 데이터 (및 우리의 이전 가정)를 전적으로 기반으로하는 관찰 된 데이터뿐만 아니라 볼 수있는 실험의 가능한 모든 반복에 대해 추론이 이루어져야한다는 사실을 기반으로합니다.
-
일반적으로 CI는 HPD가 일관성이있는 (결정 이론에 뿌리를두고 있기 때문에) 일관성이 없습니다 (나중에 설명 됨). 일관성 (할머니에게 설명 하겠지만)은 매개 변수 값에 대한 베팅 문제가 주어 졌을 때 고전적인 통계 학자 (빈도 주의자)가 CI에 베팅하고 베이지 안에서 HPD에 베팅하면 빈도 주의자는 잃을 것입니다 (사소한 경우 제외). HPD = CI 일 때). 간단히 말해, 실험 결과를 데이터를 기반으로 한 확률로 요약하려는 경우 확률이 사후 확률 (이전 기반) 일 수 있습니다. (대략) 다음과 같은 정리 (Heath and Sudderth, Annals of Statistics, 1978)가 있습니다. 데이터를 기반으로 한 확률을 $ \ theta $ 에 할당하면 베이지안 방식으로 얻은 경우에만 확실한 패배자입니다.
-
CI가 관찰 된 데이터에 조건을 지정하지 않기 때문에 ( “조건부 원칙”CP라고도 함) 피셔는 CP의 큰 지지자였으며 이것이 따르지 않았을 때 많은 역설적 인 예를 발견했습니다 (CI의 경우처럼). 이것이 그가 추론에 p- 값을 사용한 이유입니다. CI. 그의 관점에서 p- 값은 관찰 된 데이터를 기반으로합니다 (p- 값에 대해 많이 말할 수 있지만 여기서는 초점이 아닙니다). 매우 유명한 역설적 예 중 두 가지는 다음과 같습니다. (4 및 5)
-
Cox의 예 (Annals of Math. Stat., 1958) : $ X_i \ sim \ mathcal {N} (\ mu, \ sigma ^ 2) $ (iid) for $ i \ in \ {1, \ dots, n \} $ 메이트 $ \ mu $ . $ n $ 은 (는) 고정되지 않으며 동전을 던져 선택합니다. 동전 던지기 결과 H가 나오면 2가 선택되고 그렇지 않으면 1000이 선택됩니다. “상식”추정값-표본 평균은 분산이 $ 0.5 \ sigma ^ 2 + 0.0005 \ sigma ^ 2 $ 인 편향되지 않은 추정값입니다. $ n = 1000 $ 일 때 표본의 분산으로 사용하는 것은 무엇입니까? 표본 평균 추정량의 분산을 추정 자의 실제 분산 대신 $ 0.001 \ sigma ^ 2 $ (조건부 분산)로 사용하는 것이 더 낫지 않습니까 (또는 합리적입니까). , 이는 굉장합니다 !! ( $ 0.5 \ sigma ^ 2 + 0.0005 \ sigma ^ 2 $ ). 이것은 분산을 $ 0.001 \ sigma ^ 2 $ ( $ n = 1000 $ ). $ n $ 독립형은 $ \ mu $ 및 $ \ sigma $ 에 대해 중요하지 않거나 정보가 없습니다. span> (예 : $ n $ 은 (는) 부수적입니다)하지만 그 가치를 감안할 때 “데이터 품질”에 대해 많이 알고 있습니다. 이는 CI와 직접 관련이 있습니다. $ n $ 에서 조건화되어서는 안되는 분산을 포함합니다. 즉, 더 큰 분산을 사용하므로 지나치게 보수적입니다.
-
Welch의 예 :이 예는 모든 $ n $ 에서 작동하지만 $ n = 2 $ . $ X_1, X_2 \ sim \ mathcal {U} (\ theta-1/2, \ theta + 1/2) $ (iid), $ \ theta $ 는 Real 라인에 속합니다. 이는 $를 의미합니다. X_1-\ theta \ sim \ mathcal {U} (-1/2, 1/2) $ (iid). $ \ frac {1} {2} ( X_1 + X_2) {\ bar x}-\ theta $ (통계가 아님)는 $ \ theta $ 와 독립적 인 분포를 갖습니다. $ c > 0 $ st $ \ text {Prob}를 선택할 수 있습니다. _ \ theta (-c < = {\ bar x}-\ theta < = c) = 1- \ alpha (\ approx 99 \ %) $ , $ ({\ bar x}-c, {\ bar x} + c) $ 는 99 % CI $ \ theta $ . 이 CI의 해석은 다음과 같습니다. 반복적으로 샘플링하면 다른 $ {\ bar x} $ 및 99 % (적어도) true를 포함 할 것입니다. span class = “math-container”> $ \ theta $ ,하지만 GIVEN 데이터의 경우 (방에있는 코끼리) CI가 진정한 $ \ theta $ . 이제 다음 데이터를 고려하십시오. $ X_1 = 0 $ 및 $ X_2 = 1 $ , $ | X_1-X_2 | = 1 $ 로, 우리는 간격이 $ (X_1, X_2) $ 에 $ \ theta $ 포함 (비평 1 개, $ \ text { Prob} (| X_1-X_2 | = 1) = 0 $ ,하지만 수학적으로 처리 할 수 있으므로 논의하지 않겠습니다). 이 예제는 또한 일관성의 개념을 아름답게 보여줍니다. 고전적인 통계 학자라면 $ | X_1-X_2 | $ 의 가치를 보지 않고 99 % CI에 확실히 베팅 할 것입니다. 직업). 그러나 베이지안은 $ | X_1-X_2 | $ 의 값이 1에 가까운 경우에만 CI에 베팅합니다. $ | X_1-X_2 | $ , 간격은 일관되고 플레이어는 더 이상 확실한 패자가되지 않습니다 (Heath and Sudderth의 정리와 유사).
-
Fisher는 이러한 문제에 대해 CP를 사용하도록 권장했습니다. Welch의 예에서 Fisher는 $ X_2-X_1 $ 조건을 제안했습니다. 보시다시피 $ X_2-X_1 $ 은 (는) $ \ theta $ 의 보조 요소이지만 세타. $ X_2-X_1 $ 이 (가) 작 으면 $ \ theta $ 에 대한 정보가 많지 않습니다. 자료. $ X_2-X_1 $ 이 LARGE이면 $ \ theta $ 에 대한 많은 정보가 데이터. Fisher는 보조 통계에 대한 조건화 전략을 Fiducial Inference (그의 가장 큰 실패라고도 함, cf Zabell, Stat. Sci. 1992라고도 함)라고하는 일반 이론으로 확장했지만 다음으로 인해 인기를 얻지 못했습니다. 일반 성과 유연성의 부족 Fisher는 고전적 통계 (Neyman School)와 베이지안 학교 (따라서 Savage의 유명한 격언)와는 다른 방법을 찾으려고 노력했습니다. “Fisher는 다음과 같이 베이지안 오믈렛을 만들고 싶었습니다 (즉, CP 사용). 베이지안 알 깨기 “) 민속학 (증거 없음)은 다음과 같이 말합니다. 피셔는 토론에서 Neyman을 m이 아닌 품질 관리 담당자 라고 부름으로써 Neyman (Type I 및 Type II 오류 및 CI)을 공격했습니다. > 과학자 는 Neyman의 방법이 관찰 된 데이터를 조건으로하지 않았기 때문에 가능한 모든 반복을 조사했습니다.
-
통계학 자도 충분 원리 ( 그러나 SP와 CP는 함께 가능성 원칙 (LP)을 의미합니다 (cf Birnbaum, JASA, 1962), 즉 주어진 CP 및 SP , 하나는 샘플 공간을 무시하고 우도 함수 만 봐야합니다. 따라서 전체 샘플 공간을 보는 것이 아니라 주어진 데이터 만 볼 필요가 있습니다 (전체 샘플 공간을 보는 것은 반복 샘플링과 유사한 방식입니다). 이것은 빈도주의 관점에서 데이터에 대한 정보를 측정하는 Observed Fisher Information (cf. Efron and Hinkley, AS, 1978)과 같은 개념으로 이어졌습니다. 데이터의 정보 양은 CI가 아니라 베이지안 개념 (따라서 HPD와 관련됨)입니다.
-
Kiefer는 1970 년대 후반에 CI에 대한 몇 가지 기초 작업을 수행했지만 그의 확장은 인기를 얻지 못했습니다. 참고 자료의 좋은 출처는 Berger입니다 ( “Could Fisher, Neyman 및 Jeffreys가 가설 테스트에 동의 할 수 있음”, Stat Sci, 2003).
요약 :
(Srikant 및 다른 사람들이 지적한 바와 같이)
CI는 확률로 해석 될 수 없으며 그렇지 않습니다. “관측 된 데이터에 대해 알려지지 않은 매개 변수에 대해 아무 것도 말하지 마십시오. CI는 반복 된 실험에 대한 설명입니다.
HPD는 알 수없는 매개 변수의 사후 분포를 기반으로하는 확률 적 구간이며 주어진 데이터를 기반으로 한 확률 기반 해석입니다.
Frequentist 속성 (반복 샘플링) 속성은 바람직한 속성이며 HPD (적절한 사전 설정 포함) 및 CI 둘 다에 속성이 있습니다. 알 수없는 매개 변수에 대한 질문에 답할 때도 주어진 데이터에 대한 HPD 조건
(Objective NOT 주관적) 베이지안은 매개 변수의 단일 TRUE 값이 있다는 고전적 통계 학자에 동의합니다. 그러나 둘 다이 실제 매개 변수에 대해 추론하는 방식이 다릅니다.
Bayesian HPD는 데이터에 대한 좋은 조건 지정 방법을 제공하지만 빈도 주의자들과 동의하지 않는 경우 CI의 속성은 그다지 유용하지 않습니다 (유 추론 : 좋은 빈도주의 속성없이 HPD를 사용하는 사람 (일부 사전 사용)은 망치 만 신경 쓰고 스크류 드라이버를 잊어 버리는 목수처럼 운명을 맞을 수밖에 없습니다)
드디어이 스레드에서 사람들이 이야기하는 것을 보았습니다 (Dr. Joris의 의견 : “… 관련된 가정은 분산 된 사전, 즉 실제 매개 변수에 대한 지식이 완전히 부족함을 의미합니다.”). 실제 매개 변수에 대한 지식 부족은 확산 사전을 사용하는 것과 동일합니다. 나는 그 진술에 동의 할 수 있을지 모르겠습니다 (Keith 박사가 저의 의견에 동의합니다). 예를 들어, 기본 선형 모델의 경우 균일 사전 (일부 사람들이 확산이라고 함)을 사용하여 일부 분포를 얻을 수 있지만 그것은 균일 한 분포가 이전에 낮은 정보로 간주 될 수 있다는 것을 의미하지 않습니다. 일반적으로 NON-INFORMATIVE (Objective) prior는 매개 변수에 대한 정보가 적다는 것을 의미하지 않습니다.
참고 : 이러한 많은 사항은 저명한 베이지안 중 한 사람의 강의에 대한 내용입니다. 저는 아직 학생이고 어떤 식 으로든 그를 오해 할 수도 있습니다. 미리 사과드립니다.
댓글
- ” 빈도 주의자는 잃을 수밖에 없습니다. ” 가장 많이 득표 한 답변을 보면 저는 ‘ d 이것이 유틸리티 함수에 의존한다고 가정합니다 (예 : 최적화가 후회하는 경우가 아님). 직관적으로, 이전 함수를 결정하는 능력에 따라 달라질 수 있습니다 …
- ” 빈도 주의자는 잃을 수밖에 없습니다. ” … * 적절한 사전을 갖는 조건 * (일반적으로 쉽지 않음) . 완벽한 예 : 도박 중독자들은 이번에는 운이 바뀔 것이라고 99 % 확신합니다. 장기적으로는 의사 결정 분석이 그렇게 잘되지 않는 경향이 있습니다.
- ‘ 신뢰 구간을 CI 로 줄여야한다고 생각하지 않습니다. i> 신뢰할 수있는 구간과 신뢰 구간의 차이에 대한 답변
답변
항상 재미있게 참여 약간의 철학에서. 나는 Keith의 반응을 아주 좋아하지만 그가 “Mr Forgetful Bayesia”의 입장을 취하고 있다고 말하고 싶습니다. B 형과 C 형의 나쁜 커버리지는 그가 매번 같은 확률 분포를 적용해야만 발생할 수 있습니다. 재판을 받고 자신의 이전 업데이트를 거부합니다.
A 형과 D 형 병이 말하자면 “확실한 예측”을하기 때문입니다 (0-1 및 2-의 경우). B 형과 C 형 병은 기본적으로 균일 한 칩 분포를 제공하는 반면, 고정 된 “진정한 병”(또는 다른 비스킷을 샘플링 한 경우)을 사용하여 실험을 반복하면 칩의 균일 한 분포가 증거를 제공합니다. 유형 B 또는 C 항아리의 경우.
그리고 “실용적인”관점에서 볼 때 유형 B와 C는 이들을 구별 할 수있는 엄청난 샘플이 필요합니다. 두 분포 사이의 KL 차이는 $ KL ( B || C) \ approx 0.006 \ approx KL (C || B) $. 이것은 분산이 $ 1 $이고 다음과 같은 차이가있는 두 개의 정규 분포에 해당하는 발산입니다. $ \ sqrt {2 \ times 0.006} = 0.11 $의 평균입니다. 따라서 우리는 하나의 샘플을 기준으로 식별 할 수있을 것으로 예상 할 수 없습니다 (일반적인 경우 5 % 유의 수준에서이 차이를 감지하려면 약 320 개의 샘플 크기가 필요합니다). 따라서 B 형을 합리적으로 축소 할 수 있습니다. 충분히 큰 샘플을 얻을 때까지 C를 함께 입력합니다.
이제 신뢰할 수있는 구간은 어떻게 되나요? 이제 실제로 “B 또는 C”를 100 % 커버합니다! 빈도주의 구간은 어떻습니까? ? 모든 구간에 B와 C가 모두 포함되어 있거나 포함되어 있지 않기 때문에 적용 범위는 변경되지 않으므로 Keith의 응답에서 여전히 비판의 대상이됩니다. 3 개 및 0 개 칩에 대해 59 % 및 0 %가 관찰되었습니다.
그러나 여기서 실용적이자.한 기능과 관련하여 무언가를 최적화하면 다른 기능에 대해 잘 작동 할 것으로 기대할 수 없습니다. 그러나 빈도주의 및 베이지안 간격 모두 평균적으로 원하는 신뢰도 / 신뢰 수준을 달성합니다. $ (0+ 99 + 99 + 59 + 99) /5=71.2$-따라서 빈도 주의자는 적절한 평균 신뢰도를 가지고 있습니다. 또한 $ (98 + 60 + 66 + 97) /4=80.3$도 있습니다-베이지안은 적절한 평균 범위를가집니다.
내가 강조하고 싶은 또 다른 점은 베이지안이 확률 분포를 할당함으로써 “매개 변수가 임의적”이라고 말하는 것이 아니라는 것입니다. 베이지안의 경우 (적어도 저에게는 어쨌든) 확률 분포가 설명입니다. “무작위성”의 개념은 베이지안 이론에 실제로 존재하지 않으며 “알고”와 “알지 못함”의 개념 만 존재합니다. “알려진 것”은 조건에 들어가고 “알려지지 않은 것”은 다음과 같습니다. 관심있는 경우 확률을 계산하고 성가신 경우 주 변화합니다. 따라서 신뢰할 수있는 간격은 고정 된 매개 변수에 대해 알려진 것, 그것에 대해 알려지지 않은 것에 대한 평균. 따라서 우리가 쿠키 항아리를 포장 한 사람의 입장을 취하고 그것이 A 형이라는 것을 알고 있다면, 그들의 신뢰도 간격은 샘플에 관계없이 단지 [A]가 될 것입니다. 그리고 100 % 정확합니다!
신뢰 구간은 가능한 다른 샘플에 존재하는 “무작위성”또는 변동을 기반으로합니다. 따라서 그들이 고려하는 유일한 변이는 표본의 변이입니다. 따라서 쿠키 항아리를 포장 한 사람과 새 것이 A 형인 사람에 대한 신뢰 구간은 변경되지 않습니다. 따라서 A 형 항아리에서 칩 1 개가 들어있는 비스킷을 꺼냈다면 빈도 주의자는 해당 유형이 A가 아니라 단지가 A 형이라는 것을 알지만! (이념을 유지하고 상식을 무시한 경우). 이것이 사실인지 확인하기 위해이 상황에서 샘플링 분포를 변경 한 것은 없습니다. 매개 변수에 대한 “비 데이터”기반 정보로 다른 사람의 관점을 취했습니다.
신뢰성 간격은 데이터가 변경되거나 모델 / 샘플링 분포가 변경 될 때만 변경됩니다. 다른 관련 정보를 고려하면 신뢰 구간이 바뀔 수 있습니다.
이 미친 행동은 확실히 신뢰 구간 지지자가 실제로하는 일이 아닙니다. 그러나 그것은 특정한 경우에 방법의 기초가되는 철학의 약점을 보여줍니다. 신뢰 구간은 데이터 세트에 포함 된 정보 이외의 매개 변수에 대해 많이 알지 못할 때 가장 잘 작동합니다. 또한 신뢰 구간이 할 수있는 사전 정보가 없으면 신뢰 구간에서 신뢰 구간을 많이 향상시킬 수 없습니다. “고려하지 않으면 충분하고 보조적인 통계를 찾기가 어렵습니다.
댓글
- 할 수 있습니다 ‘ Keith ‘의 jar 예제에 대한 설명을 이해했다고 말하지 않습니다. 간단한 질문입니다. 실험을 $ m $ 번 반복하고 $ m $의 다른 샘플을 수집 했으므로 이제 저는 ‘ $ m $ 개의 서로 다른 CI (각각 95 % 신뢰 수준)를 계산했습니다. 이제 CI는 무엇입니까? $ m $ CI의 95 %가 실제 값을 포함해야한다는 의미입니까?
- @loganecolss-이것은 사실입니다. 그러나 $ m \ to \ infty $로 제한됩니다. 이것은 표준 ” 확률 ” = ” 장기 실행 빈도 ” 기본 CI 해석
- 예, 제한이 있습니다. 그러면 하나 또는 두 개의 샘플에 대해 CI는 ‘ 아무 의미가 없습니다. 맞습니까? 그렇다면 ‘ 샘플이 많지 않은 경우 ‘ CI 계산 포인트는 무엇입니까?
- @loganecolss-‘이 ‘ 베이지안 인 이유입니다.
- @nazka-일종의. 보유한 데이터의 양에 관계없이 항상 베이지안 접근 방식을 사용하는 것이 가장 좋습니다. 이것이 빈도주의 절차에 의해 잘 추정 될 수 있다면 그것을 사용하십시오. 베이지안은 느림의 동의어가 아닙니다.
답변
내가 이해하는대로 : 신뢰할 수있는 간격은 진술입니다. 우리가 실제로 관찰 한 특정 데이터 샘플을 감안할 때 그럴듯하게 남아있는 관심 통계 값의 범위입니다. 신뢰 구간은 동일한 기본 모집단의 다른 데이터 샘플을 사용하여 매번 실험을 여러 번 반복 할 때 실제 값이 신뢰 구간에있는 빈도를 나타냅니다.
일반적으로 우리가 대답하고 싶은 질문은 “통계의 어떤 값이 관찰 된 데이터와 일치하는지”이며 신뢰할 수있는 간격은 해당 질문에 대한 직접적인 대답을 제공합니다. 통계의 실제 값은 확률이있는 95 % 신뢰할 수있는 간격에 있습니다. 95 %.신뢰 구간은이 질문에 대한 직접적인 답을 제공하지 않습니다. 통계의 실제 값이 95 % 신뢰 구간 내에있을 확률이 95 %라고 주장하는 것은 정확하지 않습니다 (신뢰할 수있는 구간과 일치하지 않는 한). 그러나 이것은 질문에 대한 직접적인 답이 될 해석이기 때문에 빈도주의 신뢰 구간의 매우 일반적인 오해입니다.
다른 질문에서 제가 논의한 Jayne의 논문은 다음과 같은 좋은 예를 제공합니다. 이 (예제 # 5)는 완벽하게 정확한 신뢰 구간이 구성되어 있으며,이를 기반으로하는 특정 데이터 샘플은 통계의 실제 값이 95 % 신뢰 구간에있을 가능성을 배제합니다! 신뢰 구간이 우리가 관찰 한 특정 표본을 기반으로 한 통계의 타당한 값의 통계로 잘못 해석되는 경우 문제가 발생합니다.
하루의 마지막에는 “말의 문제입니다. 어떤 구간이 가장 적합한지는 답을 원하는 질문에 따라 달라집니다. 해당 질문에 직접 답하는 방법을 선택하기 만하면됩니다.
[예정된] 반복 가능한 실험을 분석 할 때 신뢰 구간이 더 유용하다고 생각합니다. 단지 가정입니다 신뢰 구간의 기초), 관측 데이터를 분석 할 때 신뢰할 수있는 구간이 더 낫지 만 그것은 단지 의견 일뿐입니다 (저는 제 작업에서 두 가지 종류의 구간을 모두 사용하지만 나 자신을 어느 쪽에서도 전문가라고 설명하지는 않습니다).
설명
- 반복 실험에서 신뢰 구간의 문제는 실험이 작동하려면 반복 실험의 조건이 동일하게 유지되어야한다는 것입니다. 누가 그것을 믿겠습니까?), 반면 베이지안 구간 (적절하게 사용 된 경우)은 관찰 된 데이터에 대한 조건을 제공하므로 데이터를 통해 실제 세계에서 발생하는 변화에 대한 허용치를 제공합니다. 나는 베이지안 통계의 조건부 규칙 이이를 능가하기 어렵게 만드는 것 (불가능하다고 생각합니다 : 동등성 만 달성 될 수 있음)과이를 달성하는 자동 기계가 그것을 보이게한다고 생각합니다. 매우 매끄 럽습니다.
답변
신뢰 구간과 신뢰할 수있는 집합에 대한 많은 해석이 잘못되었음을 발견했습니다. 예를 들어, 신뢰 구간은 $ P (\ theta \ in CI) $ 형식으로 표현할 수 없습니다. 빈도주의와 베이지안의 추론에서 “분포”를 면밀히 살펴보면 데이터에 대한 샘플링 분포에 대한 빈도주의 작업을 볼 수 있고, 베이지안은 매개 변수의 (후방) 분포에 대해 작업하는 것을 볼 수 있습니다. 완전히 다른 샘플 공간과 시그마 대수로 정의됩니다.
예, “실험을 여러 번 반복하면 95 % CI의 약 95 %가 실제 매개 변수를 포함합니다.”라고 말할 수 있습니다. 베이지안에서는 “통계의 실제 값이 95 % 확률로 95 % 신뢰할 수있는 구간에 있습니다”라고 말할 수 있지만이 95 % 확률 (베이지 안에서) 자체는 추정치 일뿐입니다. (표본 분포가 아니라이 특정 데이터가 주어진 조건 분포를 기반으로한다는 것을 기억하십시오). 이 추정기는 무작위 표본으로 인한 무작위 오류와 함께 제공되어야합니다.
Bayesian은 제 1 종 오류 문제를 피하려고합니다. 베이지안은 항상 베이지 안에서 제 1 종 오류에 대해 이야기하는 것은 의미가 없다고 말합니다. 이것은 전적으로 사실이 아닙니다. 통계학자는 항상 “귀하의 데이터는 결정을 내릴 것을 제안하지만 모집단은 그렇지 않다고 제안합니다”라는 가능성이나 오류를 측정하려고합니다. 이것은 베이지안이 대답 할 수없는 것입니다 (자세한 내용은 여기에서 생략). 불행히도 이것은 통계학자가 대답해야 할 가장 중요한 문제 일 수 있습니다. 통계 학자들은 단지 결정을 제안하는 것이 아닙니다. 통계 학자들은 결정이 얼마나 잘못 될 수 있는지도 설명 할 수 있어야합니다.
나는 개념을 설명하기 위해 다음 표와 용어를 발명해야합니다. 이것이 Confidence Interval과 Credible Set의 차이를 설명하는 데 도움이되기를 바랍니다.
사후 분포는 $ P (\ theta_0 | Data_n) $이며 여기서 $ \ theta_0 $는 이전 $ P에서 정의됩니다. (\ theta_0) $. 빈도주의에서 샘플링 분포는 $ P (Data_n; \ theta) $입니다. $ \ hat {\ theta} $의 샘플링 분포는 $ P (\ hat {\ theta} _n; \ theta) $입니다. 아래 첨자 $ n $는 샘플 크기입니다. 빈도주의에서 샘플링 분포를 나타 내기 위해 $ P (Data_n | \ theta) $ 표기법을 사용하지 마십시오. $ P (Data_n; \ theta) $ 및 $ P (\ hat {\ theta} _n; \ theta) $에서 임의 데이터에 대해 말할 수 있지만 $ P (\ theta_0 | Data_n) $에서는 임의 데이터에 대해 말할 수 없습니다.
“???????” 베이지 안에서 제 1 종 오류 (또는 이와 유사한 것)를 평가할 수없는 이유를 설명합니다.
신뢰할 수있는 집합을 사용하여 일부 상황에서 신뢰 구간을 근사화 할 수도 있습니다. 그러나 이것은 수학적 근사치 일뿐입니다. 해석은 빈도 주의자와 함께 진행되어야합니다. 이 경우 베이지안 해석은 더 이상 작동하지 않습니다.
Thylacoleo “의 $ P (x | \ theta) $ 표기법은 빈도 주의자가 아닙니다. 이것은 여전히 베이지안입니다. 표기법은 빈도 주의자에 대해 이야기 할 때 측정 이론에서 근본적인 문제를 야기합니다.
Dikran Marsupial 의 결론에 동의합니다. FDA 검토 자 여러분은 항상 약물 신청을 승인 할 가능성을 알고 싶지만 약물이 실제로 효과가 없다는 것을 알고 싶습니다. 이것은 Bayesian이 적어도 클래식 / 전형적인 베이지안에서는 제공 할 수없는 대답입니다.
답변
일반적이고 일관된 신뢰와 신뢰할 수있는 지역. http://dx.doi.org/10.6084/m9.figshare.1528163 http://dx.doi.org/10.6084/m9.figshare.1528187
에 코드가있는 경우
신뢰할 수있는 간격 및 신뢰도에 대한 설명을 제공합니다. 주어진 우도 함수와 일부 관측 된 데이터를 모두 계산하기 위해 일반 R 코드와 함께 집합 선택을위한 간격. 서로 일치하는 최적 크기의 신뢰할 수있는 신뢰 구간을 제공하는 테스트 통계입니다.
간단히 말하면 공식을 피할 수 있습니다. 베이지안 신뢰할 수있는 간격 은 주어진 매개 변수의 확률을 기반으로합니다. 데이터 . 신뢰할 수있는 세트 / 간격으로 확률이 높은 매개 변수를 수집합니다. 95 % 신뢰할 수있는 구간에는 데이터가 주어진 경우 함께 확률이 0.95 인 모수가 포함됩니다.
빈도 주의자 신뢰 구간 은 일부 매개 변수가 주어진 데이터의 확률 . 각 (아마도 무한히 많은) 매개 변수에 대해 먼저 매개 변수가 주어질 가능성이있는 데이터 세트를 생성합니다. 그런 다음 선택한 높은 확률 데이터에 관찰 된 데이터가 포함되어 있는지 여부를 각 매개 변수에 대해 확인합니다. 높은 확률 데이터에 관측 된 데이터가 포함 된 경우 해당 매개 변수가 신뢰 구간에 추가됩니다. 따라서 신뢰 구간은 매개 변수가 데이터를 생성했을 가능성을 배제 할 수없는 매개 변수의 모음입니다. 이는 유사한 문제에 반복적으로 적용되는 경우 95 % 신뢰 구간에 95 % 케이스의 실제 매개 변수 값을 포함하는 규칙을 제공합니다.
95 % 신뢰 세트 및 95 % 신뢰 세트 음 이항 분포의 예
설명
- 신뢰 구간에 대한 설명이 올바르지 않습니다. ” 95 % “는 모집단의 표본이 매개 변수의 실제 값을 포함하는 구간을 생성 할 확률에서 비롯됩니다.
- @jlimahaverford-귀하의 설명이 정확합니다. 설명하는 내용에 대한 링크를 만들기 위해 ” 유사한 문제에 반복적으로 적용하면 95 % 신뢰할 수있는 간격에 95의 실제 매개 변수 값이 포함되는 규칙을 추가했습니다. %의 경우. ”
- 신뢰 구간에 대한 설명이 아니 었습니다. 저는 ‘ 이제 단락 중간에서 신뢰 구간에 대해 다시 신뢰에 대해 이야기하기 시작했으며 이것이 실수라고 생각합니다. 중요한 아이디어는 다음과 같습니다. “이 값이 매개 변수의 실제 값이라면이 극단 이상의 샘플을 그릴 확률은 얼마입니까? 답변이 5 %보다 크면 ‘ 신뢰 구간입니다. ”
- @jlimahaverford-aggree 및 수정되었습니다.
- 흠, 수정되지 않았습니다.
답변
이것은 댓글에 가깝지만 너무 깁니다. 다음 문서에서 : The Dawning of the Age of Stochasticity (David Mumford) Mumford는 다음과 같은 흥미로운 설명을했습니다.
이 모든 흥미로운 용도는 통계로 이루어졌지만 대부분의 통계 학자들은 RA 경이 이끄는 Fisher는 그들의 손을 등 뒤로 묶고 통계가 완전히 재현 가능한 상황에서는 사용될 수 없다고 주장하고 경험적 데이터 만 사용한다고 주장했습니다. 이것이 바로 베이지안 학교와 싸웠던 이른바 “빈번주의”학교라고 믿었습니다. 이 접근 방식은 실제 상황이 항상 상황 변수에 묻혀 있고 반복 될 수 없기 때문에 통계적 추론이 실제 사고와 관련이 있다는 것을 부정합니다.다행히도 베이지안 학교는 완전히 죽지 않았으며 DeFinetti, E.T. Jaynes, 기타.
"What if the true value is, say, 0.37? If it is, then your method, run start to finish, will be WRONG 75% of the time"
라고 말했을 때 그들은 단지 그들이 만든 예제 번호를 제공하고 있습니다. 이 특별한 경우에, 그들은 0.37에서 매우 낮은 값을 가진 일부 사전 분포를 참조하고 대부분의 확률 밀도는 다른 곳에서 나타납니다. 그리고 우리는 매개 변수의 실제 값이 0 일 때 예제 분포의 성능이 매우 나쁘다고 가정합니다.37은 Bayesia ‘의 신뢰성 구간이 병이 B 형이되었을 때 비참하게 실패한 것과 유사합니다.>72%
믿음이어야합니다.