참 양성, 거짓 음성 비율이 주어지면 거짓 양성, 참 음성을 계산할 수 있습니까?

다음과 같이 True Positive (TP)False Negative (FN)에 대한 값이 있습니다.

TP = 0.25 FN = 0.75 

이 값에서 False Positive (FP)True Negative (TN)?

답변

이 영역에는 용어가 상당히 혼란 스럽습니다. 개인적으로, 나는 항상 이것을 생각하기 위해 혼란 매트릭스로 돌아 오는 것이 유용하다고 생각합니다. 분류 / 스크리닝 테스트에서는 네 가지 상황이있을 수 있습니다.

 Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative 

이 표에서“참 양성”,“거짓 음성”,“거짓 양성 “및”참 음성 “은 사건 (또는 그 확률)입니다. 따라서 당신이 가진 것은 아마도 참 양성 과 거짓 음성 일 것입니다. 두 숫자 모두 분자와 분모가 있음을 강조하기 때문에 구별이 중요합니다.

일이 약간 혼란스러운 부분은 “가양 성 비율”과 “거짓 음성 비율”에 대한 여러 정의를 찾을 수 있다는 것입니다. 다른 분모.

예를 들어, Wikipedia 는 다음과 같은 정의를 제공합니다 (매우 표준으로 보입니다).

  • 참 양성률 (또는 민감도) : $ TPR = TP / (TP + FN) $
  • 거짓 양성률 : $ FPR = FP / (FP + TN) $
  • 참 음수 비율 (또는 특이성) : $ TNR = TN / (FP + TN) $

모든 경우에 분모는 합계입니다. 이것은 또한 그들의 해석에 대한 단서를 제공합니다. 참 양성 비율은 실제 값이 실제로 A 일 때 테스트에서 “A”라고 말할 확률입니다 (즉, A가 참일 때 조건부 확률). 이것은 “A”를 부를 때 얼마나 정확할 것인지를 알려주지 않습니다 (즉, 테스트 결과가 “A”인 것을 조건으로 한 참 양성 확률).

위음성 비율이 동일한 방식으로 정의되었다고 가정하면 $ FNR = 1-TPR $가됩니다 (귀하의 숫자가 이것과 일치 함). 그러나 우리는 참 양성 또는 거짓 음성 비율에서 직접 위양성 비율을 유도 할 수 없습니다. 왜냐하면 특이성에 대한 정보, 즉 “A가 아님”이 정답 일 때 테스트가 어떻게 작동하는지에 대한 정보를 제공하지 않기 때문입니다. 따라서 혼동 행렬의 오른쪽 열에 정보가 없기 때문에 질문에 대한 대답은 “아니오, 불가능합니다”입니다.

그러나 문헌에는 다른 정의가 있습니다. 예를 들어, Fleiss ( 요금 및 비율에 대한 통계적 방법 )은 다음을 제공합니다.

  • “[…] 위양성률 […]은 실제로 질병이없는 양성 반응을 보이는 사람들의 비율입니다.”
  • “위양성률 […]은 반응하는 사람들 중 사람들의 비율입니다. 그럼에도 불구하고 질병에 걸린 사람은 테스트에서 음성입니다.”

(그는 또한 이전의 정의를 인정하지만 “귀중한 용어를 낭비”한다고 생각합니다. 이는 민감도와 직접적인 관계가 있기 때문입니다. 특이성.)

혼동 행렬을 참조하면 $ FPR = FP / (TP + FP) $ 및 $ FNR = FN / (TN + FN) $을 의미하므로 분모는 합계. I 중요하게도 이러한 정의 하에서 위양성 및 위음성 비율은 테스트의 민감도와 특이성에서 직접 파생 될 수 없습니다. 또한 유병률을 알아야합니다 (예 : A가 관심 집단에서 얼마나 자주 발생하는지).

Fleiss는 “참 음성 율”또는 “참 양성율”이라는 문구를 사용하거나 정의하지 않습니다. 특정 테스트 결과 / 분류가 주어진 조건부 확률이라고 가정하면 @ guill11aume 답변이 올바른 답변입니다.

어쨌든 확실한 답변이 없기 때문에 정의에주의해야합니다. 귀하의 질문입니다.

댓글

  • 매우 좋습니다 (+1). 즉시 한 가지 해석으로 넘어갔지 만 대체 정의가 표준이라는 것은 절대적으로 옳습니다.
  • @ gui11aume. 감사! 내 느낌 이었지만 생각 해보니 더 이상 확신이 서지 않는다. 참고 문헌을 보면 분야 (기계 학습 대 의료 테스트)에 따라 달라질 수 있습니다.
  • 내 경험으로는 후자의 정의 인 TPR = TP / (TP + FP), FPR = FP / ( TP + FP)가 더 표준입니다.
  • 여기 ' 차이점에 대한 간행물 : link.springer. com / article / 10.1007 / s10899-006-9025-5 # enumeration 새 용어 " 테스트 FPR " vs . " 예측 FPR "

답변

수정 : 더 정확한 Gaël Laurans의 답변을 참조하세요.

참 양성률이 0 인 경우.25 그것은 당신이 긍정이라고 부를 때마다 당신이 틀릴 확률이 0.75임을 의미합니다. 이것은 오 탐율입니다. 마찬가지로 음수라고 부를 때마다 옳을 확률은 0.25이며, 이는 진정한 음수 비율입니다.

댓글

  • 어떤 사람이 특성화하려고하는지에 대한 정보 : 사전에 진실을 아는 설정에서 테스트하거나 결과를 직접받은 후 테스트 후 확률을 결정하는 것입니다.

답변

긍정적과 부정적이 당면한 문제에 대해 의미가없는 경우 의미가 없으면 없음. 나는 “positive”와 “negative”가 순서 형 또는 연속 형 변수에 대한 임의의 강제 선택 인 많은 문제를 봅니다. FP, TP, sens, spec은 전부 또는 전혀없는 현상에만 유용합니다.

답변

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다