Tenho valores para True Positive (TP)
e False Negative (FN)
da seguinte maneira:
TP = 0.25 FN = 0.75
A partir desses valores, podemos calcular False Positive (FP)
e True Negative (TN)
?
Resposta
Há um pouco de confusão terminológica nesta área. Pessoalmente, sempre acho útil voltar a uma matriz de confusão para pensar sobre isso. Em um teste de classificação / triagem, você pode ter quatro situações diferentes:
Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative
Nesta tabela, “verdadeiro positivo”, “falso negativo”, “falso positivo ”E“ verdadeiro negativo ”são eventos (ou sua probabilidade). O que você tem, portanto, é provavelmente uma taxa positiva verdadeira e uma taxa falsa negativa. A distinção é importante porque enfatiza que ambos os números têm um numerador e um denominador.
Onde as coisas ficam um pouco confusas é que você pode encontrar várias definições de “taxa de falsos positivos” e “taxa de falsos negativos”, com denominadores diferentes.
Por exemplo, Wikipedia fornece as seguintes definições (parecem bastante padrão):
- Taxa de verdadeiro positivo (ou sensibilidade): $ TPR = TP / (TP + FN) $
- Taxa de falso positivo: $ FPR = FP / (FP + TN) $
- Verdadeiro taxa (ou especificidade) negativa: $ TNR = TN / (FP + TN) $
Em todos os casos, o denominador é a coluna total. Isso também dá uma pista para sua interpretação: A taxa positiva verdadeira é a probabilidade de que o teste diga “A” quando o valor real é de fato A (ou seja, é uma probabilidade condicional, condicionada a A ser verdadeiro). Isso não informa a probabilidade de você estar correto ao chamar “A” (ou seja, a probabilidade de um verdadeiro positivo, condicionado ao resultado do teste ser “A”).
Supondo que a taxa de falsos negativos seja definida da mesma maneira, temos $ FNR = 1 – TPR $ (observe que seus números são consistentes com isso). Não podemos, no entanto, derivar diretamente a taxa de falso positivo das taxas de verdadeiro positivo ou falso negativo, porque elas não fornecem informações sobre a especificidade, ou seja, como o teste se comporta quando “não A” é a resposta correta. A resposta à sua pergunta seria, portanto, “não, não é possível” porque você não tem informações na coluna certa da matriz de confusão.
Existem, no entanto, outras definições na literatura. Por exemplo, Fleiss ( Métodos estatísticos para taxas e proporções ) oferece o seguinte:
- “[…] a taxa de falsos positivos […] é a proporção de pessoas, entre aqueles que respondem positivamente, que estão realmente livres da doença. ”
- “ A taxa de falsos negativos […] é a proporção de pessoas, entre aqueles que respondem negativo no teste, que, no entanto, tem a doença. ”
(Ele também reconhece as definições anteriores, mas considera-as“ um desperdício de terminologia preciosa ”, precisamente porque têm uma relação direta com a sensibilidade e especificidade.)
Referindo-se à matriz de confusão, isso significa que $ FPR = FP / (TP + FP) $ e $ FNR = FN / (TN + FN) $ então os denominadores são linha totais. I É importante ressaltar que, de acordo com essas definições, as taxas de falso positivo e falso negativo não podem ser derivadas diretamente da sensibilidade e especificidade do teste. Você também precisa saber a prevalência (ou seja, a frequência de A na população de interesse).
O Fleiss não usa ou define as frases “taxa negativa verdadeira” ou “taxa positiva verdadeira”, mas se presumimos que essas também são probabilidades condicionais, dado um determinado resultado / classificação de teste, então @ guill11aume a resposta é a correta.
Em qualquer caso, você precisa ter cuidado com as definições porque não há uma resposta indiscutível para sua pergunta.
Comentários
- Muito bom (+1). Eu imediatamente pulei em uma interpretação, mas você está absolutamente certo de que a definição alternativa é padrão.
- @ gui11aume. Obrigado! Era meu sentimento, mas pensando nisso, não tenho mais tanta certeza. Olhando as referências, pode depender do campo (aprendizado de máquina vs. teste médico).
- Minha experiência é que a última definição, TPR = TP / (TP + FP), FPR = FP / ( TP + FP) é mais padrão.
- Aqui ' uma publicação sobre as diferenças: link.springer. com / article / 10.1007 / s10899-006-9025-5 # enumeration Observe a nova terminologia " Teste FPR " vs . " FPR preditivo "
Resposta
EDITAR: veja a resposta de Gaël Laurans, que é mais precisa.
Se a sua taxa positiva verdadeira for 0.25 significa que toda vez que você chama um positivo, você tem uma probabilidade de 0,75 de estar errado. Esta é a sua taxa de falsos positivos. Da mesma forma, cada vez que você chama um negativo, você tem uma probabilidade de 0,25 de estar certo, que é a sua verdadeira taxa negativa.
Comentários
- Depende sobre o que se está tentando caracterizar: o teste no cenário de saber a verdade de antemão, ou tentar decidir sobre a probabilidade pós-teste apenas dados os resultados em mãos.