Dadas as taxas de verdadeiro positivo e falso negativo, você pode calcular falso positivo, verdadeiro negativo?

Tenho valores para True Positive (TP) e False Negative (FN) da seguinte maneira:

TP = 0.25 FN = 0.75 

A partir desses valores, podemos calcular False Positive (FP) e True Negative (TN)?

Resposta

Há um pouco de confusão terminológica nesta área. Pessoalmente, sempre acho útil voltar a uma matriz de confusão para pensar sobre isso. Em um teste de classificação / triagem, você pode ter quatro situações diferentes:

 Condition: A Not A Test says “A” True positive | False positive ---------------------------------- Test says “Not A” False negative | True negative 

Nesta tabela, “verdadeiro positivo”, “falso negativo”, “falso positivo ”E“ verdadeiro negativo ”são eventos (ou sua probabilidade). O que você tem, portanto, é provavelmente uma taxa positiva verdadeira e uma taxa falsa negativa. A distinção é importante porque enfatiza que ambos os números têm um numerador e um denominador.

Onde as coisas ficam um pouco confusas é que você pode encontrar várias definições de “taxa de falsos positivos” e “taxa de falsos negativos”, com denominadores diferentes.

Por exemplo, Wikipedia fornece as seguintes definições (parecem bastante padrão):

  • Taxa de verdadeiro positivo (ou sensibilidade): $ TPR = TP / (TP + FN) $
  • Taxa de falso positivo: $ FPR = FP / (FP + TN) $
  • Verdadeiro taxa (ou especificidade) negativa: $ TNR = TN / (FP + TN) $

Em todos os casos, o denominador é a coluna total. Isso também dá uma pista para sua interpretação: A taxa positiva verdadeira é a probabilidade de que o teste diga “A” quando o valor real é de fato A (ou seja, é uma probabilidade condicional, condicionada a A ser verdadeiro). Isso não informa a probabilidade de você estar correto ao chamar “A” (ou seja, a probabilidade de um verdadeiro positivo, condicionado ao resultado do teste ser “A”).

Supondo que a taxa de falsos negativos seja definida da mesma maneira, temos $ FNR = 1 – TPR $ (observe que seus números são consistentes com isso). Não podemos, no entanto, derivar diretamente a taxa de falso positivo das taxas de verdadeiro positivo ou falso negativo, porque elas não fornecem informações sobre a especificidade, ou seja, como o teste se comporta quando “não A” é a resposta correta. A resposta à sua pergunta seria, portanto, “não, não é possível” porque você não tem informações na coluna certa da matriz de confusão.

Existem, no entanto, outras definições na literatura. Por exemplo, Fleiss ( Métodos estatísticos para taxas e proporções ) oferece o seguinte:

  • “[…] a taxa de falsos positivos […] é a proporção de pessoas, entre aqueles que respondem positivamente, que estão realmente livres da doença. ”
  • “ A taxa de falsos negativos […] é a proporção de pessoas, entre aqueles que respondem negativo no teste, que, no entanto, tem a doença. ”

(Ele também reconhece as definições anteriores, mas considera-as“ um desperdício de terminologia preciosa ”, precisamente porque têm uma relação direta com a sensibilidade e especificidade.)

Referindo-se à matriz de confusão, isso significa que $ FPR = FP / (TP + FP) $ e $ FNR = FN / (TN + FN) $ então os denominadores são linha totais. I É importante ressaltar que, de acordo com essas definições, as taxas de falso positivo e falso negativo não podem ser derivadas diretamente da sensibilidade e especificidade do teste. Você também precisa saber a prevalência (ou seja, a frequência de A na população de interesse).

O Fleiss não usa ou define as frases “taxa negativa verdadeira” ou “taxa positiva verdadeira”, mas se presumimos que essas também são probabilidades condicionais, dado um determinado resultado / classificação de teste, então @ guill11aume a resposta é a correta.

Em qualquer caso, você precisa ter cuidado com as definições porque não há uma resposta indiscutível para sua pergunta.

Comentários

  • Muito bom (+1). Eu imediatamente pulei em uma interpretação, mas você está absolutamente certo de que a definição alternativa é padrão.
  • @ gui11aume. Obrigado! Era meu sentimento, mas pensando nisso, não tenho mais tanta certeza. Olhando as referências, pode depender do campo (aprendizado de máquina vs. teste médico).
  • Minha experiência é que a última definição, TPR = TP / (TP + FP), FPR = FP / ( TP + FP) é mais padrão.
  • Aqui ' uma publicação sobre as diferenças: link.springer. com / article / 10.1007 / s10899-006-9025-5 # enumeration Observe a nova terminologia " Teste FPR " vs . " FPR preditivo "

Resposta

EDITAR: veja a resposta de Gaël Laurans, que é mais precisa.

Se a sua taxa positiva verdadeira for 0.25 significa que toda vez que você chama um positivo, você tem uma probabilidade de 0,75 de estar errado. Esta é a sua taxa de falsos positivos. Da mesma forma, cada vez que você chama um negativo, você tem uma probabilidade de 0,25 de estar certo, que é a sua verdadeira taxa negativa.

Comentários

  • Depende sobre o que se está tentando caracterizar: o teste no cenário de saber a verdade de antemão, ou tentar decidir sobre a probabilidade pós-teste apenas dados os resultados em mãos.

Resposta

Nenhuma se isso fizer sentido, se “positivo” e “negativo” não fizerem sentido para o problema em questão. Eu vejo muitos problemas onde “positivo” e “negativo” são escolhas forçadas arbitrárias em uma variável ordinal ou contínua. FP, TP, sens, spec são úteis apenas para fenômenos tudo ou nada.

Resposta

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *