Caracterización de pruebas diagnósticas A. Gómez de la Cámara Unidad de Investigación. Hospital Doce de Octubre y Atención Primaria. Insalud Área 11. Madrid.
Introducción Entendemos por prueba diagnóstica o test (PD) cualquier procedimiento para la obtención de información clínica en un paciente. Las PD pueden ser procedimientos diagnósticos instrumentales, exploraciones físicas, cuestionarios, etc. Las PD aportan información que permite distinguir pacientes con diferentes probabilidades de enfermar. La validez operativa de una PD puede expresarse en términos de exactitud diagnóstica. Entendemos por validez operativa la propiedad de clasificar correctamente a los sujetos en el grupo clínicamente correspondiente. Entendemos por exactitud diagnóstica el grado de calidad de la información provista por la PD (sensibilidad, especificidad). La utilidad diagnóstica de una prueba diagnóstica se refiere al valor práctico de la información que no tiene por qué coincidir con el de la exactitud diagnóstica. La validez operativa nos permite clasificar a los pacientes en grupos distintos con implicaciones diagnósticas, pronósticas o terapéuticas diferentes, por ejemplo, presencia o no de metástasis, de infecciones o grado de afectación neurológica mediante la escala de Glasgow. Para ello queremos pruebas con una gran exactitud diagnóstica, alta sensibilidad y especificidad, o desde otro punto de vista con la mínima proporción de falsos positivos y negativos posible. Sin embargo, la persecución de la mínima cantidad de resultados falsos puede hacer que la prueba, con alta exactitud diagnóstica, sea poco útil desde un punto de vista práctico; por ejemplo, toracotomía exploradora sistemática en busca de ganglios afectados para hacer el estudio de la extensión de un carcinoma broncogénico.
¿Pruebas diagnósticas o de cribaje? ¿Hay diferencias entre una prueba diagnóstica o de cribaje (screening en lengua inglesa)? En esencia no, sus propiedades son comunes, sólo las aplicaciones son distintas. Las pruebas diagnósticas se realizan para verificar la naturaleza de un síntoma, síndrome o consulta en pacientes bajo sospecha de enfermedad. En general se trata de personas seleccionadas en función de una sospecha diagnóstica o por presentar síntomas, signos u otras pruebas diagnósticas previas que modifican la imagen de normalidad. Las pruebas de screening, por el contrario, se realizan en general, para identificar individuos con riesgos distintos de padecer una enfermedad pero asintomáticos. En cualquiera de las dos situaciones nos puede interesar más la sensibilidad o la especificidad (visión instrumental) o bien nos puede preocupar las consecuencias de un falso positivo o negativo (visión clínica). Esto depende de la situación específica en la que trabajemos independientemente de que sea con intenciones diagnósticas o de cribaje.
Objetivos del proceso diagnóstico El objetivo primordial de un diagnóstico es establecer la prevalencia o probabilidad
No prueba No trato
de una enfermedad en función de un determinado perfil clínico, E = f (x); donde E es la enfermedad y x = el perfil clínico. Dicho perfil clínico, características del paciente y su contexto, puede ser múltiple y con distinto peso sobre la existencia de la enfermedad. El diagnóstico debe enmarcarse dentro de un proceso general de toma de decisiones. Debe permitirnos avanzar en la resolución del problema del umbral de tratamiento, ¿qué tiene este paciente?, ¿sirve para decidir nuestra actuación? Las pruebas diagnósticas modifican (deben modificar) nuestro grado de incertidumbre desplazando la probabilidad de que el paciente presente la enfermedad bien hacia la confirmación bien hacia su definitivo descarte. Las pruebas diagnósticas sólo deben realizarse cuando sirvan para modificar el manejo de un problema (fig. 1).
Características operativas de las pruebas diagnósticas Las características o prestaciones de las pruebas diagnósticas sirven de base metodológica para la toma de decisiones en la práctica clínica. Se asume, que un individuo sano y otro enfermo pueden ser distinguidos de manera válida (exacta y reproducible por una determinada prueba diagnóstica). Las pruebas diagnósticas: 1. Deben ser expresadas en términos de variable o parámetro, es decir, deben presentar la capacidad de ser medidas en relación con una enfermedad o estado particular; este es el caso de la hipertensión, que medimos a partir de la tensión arterial diastólica en milímetros de mercurio, o de la presencia de tuberculosis que se mide en función del tamaño en milímetros
Necesidad de prueba diagnóstica
0
No prueba Sí trato
100% Presencia de enfermedad
Medicine 1998; 7(104): 4872-4877
Fig. 1. Espectro continuo de la probabilidad de enfermar. Obsérvense los umbrales de decisión: en la izquierda de la flecha la probabilidad de la enfermedad es baja, no se hacen pruebas diagnósticas ni se trata. En el extremo derecho la probabilidad de padecer la enfermedad es alta, se trata directamente sin hacer pruebas diagnósticas. La toma de decisiones se puede ver favorecida por la presencia de pruebas diagnósticas en el medio del espectro donde la incertidumbre es más grande.
4872 © Idepsa 98 ©
CARACTERIZACIÓN DE PRUEBAS DIAGNÓSTICAS de la pápula de la reacción cutánea en la prueba de Mantoux. Pueden desde luego ser referidas a la presencia o no de un signo, cultivo positivo/negativo, presencia o no de broncograma aéreo, pero siempre desde una óptica tangible y mensurable. 2. Muchas veces se debe establecer un valor umbral o punto de corte. De esta manera, se divide lo “normal” de lo patológico. Se trata de una elección arbitraria según el contexto, sea el caso de los 85 mmHg en el caso de la tensión arterial, o de los 10 mm del Mantoux. Otras veces no es una escala cuantitativa, pero son determinados criterios diagnósticos los que nos señalan la distinción entre lo normal y lo patológico, sea en una escala nominal, criterios de artritis reumática frente a poliartritis de otra naturaleza u ordinal, grado de disnea según la New York Heart Association o la clasificación TNM en los tumores.
Tipos de escala en las pruebas diagnósticas Cualitativa Presencia/ausencia de un signo para clasificar a los pacientes como sanos o enfermos.
Cualitativa Clasifica a un paciente sano o enfermo si el valor de la prueba diagnóstica cae por encima o por debajo de un criterio, valor umbral, punto de corte, valor de referencia, etc. ¿Por qué dicotomizamos? Al dicotomizar se simplifica el análisis de la información clínica reduciendo el conjunto de probabilidades a manejar. De esta manera, sólo tenemos en consideración la probabilidad de la enfermedad (P[E]), la probabilidad de un resultado positivo (P[PD+]), la probabilidad condicional de tener la enfermedad dado un test o prueba con resultado positivo (P[EuPD+]) y la probabilidad condicional de tener la enfermedad dado una prueba con resultado negativo (P[EuPD–]). Las ventajas de esta fragmentación de información es que se adapta a la toma de decisiones en la clínica: tratar o no tratar. La desventaja es que se pierde parte de la información que albergan resultados con un espectro de posibilidades mas amplio. Para caracterizar a una prueba diagnóstica, es necesario disponer de un patrón de
Enfermedad Presente
Ausente
Positiva
Verdadero positivo
Falso positivo
Negativa
Falso negativo
Verdadero negativo
Prueba
Fig. 2. Clasificación de los resultados de una prueba diagnóstica al contrastarlos con el estándar de referencia. Véase explicación en el texto.
referencia o criterio estándar, gold standard en lengua inglesa. La clasificación de los pacientes que se obtiene a través de la prueba diagnóstica en cuestión se contrasta con la clasificación de los mismos pacientes que realiza el criterio o patrón de referencia. Esta circunstancia es a veces difícil; en determinadas situaciones el patrón de referencia no está disponible o es imperfecto pero nos permite establecer cuatro categorías fundamentales: 1. Verdadero positivo: enfermedad presente y resultado positivo. 2. Verdadero negativo: enfermedad ausente y resultado negativo. 3. Falso positivo: enfermedad ausente y resultado positivo. 4. Falso negativo: enfermedad presente y resultado negativo (fig. 2). Dicho contraste, además, permite la identificación de las siguientes características operativas (tabla 1): Sensibilidad. Es la probabilidad de que un individuo enfermo tenga un resultado positivo. Tasa o proporción de verdaderos positivos. Enfermos con prueba positiva de entre todos los enfermos.
Especificidad. Es la probabilidad de que un individuo sin la enfermedad presente un resultado negativo en la prueba diagnóstica. Tasa, proporción de verdaderos negativos. Sanos con prueba negativa de entre todos los sanos. Obsérvese que la sensibilidad es un atributo dentro de los enfermos. La especificidad dentro de los sanos. Proporción de falsos negativos. Probabilidad de que un individuo enfermo obtenga un resultado negativo. Enfermos con prueba negativa de entre todos los enfermos. Proporción de falsos positivos. Probabilidad de que un individuo libre de enfermedad tenga un resultado positivo. Sanos con prueba positiva de entre todos los sanos. Otro tipo de proporciones de interés son las que se establecen entre los falsos positivos en el conjunto total de pruebas realizadas o la proporción de falsos positivos del total de pruebas positivas. Recordamos aquí que la prevalencia es la probabilidad de que un individuo de una población tenga una enfermedad en un momento dado, es decir, individuos con enfermedad entre el número total de individuos. Este concepto se denomina
TABLA 1 Caracterización de pruebas diagnósticas P(E) P(PD+|E) P(PD+|E) – P(PD-|E) P(PD-|E) P(E|PD+) – P(E|PD-) – P(PD+|E)/P(PD+|E) – P(PD-|E)/P(PD-|E)
Probabilidad a priori de la enfermedad. Prevalencia Verdadero positivo. Sensibilidad Falso positivo Verdadero negativo. Especificidad Falso negativo Valor predictivo positivo Valor predictivo negativo Cociente de probabilidad positivo Cociente de probabilidad negativo
– E: presencia de enfermedad; E: ausencia de enfermedad.
4873 © Idepsa 98 ©
EPIDEMIOLOGÍA CLÍNICA Y BIOESTADÍSTICA también probabilidad “a priori” o probabilidad “pre-test”. Esto significa la probabilidad de que un individuo con un determinado perfil presente la enfermedad en cuestión antes de realizarse la prueba diagnóstica. Es el grado de verosimilitud de la sospecha diagnóstica en un conjunto de pacientes similares.
gativo al disminuir la proporción de falsos negativos, pero disminuyen la especificidad al aumentar la proporción de falsos positivos.
Pruebas combinadas
Es la probabilidad de que un individuo con una prueba positiva tenga la enfermedad. Enfermos con prueba positiva de entre todos los tests positivos. Este concepto se denomina también: probabilidad “a posteriori” o probabilidad “post-test”.
Combinación en serie La prueba A se utiliza en primer lugar y a todos los positivos se les aplica la prueba B; (++) = +. Las pruebas en serie se realizan de manera secuencial. Están más indicadas cuando no urgen y/o una prueba es cara o peligrosa, todas las pruebas diagnósticas de la secuencia deben ser positivas para confirmar la enfermedad. Las pruebas en serie disminuyen la sensibilidad al aumentar la proporción de falsos negativos. Aumentan la especificidad e incrementan el valor predictivo positivo.
Combinación en paralelo Las pruebas A y B se aplican simultáneamente. Aportan mucha información a la vez (urgencias). Un resultado positivo en cualquiera de las pruebas se considera evidencia de la enfermedad. Todos los positivos en una de ambas se les considera positivos:
(+ –) = +; (+ +) = +; (– +) = + Las pruebas en paralelo aumentan la sensibilidad, aumentan el valor predictivo ne-
una misma sensibilidad y especificidad disminuyen los falsos negativos.
Procedimiento bayesiano Valores predictivos Valor predictivo-positivo de una prueba diagnóstica
Valor predictivo negativo Es la probabilidad de que un individuo con un resultado negativo no tenga la enfermedad. Libres de enfermedad con test negativo dentro de todos aquellos con test negativo. Convencionalmente a la sensibilidad y especificidad de una prueba diagnóstica se las considera inmodificables (esto en realidad no es así, pero su explicación sobrepasa las pretensiones de este texto) e independientes de la prevalencia. Sin embargo, los valores predictivos dependen estrechamente de la prevalencia de la enfermedad en la población en la que se aplica la prueba diagnóstica. Al aumentar la prevalencia crece el valor predictivo positivo para una misma sensibilidad y especificidad; esto se debe fundamentalmente a que disminuye el número de falsos positivos. De la misma manera, al disminuir la prevalencia disminuye el valor predictivo positivo y aumenta el valor predictivo negativo porque para
Lo que realmente interesa en la práctica clínica es conocer el valor predictivo de una prueba diagnóstica, es decir, cuál es la probabilidad de que esta persona con un test positivo tenga la enfermedad sospechada. El teorema de Bayes demuestra cómo la combinación de la sensibilidad, especificidad y prevalencia o probabilidad a priori o probabilidad “pre-test” de una determinada enfermedad nos permiten calcular el valor predictivo o probabilidad a posteriori o probabilidad “post-test” (tablas 2 y 3). La probabilidad a posteriori o valor predictivo es la probabilidad que utilizaremos para confirmar o descartar la enfermedad y actuar en consecuencia. Recordemos otra vez que si bien la sensibilidad y la especificidad de un test son elementos inherentes a la prueba diagnóstica y constantes, independientemente del medio en que se usen, no ocurre lo mismo con las prevalencias y probabilidades a posteriori que requieren un conocimiento de las circunstancias locales (prevalencia). En el ejemplo de la tabla 4A se observa la distribución de los resultados de una prueba diagnóstica para la detección de cáncer de mama. El punto de corte arbitrario se establece para una concentración de 150 unidades/litro del marcador tumoral en sangre. Hay 600 personas de 1.600 que presentan la enfermedad comprobada por el estándar diagnóstico, sea en este caso confirmación
TABLA 2 ¿Cuál es la probabilidad de que un individuo con un resultado positivo tenga la enfermedad? Cálculo del valor predictivo positivo mediante el teorema de Bayes Conocemos P(PD+uE) – P(PD–uE) P(E)
Necesitamos Probabilidad de un resultado positivo dado que se tiene la enfermedad Probabilidad de un resultado negativo dado que no se tiene la enfermedad Probabilidad a priori
Sensibilidad
P(EuPD+)
Especificidad
– P(E uPD–)
Prevalencia
P(PD+)
Probabilidad de tener la enfermedad dado Valor predictivo positivo que el resultado es positivo Probabilidad de no tener la enfermedad dado Valor predictivo negativo que el resultado es negativo Probabilidad de un resultado positivo
Sabemos que:
Queremos saber:
P(A|B) = P(A y B) / P(B) P(A y B) = P(AuB) / P(B) P(B y A) = P(A y B) = P(AuB) / P(A)
P(EuPD+) = P(E y PD+) / P(PD+) Paso 1: Numerador P(E y PD+) = P(PD+ y E) = P(PD+uE) . P(E) Paso 2: Denominador: Calcular P (PD+) con datos conocidos P(PD+) = P(PD+ y E) + P(PD+ y E) P(PD+) = P(PD+uE) . P(E) + P (PD+uE) . P(E) P(PD+uE) . P(E) P(EuPD+) = – – P(PD+uE) . P(E) + P(PD+uE ) . P(E ) Sensibilidad ´ Prevalencia = Sensib. ´ Preval. + [(1-Espec.) ´ (1-Prev.)]
4874 © Idepsa 98 ©
CARACTERIZACIÓN DE PRUEBAS DIAGNÓSTICAS TABLA 3 Ejemplo: Niños maltratados. ¿Cuál es la probabilidad de que la sospecha en un niño confirme maltrato? Los pediatras en una revisión escolar nos dicen: el 3% de los niños es maltratado. Un buen reconocimiento médico detecta al 95% de los niños maltratados. (5% falsos negativos). La probabilidad de que un niño no maltratado tenga una exploración negativa es del 90% (10% falsos positivos).
Examen + Examen –
+
Maltrato –
285 (2,85%)
970 (9,7%)
1.255 (12,55%)
15 (0,15%)
8,730 (87,3%)
8,745 (87,45%)
300
9.700
10.000
3%
97%
100%
P(PD+uE) . P(E) P(EuPD+) = – – P(PD+uE) . P(E) + P(PD+uE ) P(E ) 0,95 . 0,03 = = 0,23 (0,95 . 0,03) + (1 – 0,90) (0,97)
TABLA 4 Distribución de los resultados de una prueba diagnóstica frente a prevalencias diferentes de la enfermedad Enfermedad A PD+ PDTotales
+
-
Totales
570 150 720 30 850 880 600 1.000 1.600 (prevalencia de la enfermedad: 600/1.600 = 0,38 = 38%) Enfermedad
B PD+ PDTotales
+
-
Totales
270 195 465 30 1.105 1.135 300 1.300 1.600 (prevalencia de la enfermedad: 300/1.600 = 0,19 = 19%)
TABLA 5 Distribución de los cocientes de probabilidad positivos y negativos en distintos puntos de corte Niveles 500 400 300 200 100
Enfermedad presente (PD+)
Enfermedad ausente (PD–)
CP (+) Sens./1–Esp.
240/600 162/600 90/600 114/600 30/600
10/1.000 15/1.000 25/1.000 100/1.000 850/1.000
34 18 6 1,9 0,05
0,6 0,74 0,87 0,90 6,3
Distribución de los valores de los cocientes de probabilidad positivos y negativos según punto de corte del parámetro diagnóstico. En este ejemplo, la prueba diagnóstica son los niveles de concentración en sangre de un marcador biológico utilizado para la detección de cáncer. Obsérvese la evolución de los cocientes. En el CP (+) los niveles superiores tienden a confirmar la presencia de enfermedad. El CP (–) expresa que la presencia de una prueba diagnóstica negativa PD (–) tiende a descartar la enfermedad. En los niveles inferiores la situación es inversa.
TABLA 6 Características operativas de los resultados de una prueba diagnóstica (tabla 4A) Sensibilidad Especificidad Cociente de probabilidad positivo Cociente de probabilidad negativo Valor predictivo positivo Valor predictivo negativo Prevalencia. Probabilidad a priori Pre-test odds Post-test odds Probabilidad Post-test: valor predictivo positivo
a / (a+c) d / (b+d) sens/(1-espec) [a/(a+c)]/[b/(b+d)] (1-sens)/(espec) [c/(a+c)]/[d(b+d)] a/(a+b) d/(c+d) (a+c) / (a+b+c+d) prevalencia / (1-prevalencia) pre-test odds * Cociente de Prob. (+) post-test odds / (post-test odds + 1)
570/600 850/1.000 0,95/0,15 0,5/0,85 570/720 850/880 600/1.600
95% 85% 6,3 0,58 79% 96% 37,5% 0,6 0,6*6,3=3,78 3,78/1+3,78 = 0,79 79%
Dicho de otra manera: el cociente de probabilidad positivo es = sensibilidad/(1-especificidad); El cociente de probabilidad negativo es = (1 – sensibilidad)/especificidad. El cociente de probabilidad negativo es el complementario del valor predictivo negativo (VPN) (CP– = 1 – VPN), ya que expresa la probabilidad de presentar la enfermedad dado que el resultado es negativo. En los cocientes de probabilidad cuanto más se aleja el cociente de 1 hacia ° ó 0, mejor es el cociente y la información que aporta la prueba (tabla 5). Se utiliza para valorar la calidad de un test y además para calcular la probabilidad a
presencia de enfermedad y la probabilidad de un resultado en ausencia de la enfermedad. El cociente de probabilidad resume el mismo tipo de información que la sensibilidad y especificidad. Expresa cuántas veces más probable es que se encuentre un resultado en personas enfermas en comparación con no enfermas. El cociente de probabilidad positivo es: CP+ = [P (PD+uenfermos) / P (PD+uno enfermos)]; el cociente de probabilidad negativo es a su vez: CP– = [P(PD–uenfermos) / P (PD–uno enfermos)].
histopatológica. La prevalencia es del 38%, la sensibilidad del 95% y la especificidad del 85%. El valor predictivo positivo es del 79%. La tabla 4B muestra otra situación con diferente prevalencia: 19%; compruébese que la sensibilidad y especificidad son las mismas pero el valor predictivo positivo ha caído al 59%.
Especificidad
1
* * Sensibilidad proporción de verdaderos positivos
Otros indicadores de pruebas diagnósticas
* *
Cociente de probabilidad (Likelihood ratio) El cociente o razón de probabilidad o cociente de verosimilitud es la razón entre la probabilidad de un resultado en
CP (–) Esp./1–Sens.
* 0 Fig. 3. Curva de rendimiento diagnóstico.
1- Especificidad Proporción de falsos positivos
4875 © Idepsa 98 ©
EPIDEMIOLOGÍA CLÍNICA Y BIOESTADÍSTICA posteriori de la enfermedad. Para una misma prevalencia, una prueba diagnóstica con un cociente de probabilidad positivo alto tiende a aumentar la probabilidad “post-test” de un resultado. Para una misma prevalencia una prueba diagnóstica con un cociente de probabilidad negativo fuerte tiende a disminuir la probabilidad “post-test” de un resultado.
A)
1,0
Espec.
0,0
Sensib.
Procedimiento bayesiano El cociente de probabilidad resulta muy útil para calcular la probabilidad a posteriori de una enfermedad, o lo que es lo mismo, el valor predictivo de una prueba diagnóstica. Para ello tenemos que hacer algunas transformaciones previas. La prevalencia de la enfermedad (probabilidad a priori) la transformamos en Odds. Odds es otra forma de expresar una probabilidad, resulta de dividir una probabilidad P por su complementario (1-P), de tal forma que la Odds de prevalencia u odds preprueba sería: Odds preprueba = P/(1-P). Esta cantidad es multiplicada por el cociente de probabilidad para darnos la Odds post prueba. La odds postprueba la reconvertimos en probabilidades, encontrándonos así el valor predictivo positivo de una prueba diagnóstica (tablas 4 y 6).
B)
1,0
Espec.
0,0
Sensib.
C)
1,0
Espec.
0,0
Sensib.
Estrategias diagnósticas
Especificidad
Confirmar un diagnóstico
Sensibilidad
A
Valor de un resultado positivo. Un resultado positivo en una situación de alta prevalencia procedente de una prueba con alta especificidad tendrá un valor predictivo positivo muy elevado, con carácter confirmatorio. Elegiremos pruebas con cociente de probabilidad elevados, en general procedentes de pruebas en serie. El mismo razonamiento nos sirve para reducir falsos positivos cuando sus consecuencias clínicas son muy nocivas. Por ejemplo, la presencia de tres o más respuestas positivas en el cuestionario de CAGE para la detección del alcoholismo entre los pacientes de un servicio de Medicina Interna tiene una especificidad del 99%. Los que respondan en tres o cuatro respuestas afirmativamente pueden ver confirmado el diagnóstico de dependencia alcohólica.
B
C
Descartar un diagnóstico Valor de un resultado negativo. Un resultado negativo en situaciones de baja prevalencia y procedente de pruebas con alta sensibilidad debe hacernos tender a descartar un diagnóstico. Exigiremos un alto
4876 © Idepsa 98 ©
Fig. 4. Tres pruebas diagnósticas diferentes. Una prueba ideal (A) separa claramente aquellos que tienen la enfermedad de los que no la tienen, la curva ROC se aproxima o superpone al ángulo superior izquierdo. El área bajo la curva es igual a 1. La curva (C) muestra una prueba diagnóstica sin ningún poder de discriminación. El área bajo la curva tiene un valor de 0,5. En la mayoría de las ocasioness una prueba diagnóstica dibuja una curva como la (B) en algún lugar entre (A) y (B), con un área bajo la curva entre 0,5 y 1. La mejor prueba diagnóstica es aquella que presenta el mayor área bajo la curva.
valor predictivo negativo. Buscaremos una prueba con un valor de cociente de probabilidad negativo muy inferior a 1 y pruebas en paralelo. Se trata de reducir falsos negativos cuando sus consecuencias clínicas son muy nocivas. Por ejemplo, la pérdida de la pulsación en las venas re-
CARACTERIZACIÓN DE PRUEBAS DIAGNÓSTICAS tianas tiene una sensibilidad del 100% en el diagnóstico de hipertensión intracraneal. Por tanto, la presencia de pulsación tendería a descartar una elevación importante de la presión intracraneal. Si las consecuencias de perder un caso son graves habrá que reducir la proporción de falsos negativos, elevar la sensibilidad, elevar el valor predictivo negativo. Si las consecuencias de un diagnóstico falso positivo engendran riesgo y/o complicaciones: se debe reducir la proporción de falsos positivos, elevar la especificidad y aumentar el valor predictivo positivo. Exigiremos una alta sensibilidad (100%) si: enfermedades graves que no deben escaparse, y si la enfermedad es tratable y los falsos positivos no producen traumas psicológicos o económicos (feocromocitoma, fenilcetonuria, enfermedad de transmisión sexual). Exigiremos una alta especificidad (100%) cuando: la enfermedad es grave pero no curable y el conocimiento de la ausencia de la enfermedad es valioso tanto personal como socialmente y los falsos positivos generan traumas psicológicos o económicos (esclerosis múltiple, cánceres intratables). Exigiremos un valor predictivo positivo alto cuando: el tratamiento de un falso positivo tenga consecuencias indeseables (laparotomía en blanco, quimioterapia). Exigiremos un valor predictivo negativo alto cuando el descuido de los falsos negativos tenga consecuencias indeseables (enfermedades contagiosas).
Calidad de los estudios sobre pruebas diagnósticas Recordemos que la mejor manera de evitar sesgos o inexactitudes es exigir una gran calidad en el patrón de referencia o
estándar; que los procedimientos de verificación del resultado de la prueba diagnóstica y del patrón de referencia sean independientes; que dichas comparaciones sean ciegas. Exigiremos precisión (fiabilidad) es decir, disminución del error aleatorio, generalmente aumentando el tamaño de la muestra (exigir siempre intervalos de confianza en los parámetros de una prueba diagnóstica). Para caracterizar una prueba diagnóstica elegiremos una muestra que abarque el espectro más completo de enfermedad y haremos una elección adecuada y suficiente de la población de estudio (aplicabilidad). Es necesario una clarísima y estable definición de lo que se considere “normal”.
Los distintos puntos de corte de la sensibilidad y de la especificidad trazan un polígono cuya área bajo la curva nos da una idea de la calidad de la información de dicha prueba diagnóstica. Cuanto más grande sea esa área, es decir, cuanto más se acerque el gráfico de la curva hacia el vértice superior izquierdo de la gráfica, mejor será esa prueba. En ese vértice, la sensibilidad y la especificidad son del 100%. Para comparar dos pruebas diagnósticas, se comparan las áreas bajo la curva. La curva con mayor área es la mejor (valorar intervalo de confianza de la diferencia y significación estadística) (fig. 4).
Curvas de rendimiento diagnóstico o curvas ROC Las pruebas diagnósticas no tienen sólo un valor de sensibilidad y especificidad sino varios. Se trata de observar la distribución de la sensibilidad y la especificidad de una prueba diagnóstica en relación con diferentes puntos de corte. Las curvas ROC representan un índice de la exactitud con que una prueba diagnóstica discrimina los estados de salud a lo largo del espectro de trabajo de una prueba diagnóstica. Sólo el espectro entero de pares sensibilidad/especificidad aporta una imagen de la exactitud de una prueba. Las curvas ROC se construyen para cada punto de corte deseado situando la proporción de verdaderos positivos en el eje de la Y y la proporción de falsos positivos en el eje de las X (fig. 3). En unas ocasiones nos interesa más trabajar sobre la sensibilidad y en otras sobre la especificidad.
BIBLIOGRAFÍA RECOMENDADA Fletcher RH, Fletcher SW. Epidemiología clínica. Ed española. Barcelona: Ediciones Consulta, 1989. Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology 1982; 143: 29-36. Queraltó JM. Pruebas diagnósticas cuantitativas. Curvas de rendimiento diagnóstico. Medicine 1990; 6(9): 7077. Pozo Rodríguez F. Utilización clínica de pruebas diagnósticas. En: Tratado de Epidemiología Clínica. Universidad de Alicante 1996. Sackett DL, Haynes RB, Tugwell P. Clinical Epidemiology: A Basic Science for Clinical Medicine (2nd. ed.). Boston: Little, Brown Co, 1991. Sox HC, Blatt MA, Higgins MC, Marton KI. Medical Decision Making. Boston: Butterworth-Heinemann, 1980. Weinstein MC, Fineberg HV. Clinical Decision Analysis. Philadelphia: Saunders Company, 1980.
4877 © Idepsa 98 ©