Ir al contenido principal

Validez de una prueba diagnóstica: Parámetros utilizados en el estudio de un test

RESUMEN

Muy pocas pruebas diagnósticas, quizá ninguna, identifican con certeza si el paciente tiene o no la enfermedad en cuestión. La validez de una prueba diagnóstica depende de su capacidad para detectar correctamente la presencia o ausencia de la enfermedad que se estudia, lo que se expresa matemáticamente en varios índices: sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo, valor global de la prueba, razón de verosimilitud positiva  y razón de verosimilitud negativa.

INTRODUCCIÓN

Las decisiones clínicas se basan en la información obtenida de los enfermos mediante procedimientos diagnósticos, llámese historia clínica, examen físico, análisis de laboratorio, pruebas de imagen, etc, así mismo, la epidemiología estudia la frecuencia de la enfermedad, sin embargo, todas sus medidas son realmente de la frecuencia de diagnósticos de enfermedad, de ahí la importancia de conocer tanto en la práctica clínica como en estudios epidemiológicos la auténtica correspondencia entre los resultados de las pruebas empleadas en el diagnóstico y la realidad patológica.

Este post tiene como objetivos: ofrecer las definiciones y formas de cálculo de los distintos indicadores relacionados con las pruebas diagnósticas y brindar algunos ejemplos de diferentes tipos de investigaciones en las cuales se han utilizado este tipo de pruebas

FIABILIDAD DE LOS MÉTODOS DIAGNÓSTICO

Muy pocas pruebas diagnósticas, quizá ninguna, identifican con certeza si el paciente tiene o no la enfermedad. La validez de una prueba diagnóstica depende de su capacidad para detectar correctamente la presencia o ausencia de la enfermedad que se estudia, lo que se expresa matemáticamente en cuatro índices: sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo, valor global de la prueba, razón de verosimilitud positiva  y razón de verosimilitud negativa.

Estos índices se obtienen a partir del análisis de una serie de pacientes a los que se les realiza una prueba diagnóstica (prueba en estudio), comparándose sus resultados con los de una prueba de superior rendimiento diagnóstico (prueba de referencia, estándar o patrón oro). Los resultados obtenidos se expresan en una tabla clásica de contingencia de 2 x 2— en la cual aparecen en las columnas la presencia o ausencia de enfermedad y en las filas el resultado de la prueba diagnóstica evaluada (positiva o negativa). Tabla I

Tabla 1.- Tabla de contingencia 2x2
Sensibilidad (S).

Se define como la probabilidad de que un individuo enfermo tenga un test +: a/(a + c). Donde a = número de verdaderos positivos y c = número de falsos negativos.  La sensibilidad indica la proporción del total de enfermos que el test es capaz de detectar. De esta manera, la sensibilidad nos indica la capacidad de una prueba diagnóstica para identificar una enfermedad; por lo que se le llama también tasa o proporción de verdaderos positivos.

Especificidad (E).

Es la proporción de sanos que tienen una prueba negativa: d/(b + d). Es oportuno recordar que d = número de verdaderos negativos y b = número de falsos positivos. Es decir, la especificidad valora la utilidad de una prueba con el fin de identificar a los no enfermos (tasa o proporción de verdaderos negativos) o dicho de otra forma la especificidad indica la proporción de individuos sanos confirmados como tales por el resultado negativo del test

Para que un indicador sea útil debe presentar una alta sensibilidad y especificidad.

A partir de estos dos conceptos podemos hablar de una proporción de falsos negativos: probabilidad de que una persona enferma obtenga un resultado negativo en la prueba (enfermos que han tenido un resultado negativo de entre el total de enfermos) y de forma similar encontraremos una proporción de falsos positivos: probabilidad de que un individuo sano tenga un resultado positivo (sanos con prueba positiva de entre todos los sujetos que no presentan
la enfermedad).

Valor predictivo positivo (VPP)

Es la probabilidad de que un individuo con resultado positivo en la prueba, tenga la enfermedad: a/(a + b). Es decir, se trata de los enfermos con prueba positiva de entre todos los tests positivos. Este concepto se denomina también probabilidad «a posteriori» o probabilidad «post-test».

Valor predictivo negativo (VPN)

Es la probabilidad de que un individuo con resultado negativo en la prueba no tenga la enfermedad: d/(c + d). Se trata de los sujetos libres de enfermedad y con test negativo dentro de todos aquéllos con prueba negativa.

Valor global de la prueba o eficiencia de la prueba

Indica la proporción de resultados válidos entre el conjunto de resultados. Es la probabilidad de que un individuo sea clasificado correctamente por la prueba: (a + d)/(a + b + c + d). Así, en el numerador aparecen los enfermos con resultado positivo (a = verdaderos positivos) y los sanos con test negativo (d = verdaderos negativos); mientras que en el denominador se encuentran todos los sujetos.

Razón de verosimilitud positiva (RVP)

Es el cociente entre la probabilidad de una prueba positiva en presencia de la enfermedad (sensibilidad), y la probabilidad de una prueba positiva en ausencia de la enfermedad (1-especificidad): (a/a + c)/(b/b + d). Entonces, esta razón no es más que sensibilidad/(1-especificidad).

Razón de verosimilitud negativa (RVN)

Es el cociente entre la probabilidad de una prueba negativa en presencia de la enfermedad (1-sensibilidad), y la probabilidad de una prueba negativa en ausencia de la enfermedad (especificidad): (c/a + c)/(d/b + d). Por lo que esta razón sería: (1-sensibilidad)/especificidad.

Estos cocientes resumen el mismo tipo de información que la sensibilidad y la especificidad expresando, además, cuántas veces es más probable que se encuentre un resultado en personas enfermas en comparación con las sanas.

En la medida en que los valores de las razones de verosimilitud se alejen de 1 hacia ∞ (en el caso de la positiva), o hacia 0 (en la negativa); mejor será el cociente y la información que aporte a la prueba.

Para una misma prevalencia, una prueba diagnóstica con una razón de verosimilitud positiva alta tiende a aumentar la probabilidad «post test» de un resultado. En sentido contrario: para una misma prevalencia, una prueba diagnóstica con un valor de la razón de verosimilitud negativa alto, tiende a disminuir la probabilidad «post test» de un resultado.

Dicho de otra manera, estas dos medidas indican la razón entre la probabilidad de un resultado en presencia de enfermedad y la probabilidad de un resultado
en ausencia de la enfermedad.

Relación entre prevalencia y los índices de fiabilidad de los métodos diagnósticos

Los valores predictivos de un test son variables, dependen de la prevalencia de la enfermedad en la población. La sensibilidad y la especificidad son características propias del test y no se modifican con cambios en la prevalencia, sin embargo no ocurre lo mismo con el VPP y VPN:

  • Si la prevalencia de la enfermedad aumenta, aumenta el valor predictivo positivo, mientras que disminuye el valor predictivo negativo
  • Si la prevalencia de la enfermedad disminuye, aumenta el valor predictivo negativo y disminuye el valor predictivo.

Curvas ROC (“Receiver-Operating Characteristics”)

El resultado de un test puede ser continuo (p. ej. niveles de glucemia en mg/dl) y entonces hay que decidir cuál se considerará como resultado positivo para establecer el diagnóstico de Diabetes Mellitus), hay que elegir un punto de corte. El punto de corte escogido determinará la sensibilidad y especificidad de la prueba (si cogemos 70 mg/dl, la prueba será muy sensible y poco específica; si cogemos 140 mg/dl, será poco sensible y muy específica)

Para determinar el punto de corte se pueden utilizar las curvas de rendimiento diagnóstico (ROC).  La curva ROC es un gráfico en el que se observan todos los  pares sensibilidad/especificidad resultantes de la variación continua de los puntos de corte en todo el rango de resultados observados. En el eje y de coordenadas se sitúa la sensibilidad o fracción de verdaderos positivos, definida como se expuso anteriormente y calculada en el grupo de enfermos (fig. 1). En el eje x se sitúa la fracción de falsos positivos o 1-especificidad, definida como FP/VN + FP y calculada en el subgrupo no afectado. Algunos autores sitúan en el eje x la especificidad, pero es lo menos frecuente.


Cada punto de la curva representa un par S/1-E correspondiente a un nivel de decisión determinado. Una prueba con discriminación perfecta, sin solapamiento de resultados en las dos poblaciones, tiene una curva ROC que pasa por la esquina superior izquierda, donde S y E toman valores máximos (S y E = 1). Una prueba sin discriminación, con igual distribución de resultados en los dos subgrupos, da lugar a una línea diagonal de 45º, desde la esquina inferior izquierda hasta la superior derecha. La mayoría de las curvas ROC caen entre estos dos extremos. Si cae por debajo de la diagonal de 45º se corrige cambiando el criterio de positividad de “mayor que” a “menor que” o viceversa.

Cualitativamente, cuanto más próxima es una curva ROC a la esquina superior izquierda, más alta es la exactitud global de la prueba. De la misma forma, si se dibujan en un mismo gráfico las curvas obtenidas con distintas pruebas diagnósticas, aquella que esté situada más hacia arriba y hacia la izquierda tiene mayor exactitud: por simple observación se obtiene una comparación cualitativa.

Las curvas ROC son índices de la exactitud diagnostica y proporcionan un criterio unificador en el proceso de evaluación de una prueba, debido a sus diversas aplicaciones.

El uso de las curvas ROC en la evaluación de pruebas diagnosticas presenta las siguientes ventajas:

  • Son una representación fácilmente comprensible de la capacidad de discriminación de la prueba en todo el rango de puntos de corte.
  • Son simples, gráficas y fáciles de interpretar visualmente.
  • No requieren un nivel de decisión particular porque está incluido todo el espectro de puntos de corte.
  • Son independientes de la prevalencia, ya que la sensibilidad y la especificidad se obtienen en distintos subgrupos. Por tanto, no es necesario tener cuidado para obtener muestras con prevalencia representativa de la población. De hecho, es preferible generalmente tener igual número de individuos en ambos subgrupos.
  • Proporcionan una comparación visual directa entre pruebas en una escala común, mientras que otro tipo de gráficos, como los diagramas de puntos o los histogramas de frecuencias, requieren diferentes gráficos cuando difieren las escalas.
  • La especificidad y la sensibilidad son accesibles en el gráfico, en contraste con los diagramas de puntos y los histogramas.

VALIDEZ ACEPTABLE DE UN MÉTODO DIAGNÓSTICO

No existe un parámetro guía útil para evaluar la validez aceptable de un método diagnóstico en todas las situaciones. La aceptabilidad de la validez de un test depende de la patología estudiada y de las condiciones reales en el medio y en la colectividad.

Si lo que interesa es detectar el mayor número posible de enfermos, se debe usar un test con alta sensibilidad. Así se escaparán pocos, aunque al precio de bastantes “falsos positivos”. Elegiremos un test sensible cuando:

  • La enfermedad sea grave y no pueda pasar desapercibida.
  • La enfermedad sea tratable.
  • Los resultados falsamente positivos no supongan un traumatismo psicológico en los individuos examinados.

Si lo que quieres es “asegurar” el diagnóstico, debes usar un test cuya especificidad sea máxima. Utilizaremos un test lo más específico posible cuando:

  • La enfermedad sea importante, pero difícil de curar o incurable.
  • Los resultados falsamente positivos puedan suponer un trauma psicológico para el individuo examinado.
  • El tratamiento de los falsos positivos pudiera tener graves consecuencias


BIBLIOGRAFÍA RECOMENDADA

Alvarez Caceres R Estadística aplicada en ciencias de la salud. Madrid. Díaz de Santos. 2007.
Alvarez Caceres R. El método científico en las ciencias de la salud. Madrid. Díaz de Santos. 1996.
Sackett DL, Haynes RB, Tugwell P. Epidemiología clínica. Una ciencia básica para la medicina clínica. Madrid: Díaz Santos S.A., 1989.




Comentarios

Post más populares

Eczema dishidrótico e hiperhidrosis

RESUMEN El eczema dishidrótico es una dermatitis crónica, relativamente frecuente que afecta a las manos y a los pies. Se caracteriza por la aparición de vesículas de 1 a 2 mm, recurrentes y crónicas, en palmas, plantas, y caras laterales de los dedos, acompañadas o incluso precedidas de prurito.  Su etiología es desconocida, sospechándose que interviene la propia sudoración sobre un fondo atópico. También se la denomina dermatitis eczematosa dishidrótica, eczema paráptico o pómpholix, soliendose reservar el términos pómpholix para el subgrupo de pacientes que presentan erupciones agudas de grandes bullas en manos y pies. La historia clínica y la exploración física suelen ser suficiente para establecer el diagnostico, caracterizándose por presentar las lesiones descritas y seguir un curso cíclico, alternando recurrencias con remisiones, que a menudo se resuelve sin tratamiento. Algunos pacientes deberán ser tratados para disminuir la duración de las lesiones y prevenir las

Pitiriasis Rosada de Gibert

La pitiriasis rosada de Gibert (PR) es una enfermedad inflamatoria de la piel de etiología desconocida, aunque se sospecha que pueda ser de etiología infecciosa, más frecuente en mujeres y que se presenta como una enfermedad aguda, autolimitada, caracterizada por la aparición de una erupción inflamatoria, inicialmente una sola lesión más grande, la placa heráldica, seguida por pequeñas lesiones ovales papuloescamosas. Epidemiologia Se estima que la incidencia de la pitiriasis rosada es de alrededor de 170 por 100.000, con una prevalencia del 0,6% en personas de 10 a 29 años.  Aunque se ha descritos en todas las edades, desde niños hasta ancianos, el 75% de los casos se presentan en pacientes de 10 a 35 años. Es un 50% más común en las mujeres que en los hombres. Las recurrencias son poco frecuentes, aproximadamente en el 2,8% de los casos, la mayoría de los casos pacientes inmunodeprimidos.  Se han descrito casos coincidentes en el mismo domicilio. Etiología La causa

Úlceras de la boca

RESUMEN Las úlceras de la cavidad oral son trastornos frecuentes producidos por una pérdida de solución de continuidad del epitelio de la mucosa oral, acompañado de una pérdida variable del tejido conectivo subyacente, que puede acompañarse de  edema y / o la proliferación de los tejidos circundantes lo que puede conferir a la úlcera un aspecto crateriforme. En la mayoría de los casos las úlceras orales son transitorias y se resuelven espontáneamente.  Sin embargo, algunas son motivo de consulta médica.  Su diagnóstico, en la mayoría de los casos, se basa en una correcta historia clínica y en el examen físico. Sin embargo, ante la sospecha de neoplasia,  pacientes inmunodeprimidos, (por ejemplo, infección por el VIH, pacientes en tratamiento con quimioterapia, malnutridos, etc.) y ante úlceras crónicas será  necesario realizar una evaluación más amplia. CLASIFICACIÓN En función de su duración, las úlceras se clasifican en agudas, se resuelven en menos de 2 semanas

Dermatitis seborreica

La dermatitis seborreica es una enfermedad inflamatoria frecuente de la piel, que causa eritema, escamas, costras y caspa, afectando al cuero cabelludo, pliegues nasolabiales y retroauriculares, entrecejo y  región interescapular y  preesternal del torax.  EPIDEMIOLOGÍA La dermatitis seborreica es un trastorno común, con una prevalencia de aproximadamente 1-2% en la población general, ligeramente más frecuente en hombres que en mujeres y mas frecuente en la raza negra. Existen tres picos de mayor prevalencia: en la infancia (los primeros tres meses de vida, siendo la manifestación mas frecuente la costra láctea) y en la edad adulta, tras la pubertad, y desde la cuarta a séptima década de la vida. ETIOLOGÍA La etiología de la dermatitis seborreica es desconocida. Vario factores se involucran en su etiología: factores genéticos, emocionales, atópicos, neurológicos, bacterianos, hormonales, alimentarios, medicamentosos, estrés y alcoholismo. Los cambios hormona

Poliglobulias: Aspectos prácticos para el médico de familia

INTRODUCCIÓN La policitemia o poliglobulia se define como un aumento en la masa eritrocitaria. Se caracteriza  por un incremento del número de hematíes y/o de la cantidad de hemoglobina por unidad de volumen de sangre. El parámetro hematológico mas apropiado para su valoración es el hematocrito, debiéndose sospechar poliglobulia cuando este se sitúa de forma mantenida dos desviaciones estándar por encima de la media normal: 52% en varones y al 48% en mujeres. En caso de utilizarse la hemoglobina se debe sospechar poliglobulia cuando la hemoglobina es mayor de 18,5 g/dl en varones y de 16,5 g/dl en mujeres.   CLASIFICACIÓN Y ETIOLOGÍA Es importante diferenciar si la poliglobulia es absoluta, con un aumento real de la masa eritrocitaria, o relativa, en la que hay un incremento de la concentración de hematíes por una pérdida del volumen plasmático, pero la masa eritrocitaria es normal. Poliglobulia relativa o ficticia  Es la poliglobulia que se produce por disminuc